有人说,AI大模型是少数巨头才能玩得转的游戏。
截至目前,认同此观点的人不在少数。自从ChatGPT去年迅速火遍全球之后,忽如一夜春风来,AI大模型遍地开。Google、Amazon、阿里、百度等巨头们纷纷加入AI大模型的“军备竞赛”,似乎预示着市场在向大公司集中。
但事实真是如此么?且不说国外Anthropic、Cohere等生成式AI独角兽公司在市场中表现极为活跃,国内也有不少AI公司从不同角度切入AI大模型的市场竞争中,市场呈现出百花齐放的景象。
近日,国内AI独角兽云知声交出了在AI大模型领域的第一份答卷--山海大模型。云知声对外全面展示了山海大模型语言生成、语言理解、知识问答、逻辑推理等十项能力,并且山海大模型在MedQA评测、临床执业医师资格考试等医疗领域测试成绩处于业界领先。
云知声用实际行动表明,AI大模型的市场竞争才刚刚开启,只有大公司才能玩得转的谬论可以休矣。正如云知声创始人、CEO黄伟所言:“云知声将持续升级山海大模型的能力,目标是年内通用能力比肩ChatGPT,并在医疗、物联、教育等垂直领域超越GPT4。”
纵观AI模型的发展历程,经历了从大练模型到练大模型的阶段。如今,AI大模型场景凭借通用、泛化和规模化复制等诸多优势,被业界视之为实现 AGI(通用人工智能,Artificial General Intelligence)的重要路径。
而人们之所以看好巨头们在AI大模型的前景,无非是巨头们具备雄厚的资金实力、庞大的研发队伍以及完善的基础设施等优势。
这些条件固然是研发AI大模型的关键因素,但并不是决定性因素。事实上,OpenAI的成功恰恰表明,AI大模型的研发本质上是多种算法的组合+正确的训练方法,考验的是基础设施+数据+算法的综合工程化能力,这种综合能力并非是巨头们的专属。
比如,AI大模型的训练极其考验算力,但并不意味着算力堆砌越多越好、越强越好。正所谓韩信点兵、多多益善,AI大模型需要源源不断的算力,但更加需要能够运筹帷幄的“韩信”。云知声创始人、CTO 梁家恩直言:“大力能够出奇迹,但蛮力出不了奇迹。”
据悉,云知声属于较早重视算力基础设施建设与投入的AI公司,从2016年开始不断布局算力等基础设施,构建起高效架构+全栈算法的超算集群Atlas,成为东南地区最大的超算集群之一。云知声山海大模型从去年底启动,今年2月底就研发出第一版,短短半年内正式对外发布,离不开超算集群Atlas的鼎力相助。
又如高质量的数据集和科学的训练方法直接影响着大模型的效果,这考验着AI公司的数据积累、数据处理以及训练数据的工程化能力。OpenAI 《Scaling Laws for Neural Language Models》伸缩法则就强调了增加高质量数据集对于模型训练效果的重要性。OpenAI CEO Sam Altman也透露,OpenAI的数据集远比外界想象的大,并且大量工作围绕在数据工程层面。
同样,成立十年的云知声在数据积累和数据工程化方面有着丰富的积累,其UniScale训练推理一体化框架、UniDataOps数据优化并行处理框架在各种场景中久经考验。梁家恩就透露,除了开源英文语料类别和中文语料类别之外,云知声在训练山海大模型还增加了多年积累的中文和医疗数据。
所以,云知声能够在半年内完成算力扩容、算法验证、并行加速、数据优选等工作,实现GPT为核心的架构升级和成功发布山海大模型。黄伟直言,AI大模型是AI领域的一场“工程革命”,将过去各种AI技术进行整合和综合应用,逐步实现大模型从量变到质变。
众所周知,过去几个月里,国内AI大模型层出不穷,但表现也是参差不齐,甚至还闹过“宫保鸡丁”梗、“套娃ChatGPT”等各种话题。
不过,AI大模型出现回答错误实属正常,因为涉及到数据集质量、训练时长等各种因素。因此,大家都很好奇,云知声在短时间内训练出的山海大模型到底表现如何?
根据云知声介绍,山海大模型具备十大能力:即语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规能力七项通用能力及插件扩展、领域增强、企业定制三项行业落地能力。
大数据在线也对山海大模型进行了一番测试,包括逻辑推理、数学运算、代码能力等,整体表现优秀,遇到逻辑问题时候能够很清晰和准确的给出答案。
开放式知识问答,山海大模型在连续追问的情况下,能够给出准确的答案,表现令人惊艳。
数学运算,山海大模型能够很好理解题目的含义,并且转换为计算公式进行计算和得出正确结果。
逻辑推理,针对各种逻辑问题,山海大模型能够有效判断问题的关键,并给出合理解释。
代码能力,山海大模型有较强的代码生成能力。
人类价值观对齐
值得关注的是,山海大模型还准备了计算器、天气查询、Web搜索、发现周边等丰富的插件功能,用户可以通过丰富的插件功能来获得更加准确的信息。
整体来看,山海大模型的通用能力让人较为满意。比如,在开放式知识问答方面,山海大模型能够准确理解问答含义和给出正确答案,并且在连续追问的情况下,能够连贯性的回答;又如,在逻辑推理方面,山海大模型针对一般性推理问题回答都能游刃有余,很少掉入“陷进”之中;再如,针对“不健康网站”的陷进问题,山海大模型的回答能够有效避坑,并且连续追问下去可以给出相应的解决方案,符合人类价值观的对齐。
无疑,山海大模型的出色表现,也给了云知声极大的信心。“山海大模型目标是年内通用能力比肩ChatGPT。”黄伟如是说。
当前,AI大模型已经在互联网场景中小试牛刀,从ChatGPT成为史上最快达到亿级用户的App,到互联网企业利用互联网技术与搜索引擎结合,互联网公司普遍都在利用AI大模型重塑自己的产品。
除了To C之外,AI大模型在To B领域的拓展亦开启了人工智能的商业化价值之路。IDC统计,过去两年中国人工智能在各行业的渗透率均不断提升。其中,电信、金融和制造业的渗透率提升幅度靠前,超过4%;教育、能源和医疗等行业绝对渗透率较低,未来提升空间巨大。预计到2026年,人工智能行业渗透率有望达到20%。
众所周知,从数字经济、数字中国建设的大趋势来看,产业数字化、行业智能化升级是一块重要拼图,这其中AI大模型在行业中的应用又是最重要抓手。黄伟直言:AI大模型为人工智能带来了新的能力,可以打造更多产品来满足行业用户对于智能化的需求。
事实上,AGI在行业场景的应用前景广阔,却也绝非易事。在笔者看来,云知声的U+X战略(U:AI技术和产品能力, X:行业应用场景)为AI大模型、AGI在行业的深耕开辟出一条价值之路。
笔者认为,云知声U+X战略的好处就是能够将数据、应用和模型连接起来,形成类似飞轮。首先在行业中寻找到合适的场景,然后通过用户行为反馈积累特定的有效数据,再反哺AI大模型;AI大模型的不断迭代与优化,则有利于AGI在行业中的进一步应用和收集更多有效数据,从而形成飞轮效应,越到后面大模型效果会更好。
以医疗领域为例,属于复杂度和知识密度极高的行业,云知声U+X战略在医疗行业的深耕,使得其山海大模型在医疗领域着实惊艳了一把。在发布会现场,云知声演示了在山海大模型的辅助下,基于病历辅助医生生成完整的病历方案、辅助医疗相关理赔等多个场景,大幅提升了业务效率和智能化程度。此外,在MedQA 测评中,山海大模型以 81.56%位居第一,超过GPT4、Med-PalM等模型;在临床执业医师资格考试中,山海大模型得分高达511 分,远超平均分和及格线。
据悉,山海大模型接下来将在国内头部三甲医院陆续落地。可以想象,随着山海大模型在更多医疗场景中的应用,通过学习更多医疗数据,未来有望进一步提升AGI在医疗场景的应用范围和深度。除了医疗领域之外,云知声还演示了山海大模型在销售、知识管理、教育、智慧物联等场景的应用。
“从长远来看,AI大模型将成为AI 2.0时代的‘发电厂’,大数据是燃料、算力是锅炉、算法则是发电机,未来使用大模型类似用电那样便捷与方便。”黄伟补充道。
当前,AI大模型属于一拥而上的情形,既有互联网、云计算等巨头们,也有新成立的AI企业,更有像云知声这样深耕AI领域多年的独角兽。可以预见,未来AI大模型市场的竞争会愈发积累。
那么,面对未来激烈的市场竞争,云知声的前景如何?在笔者看来,从人工智能市场前景、云知声的战略以及核心能力来判断,云知声有望在市场中不断突破,实现自我超越。
首先,在数字经济和数字中国建设的大背景下,为云知声提供了极为广阔的市场舞台。IDC预计,中国人工智能市场规模在2023年将超过147亿美元,到2026年将超过263亿美元,市场增量将主要源于基于大模型的应用替换过去几年建设的AI应用、生成式AI带来的增量市场和全新的AI赋能的企业级应用。
其次,云知声过去十年坚持的U+X战略被证明是一条艰难但正确的AI商业化之路。随着AI大模型时代的到来,无疑让云知声U+X战略如虎添翼,有利于加速了AGI在行业的商业化,以及有望打开更加广阔的行业市场。
第三,山海大模型的惊艳两项,证明云知声深厚的数据积累和工程化能力是业界一流,这也是云知声十年实践积累的核心优势。随着OpenAI走出一条AI大模型之路,云知声凭借数据积累和工程化能力等核心优势,也有望跟上甚至超越。
综合观察,AI大模型正在步入战国时代,市场竞争格局远未确定。而AI独角兽云知声在短短半年内打造出山海大模型,充分证明中国的AI企业一样能打。面向未来,AI大模型和AGI在行业应用之路曲折却光明,而云知声有望凭借自身优势,让山海大模型逐云破浪、扬帆远航。