3月15日,OpenAI推出GPT4,进一步更新的AI能力,引发大模型的海啸狂飙。
当大多数人谈大模型时,往往会从技术视角去预设未来的可能性,甚至引发文明是否将从碳基文明转向硅基文明的大讨论。
不过随着讨论的深入,就会发现大模型也是按照人类学习语言的模式进行发展的。不同角度、不同视野下,能否穿透大模型百家狂飙的海啸,找到技术风暴中的踏浪点,决定了企业能否抓住甚至引领开拓大模型的无限可能性。
5月6日,科大讯飞在安徽合肥发布星火认知大模型。科大讯飞董事长刘庆峰、研究院院长刘聪现场实测大模型七大核心能力,并发布教育、办公、汽车、数字员工四大行业应用成果。
在这场发布会上,从技术到落地,科大讯飞由内向外展示了中国企业探索大模型的自信力。
对于大模型的出现,人们常常喜欢用暴力美学来形容诞生于“大数据+大算力+强算法”的范式主义。
但是技术的暴力美学仅仅只是大模型智慧涌现的结果,所谓暴力美学的实现,核心是建立在确定的方向和长期的技术投入中。从这个角度来看,发布引领行业的AI大模型,一定程度上是科大讯飞技术发展的必然。
通常来说,人工智能大致可以分为:感知智能、认知智能、运动智能三个阶段,分别对应的能力是:听说能力、推演学习、智能执行。
不妨来看看科大讯飞如何走过这三个发展阶段。时间回到2011年,彼时科大讯飞提出让机器人像人一样能说会听,同时承建了语音及语言信息处理国家工程实验室。
当时看起来不大不小的一件事,为今天星火认知大模型打下感知智能的基础条件。
有了感知智能的基础,2014年科大讯飞又推出“讯飞超脑计划”,明确提出:让机器人像人一样能理解会思考,成为科大讯飞踏入人工智能第二阶段的开端。
作为认知智能阶段的技术雏形,讯飞超脑发布之初,就选择使用深度神经网络、大数据和涟漪效应三大技术路径。其中深度神经网络是当前各类大模型AI算法的基础,大数据和涟漪效应后来不断发展为数据标注、无监督学习等大模型AI的必备技术。
2022年,科大讯飞又推出“讯飞超脑2030计划”,提出让懂知识、善学习、能进化的通用人工智能技术成为每个人未来发展的重要机会。
按照规划,在2023年—2025年的项目中期,讯飞将在此前软硬一体机器人的形态基础上推出能够自适应行走的外骨骼机器人与家庭服务机器人。
这类产品在形态逐渐接近人形,能够模仿人类完成更多工作,实现更多的智能执行能力,为人工智能第三阶段的产品爆发积蓄实力。
技术路径的选择规划仅仅只是方向,想要出成果,还需要长期的资源投入。在基础硬件资源储备方面,得益于讯飞超脑的训练,在大模型浪潮来临前,科大讯飞就已经布局了长期算力储备。
同时位于合肥总部的科大讯飞数据中心,在工程技术方面能实现百亿参数大模型推理效率的近千倍加速。这也是使其大模型能够真正落地,并快速实现规模化应用的基础。
技术储备的扎实力,来自于科大讯飞真金白银投入。
数据显示,在去年,科大讯飞用于研发上的投入高达33.6亿元,同比提升14.28%,研发投入占营收的比例为17.83%。一年的投入只是冰山一角,得益于长期大手笔资源投入的积累,早在2021年科大讯飞就已经在全球126个国家拿下3234项独家专利。
科大讯飞还摘获了一系列与大模型技术相关的奖项,包括但不限于:世界顶级人工智能挑战赛Open Graph Benchmark(OGB)、常识推理挑战赛CommonsenseQA 2.0、国际语义评测大赛(The 16th International Workshop on Semantic Evaluation, SemEval 2022)、国际口语机器翻译评测比赛(IWSLT)……
技术积累只是AI底座,如何将这些技术能力全面发挥出来,在于系统主义的工程方法论。
正如科大讯飞董事长刘庆峰所说:“我们要向OpenAI致敬和学习,同时也要快速追赶并努力超越,而这需要一套科学系统的评测体系。”
作为人工智能“国家队”之一,科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。
得益于技术底座的实力和工程方法论的系统能力,据了解,在文本生成和数学能力上,星火认知大模型已经国内显著领先,且相比ChatGPT也具有一定优势;在语言理解和知识问答方面也达到接近ChatGPT水平,处于国内领先水平。
厚积薄发的技术能力,也让整场发布会底气十足。不仅AI演示现场实测互动,同时科大讯飞公布大模型年内三次升级时间点,10月底将整体赶超ChatGPT。后续还将联合开发者推动大模型应用落地,共建人工智能“星火”生态。
富有节奏感的进度表背后,正是科大讯飞进击人工智能新赛道的决心与恒心。
在这样一个巨变的时代,面对AI技术大爆炸的科技周期,科大讯飞正在用自己的技术积累,成长为推动中国大模型生长的重要引擎。
当大模型的科技浪潮来临,,虽然先进的技术往往是改造一切的起点,但这场变革不仅仅只是技术的,同时也是社会的、商业的和人文的,最终更强调的是以人为中心,多场景下的智慧涌现。
因此,在发布会上,围绕星火大模型,科大讯飞带来了更多的生态场景建设和开放赋能的落地能力。
在场景建设方面,生态的共建,往往来自于组织者的引领能力。
作为“星火”生态的主导者,一场围绕自身生态产品的大模型落地场景率先在发布会上亮相。首先在教育领域,“大模型+AI学习机”,让AI像老师一样批改作文,像口语老师一样实景对话。
相比于传统学习机只能针对字词标点纠错、识别句式修辞错误这些基础批改,讯飞AI学习机可以围绕写作要求分析全篇结构和文采,实现深度高阶批改。在口语对话方面,陪伴式对话练习,帮助孩子摆脱哑巴英语,提升口语表达能力。
在办公行业,“大模型+智能办公本”,针对口语稿阅读困难、纪要整理耗费精力、已有素材难成稿、长篇章难抓要点等痛点,搭载大模型技术的讯飞智能办公本可以轻松将一篇语音转写文稿规整成书面化内容,使用户的阅读效率提升50%。
“大模型+讯飞听见”,输入音频录音后,除了能够实现语音转文字外,讯飞听见还能通过AI分析文字内容,一键生成全文摘要、宣传稿件等多种文本。还可以针对原文件内容,进行AI对话提问溯源。
此外还有讯飞智能录音笔、讯飞智能麦克风等办公产品结合星火大模型的相关功能也在快速落地中,推动智慧办公迈入全新阶段。
结合已有的硬件生态落地大模型应用,只是围绕星火认知大模型“1+N”架构中的一部分。
在外部合作领域,科大讯飞还发布了大模型在汽车、数字员工等多个方向的行业应用成果。“大模型+智能座舱”,实现车内跨业务、跨场景人车自由交流;“大模型+数字员工”,帮助企业员工完成大量重复性工作。
除了上述领域外,未来讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业,满足更多专业领域的需求,向更广阔的产业领域延伸。
正如讯飞董事长刘庆峰所强调的:“今天要看一个大模型系统到底好不好,首先要看它是不是能解决刚需、是不是真的有用,而不是一个简单的单点测试。”
技术上的长期主义和产品上的以人为本,正在成为科大讯飞在大模型赛道上越跑越快的自信力。
未来,科大讯飞计划将这种自信力,通过能力开放、插件开放、行业共创,传递给更多的企业。
科大讯飞认为,人工智能的发展绝不是单个企业和单个科研机构的事情,而是需要大家合作共赢的。
首批来自36个行业的3000余家企业开发者将接入星火大模型,进一步推动科大讯飞联合各行业合作伙伴共建大模型“星火”生态,与生态伙伴一起,燎原新一轮产业变革。
接下来,科大讯飞还将进一步在智慧教育、智慧办公、智慧城市、智慧医疗等领域推动大模型应用场景落地,并且将一个个单点技术集合起来形成平台,持续让更多企业、用户受益。
显然能够引领大模型的企业,一定不能仅仅去崇拜现有的技术,而是要突破现有的技术,建立自己的AI生态。只有坚信自己的技术路线,关注用户的痛点,不断自我更新,才能见到效果。
正是长期坚定AI赛道,坚定布局、踏实前进、长期主义,科大讯飞才可以快速打造出技术实力领先的国产大模型,并迈出了“在中国率先实现智慧涌现”这一坚实的步伐。