天极大咖秀

登录 | 申请注册

科大讯飞星火认知大模型是真能打

何玺 2023-05-09 阅读: 8,980 次

5月6日,科大讯飞正式发布星火认知大模型。

先进的技术,出色的表现,直击产业痛点的商业应用,让人们再次认识了科大讯飞的强大。当然,星火认知大模型也是真能打。

01

火爆的大模型

2022年11月,人工智能公司OpenAI推出的生成式机器人ChatGPT发布后短时间便火遍全球,成为了科技圈最耀眼的“星”。

ChatGPT的问世,第一次让人工智能走向每一个数字终端用户,其高度类人的语言交互模式、从海量数据库中整理资料的能力、以及在技术文档写作、编程、数学计算、甚至超强的文学“才能”,给整个科技产业界带来了极大的震撼。ChatGPT上线后,仅用时2个月就获得了高达1亿以上的活跃用户,并迅速向全行业渗透,在多个领域形成了对人力的“替代”作用。

火爆的ChatGPT不仅让国内科技届感受到了AI的强大,也让国内产业界开始忧虑,中国自己的通用人工智能大模型何时能出现?又能否具备足以抗衡ChatGPT的实力?

事实证明,国内科技产业界并没有让人失望。在ChatGPT全球火热的同时,国内多个厂商也竞相发布了自家的大模型产品,在激烈的竞争中掀起了属于中国的大模型热潮。最先加入“战团”的是百度、阿里巴巴、腾讯、华为等平台型企业。其中,搜索引擎和AI巨头百度于3月15日发布了大模型文心一言,并演示了文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等五大能力。随即,另一家巨头科技平台阿里巴巴,也于4月11日的阿里云峰会上,宣布推出类GPT产品“通义千问”。该产品在撰写短文、职场助理、电影脚本和写邮件等标杆性应用中,都有令人印象深刻的表现。同属BAT的腾讯,则于4月14日推出了新一代HCC(High-Performance Computing Cluster)高性能计算集群,孩宣布将依托其高性能算力,在年中实现将AI大模型与微信等应用的深度融合,并进一步介入大模型训练、自动驾驶等AI应用新领域。华为则宣布其昇腾AI基础软硬件平台,已经孵化和适配30多个主流大模型,占据中国原生大模型的“半壁江山”。

此外还有多家科技企业,新创企业也宣布切入大模型赛道。网易有道表示正在推进“子曰”大模型的研发。学而思也表示正在进行自研数学大模型的研发,命名为MathGPT。该大模型将面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心。前搜狗 CEO王小川在社交媒体就ChatGPT 发声表示“中国需要自己的OpenAl”,并在随后的企业采访中表示自己的AI大模型创业项目正在“快速筹备中”。前京东集团高级副总裁、集团技术委员会主席周伯文创办的AI大模型公司衔远科技宣布已完成数亿元天使轮融资。创新工场董事长兼首席执行官李开复在社交媒体宣布,他正在筹组 Project Al2.0一个致力打造Al2.0全新平台和Al-first生产力应用的全球化公司。阿里巴巴技术副总裁贾扬清宣布离开阿里,随后有媒体爆料称其投身 AI 大模型 基础设施方向,并已锁定首轮融资。

总的来看,大模型已经成为当前国内科技领域最为火热的新赛道。

02

备受期待的讯飞星火认知大模型

在上面的大背景下,作为国内公认的AI领跑企业科大讯飞,其在大模型领域的进展情况,自然备受行业关注。

面对市场的期待,科大讯飞也给予了积极的回应。在4月20日发布2022年报及2023年一季报时,科大讯飞就宣布即将推出自身的类GPT项目—星火认知大模型。尽管官方将该大模型正式推出的时间定在了5月份,但当时多家重量级企业以及专业科技媒体,都发出了希望尽早获得星火认知大模型内测的呼声。各方面高度关注之下的科大讯飞大模型,可说是未发先火。从那时起,一直到5月6日正式发布之前,星火认知大模型一直在严苛条件下验证自身的能力。

据报道,内测期间,各方测试者就对星火大模型进行了各种“刁难”。例如在对话环节上,测试者们就其对人类自然语言的理解能力、以及维持多轮对话的能力进行了苛刻的考验。事实证明,星火确实能有效理解人类的问题本质,并且能够就一个问题进行连续的深化和交互式的解答。在“写作能力”的测试中,星火大模型应用户的要求,以相当高的质量完成了诸如“拟定采访提纲”、“编写采购计划”之类的任务;在“编写程序”一项上,星火应要求编写出了一个效率颇高的爬虫程序,更是让专业人士都感到满意;它甚至孩在“文学修养”方面的测试中,表现出了颇有章法的韵律使用能力。令人满意的测试结果,让行业对星火认知大模型更加充满期待。

值得注意的是,科大讯飞星火大模型是按照自己节奏推进的,并没有受外界的干扰。而这背后,则是科大讯飞多年来在AI深耕的底气。

多年来,科大讯飞已经在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术、算力支撑等方面积累了大量成果。仅2022年,就在人工智能关键核心技术领域累计摘取16项国际人工智能大赛的冠军,其中涉及13项常识阅读理解挑战赛OpenBookQA、QASC、ReClor等认知智能国际竞赛冠军。此外,作为人工智能“国家队”成员,科大讯飞还承建了认知智能全国重点实验室(首批20个标杆全国重点实验室之一)和语音及语言信息处理国家工程研究中心。

正是凭借多年来在AI领域的深耕,在核心领域的持续突破,科大讯飞的星火大模型才能在内测期间就有上好表现。除了在内测期间的优异表现,星火大模型备受用户期待的另一个原因在于,它是一个比ChatGPT更经济,应用方向更为明确的大模型。在向媒体介绍情况时,科大讯飞董事长更是充满信心地告诉大家,星火认知大模型的研发成本远低于外界想象,并不需要像Open AI那样花费100亿美元。同时,科大讯飞已经确立了大模型的下一步发展方向,就是要开始致力于“用各个规模适度的专业模型通过协调联动来形成效益的提升,在各个专业领域形成更可控的表现,这是科大讯飞一直在做的路径。”

03

真能打的星火认知大模型

在内测过程中,星火认知大模型已经让各参与者好评不断,这次在发布会上,星火大模型现场展示的七大核心能力,给与会的各界科技领域以及其他行业用户,更是留下了极为深刻的印象。星火大模型的七大核心能力包括:多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力等。在现场,科大讯飞研究院院长刘聪直接以语音输入的形式,向星火认知大模型发起了“挑战”。

而该大模型不但迅速对“为什么叫星火”给出了富有情感、逻辑清晰地回答,而且还现场展示了“编故事”的有趣能力。它模拟“孙悟空和奥特曼也偷偷潜入了会场,他们都争着想做讯飞星火认知大模型的代言人,还为此吵了一架”的场景,编写了一段生动的故事,它甚至还展示了每次都能编写出不同情节走向的拟人能力,让现场与会者兴趣陡增。此外,它还能写邮件、做方案、写新闻通稿等,它还能生成英文宣传,修改英语语法错误,展现作为AI助手的多才多艺。刘庆峰告诉大家,星火认知大模型生成长文本的能力,在国内明显领先,并且在中文方面超过了国外同类产品,足以与ChatGPT 3.5相提并论,并且还在持续进化中。

尤其引起与会各界注意的是,科大讯飞的星火认知大模型不但在能力上实现了国内领先、足以与国际先进产品相抗衡,而且它还是国内率先实现落地应用的大模型标杆。在发布会上,科大讯飞方面强调将围绕着星火认知大模型,以一平台 + 多赛道的“1+N”模式,将业务范围延展到包括开放平台、智慧教育、智慧医疗、智慧城市、运营商在内的多个领域。其中,“1”是指以通用认知智能大模型算法研发及高效训练底座平台,“N”则是针对于多个行业领域的专用大模型版本,其中,包含教育、医疗、汽车、人机交互、办公、翻译、工业等,均围绕着科大讯飞的核心技术展开布局。

对于这个新布局,科大讯飞方面是胸有成竹。例如在人机交互领域,其智能语音开放平台的AI服务,已经实现了日调用次数超过50亿,实现60个语种的语音识别、语音合成、机器翻译、图文识别等关键技术研发;在专业的翻译领域,科大讯飞不但能依托讯飞核心的语音、视觉、自然语言处理技术,提供语音识别、语音合成、图文识别、语义理解等多方位A.I.能力,而且还能为企业提供专属A.I.能力,针对特定领域定制专属模型,最大限度提升效果。

发布会上,科大讯飞方面向行业展示了大模型落地应用,并在引领行业变革的多个实例。其中,“大模型+AI学习机”的组合,让AI 像老师一样批改作文,像口语老师一样实景对话。展示了教育行业智能化升级的无限前景;而“大模型+智能办公本”,根据手写要点自动生成会议纪要,助力办公效能进一步提升,则展示了办公应用智能化升级后更广阔的可能性;“大模型+讯飞听见”,一段录音、一键成稿,一分钟输出流畅会议文案。不但能大幅度提升办公效率,还能在新闻采访领域具有AI写稿抢头条,记者采访后30秒生成新闻的强大实力;而在汽车行业,科大讯飞的“大模型+智能座舱”体系,则实现了车内跨业务、跨场景人车自由交流,让智能驾驶迈入新阶段。

当前,星火认知大模型的应用探索,已经为大模型在行业的落地应用提供了有效指引。正如刘庆峰强调的那样,随着星火认知大模型应用的推广普及,我们即将为AI应用创造出“星火燎原”般的产业新生态,未来无限可期。

何玺
10年+资深科技媒体评论人。

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)