天极大咖秀

登录 | 申请注册

不完美的发布会,不断进步的文心一言

海峰看科技 2023-03-17 阅读: 4,019 次

文/黄海峰的通信生活

千呼万唤始出来!

自从ChatGPT发布以来,AIGC(AI生成内容)受到了行业内外的关注,人们在惊叹AI能力迎来飞跃式升级之余,抛出疑问:我们什么时候能拥有优秀的“国产ChatGPT”?

在此背景下,百度率先出手。3月16日,百度举办“百度文心一言新闻发布会”,正式发布旗下预训练生成式大语言模型产品——文心一言。

文心一言有何能力,能否对标ChatGPT?百度为何选择在这个时间节点发布?《海峰看科技》为您解读。

五大能力亮相

发布会上,百度创始人、董事长兼首席执行官李彦宏表示,在全球的大厂当中,百度是第一个发布类ChatGPT产品的公司,并结合演示,介绍了文心一言的五大能力:文学创作、商业文案创作、数理推算、中文理解、多模态生成。

在文学创作方面,文心一言不仅回答了如“《三体》的作者是谁?”、“电视剧《三体》的演员都有谁?”等具有绝对正确答案的事实性问题,做到答案没有谬误,同时还回答了“从哲学角度续写《三体》”等需要逻辑推理能力、创造性的问题,展现了文心一言对语义理解、逻辑推理、内容整合生成的能力。

据李彦宏介绍,文心一言采用了知识增强和检索增强,有5,500亿事实知识作为训练数据,因此可以保证有关事实性问题的答复比较准确。

在商业文案创作方面,发布会现场带来了文心一言给公司起名、编写slogan(公司宣传语)、撰写新闻稿的演示。中肯地讲,文心一言给出的答案达到了人类的平均水准。

在数理推算方面,文心一言解答了一道经典小学数学题——鸡兔同笼,面对一道无解的错误题目(第一问会算出鸡有-2只),文心一言并没有生成式AI胡说八道的通病,而是直接指出题目错误。

数理推算一直是生成式AI饱受诟病的一项能力,此前就有大量网友吐槽ChatGPT计算能力不如计算器,基础计算都会出错。对此,李彦宏也坦言,尽管当前文新一言不能做到此类问题100%正确,但在过去一个多月的内测中,文心一言在不断进步。

(生成式AI传统艺能:胡说八道)

在中文理解方面,发布会通过写藏头诗、解释成语等方式,展示了文心一言的“文学底蕴”。李彦宏认为,百度根植于中国市场,理应在中文理解和对中国文化了解上,超出世界上任何一个预训练大模型。

谈及文心一言的英语能力,李彦宏承认其对英文的理解和处理能力尚不及中文,是因为英文训练数据量不足,未来将逐步提高外语能力,以及跨语种翻译推理能力。

在多模态生成能力方面,文心一言展示了它在文字、图片、视频生成方面的能力。无独有偶,昨天凌晨(3月15日),ChatGPT迎来升级,OpenAI推出多模态预训练大模型GPT-4,支持文体+图片输入。与之相比,文心一言胜在多了一项视频生成功能,但可惜的是,由于受算力限制,视频功能还没有对用户开放。

不完美的发布会,不断进步的文心一言

尽管上述五大能力,全方位秀出了文心一言的“肌肉”,但美中不足的是,发布会现场并没有实时调用文心一言,而是播放提前录制好的展示小样。此举让发布会整体略显平淡,少了些惊艳。

更让人遗憾的是,当前文心一言并不能像ChatGPT一样,人人都可体验。只有拥有邀请测试码的首批用户,才能在文心一言官网体验该产品。另外,发布会后百度智能云面向企业客户开放了文心一言API接口调用服务。据媒体报道,发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。

发布会的不尽人意和文心一言“可远观不可亵玩”的架势,迅速得到市场反馈。百度集团港股股价在下午迎来直线下挫,跌幅一度达到9.81%。

有人说,百度着急发布文心一言,是被ChatGPT“赶鸭子上架”,逼急了。其实不然,正如李彦宏在发布会所讲:“无论是什么样的公司都不可能在几个月的时间里,靠突击做出来大模型,文心一言是靠百度十几年超大规模研发投入慢慢的积累出来的。”

根据百度2022年财报数据显示,百度2022年营收1236.75亿元,净利润206.8亿元,其中研发投入达214.16亿元,占百度核心收入比例达22.4%。

十年磨一剑,文心一言的诞生是基于百度在人工智能领域多年的深耕。百度认为,进入AI时代,IT领域的技术栈由原先的“芯片-操作系统-应用”三层,升级为“芯片-框架-模型-应用”四层,百度则在全栈均有布局。

芯片层有百度自研的昆仑芯AI芯片,其2代AI芯片的通用计算核心算力提升了2-3倍,昆仑芯科技战略负责人宋春晓曾表示,昆仑芯2代已在百度文心大模型的应用中广泛落地。

框架层有百度飞桨平台,据悉,百度飞桨平台在2022年底已凝聚535万开发者,基于飞桨创建了67万个模型,服务20万家企事业单位,依托飞将平台培养了300多万AI人才。

模型层有我们熟知的文心一言。早在2019 年,百度就推出了文心大模型ERNIE 1.0,发展至今,ERNIE 3.0时代下,百度每天接受10亿次检索请求,使能文心一言不断提升、进化。百度首席技术官王海峰介绍,基于文心一言基础模型,百度与行业伙伴发合作,发布多款行业大模型,如与国家电网合作,推出能源行业模型“国网百度文心”;与浦发银行合作,推出金融领域模型“浦发百度文心”。

应用层则是将AI技术与场景融合,赋能千行百业。截至目前,已有650家企业宣布加入文心一言生态圈。未来,百度还将把搜索、智能云、Apollo自动驾驶、小度智能设备等多项主流业务与“文心一言”整合。

上述四层架构之间可实现端到端的相互协同,不断优化,降低开发成本,构筑更高效的大模型,这是百度独有的优势。

可以确定的是,随着生成式大模型的问世与成熟,将为企业带来生产方式的变革。李彦宏预测,生成式大模型将带来三大产业机会:机会一,云计算商业模式将从IaaS变转为MaaS(模型即服务);机会二,行业结合大模型形成行业模型精调,创造全新商业机会;机会三,基于大模型的应用开发商,或将成为互联网时代的微信、淘宝、抖音,打造出现象级、杀手级产品。

总结:让文心一言飞一会儿

文心一言的发布备受关注,坦白讲,有很大程度是因为我们期望它能够和GPT一较高下。或许是产品尚未成熟,亦或许是受困于商业化程度,要考虑成本,文心一言的发布没有达到笔者预期。

其实李彦宏在发布会也很坦诚地讲,文心一言的能力,不能称之为完美。但另一方面,笔者看到了百度在AI领域大展宏图的决心。无论是大模型训练的积极投入,还是在四层IT技术栈的坚持创新,以及夯实AI基础设施,构建百度阳泉智算中心。百度在AI的路上一直前行。

让人感到振奋的是,行业积极呼应国产生成式大模型建设,多家企业与百度展开合作,或是加入文心一言生态圈。这说明企业们认识到大模型及AI是不容错过的机会,全新的生产力工具将带来改变;也意识到只有产业合力,五指紧握,才能挥出最强一拳。

文心一言到底有几把刷子?目前还无法给出肯定的答案,还需等待文心一言全面开放,大家亲自体验过后才可知晓。让文心一言飞一会儿,人工智能彻底改变千行百业的未来,或许不远了。

海峰看科技
独立科技评论员,《海峰看科技》账号创始人,多次接受央视、环球时报、科技日报等采访。 ICT行业杂志前副主编,从业十多年,聚焦5G、手机、IoT、光、云、AI、互联网、智能汽车、机器人等。 每年与超100位科技行业企业CXO/VP/总监面对面交流。 多个年度《中国信息通信行业发展报告》特约撰稿人。 毕业于北京邮电大学,曾获十大通信行业自媒体称号。

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)