3月16日下午,在百度文心一言新闻发布会上,百度正式公开邀请测试备受瞩目的文心一言,百度创始人、董事长、CEO李彦宏首次对外解密文心一言,并向普通用户与企业用户开放了测试通道。互联网公司很少召开专门的发布会来推出新品,特别是软件产品。印象中这是李彦宏为数不多地亲自给新品站台,百度对文心一言的重视程度以及文心一言对百度的重要性,可见一斑。
从现场demo来看,文心一言在文学创作、商业文案创作、数理推算等核心场景上表现突出,ChatGPT能做的事TA都可以做。李彦宏让TA回答关于《三体》原著、改编剧的相关问题,提供续写《三体》的角度建议,TA都给出了让人满意的回答。李彦宏让TA给一家大模型服务商创业公司命名、提供Slogan以及撰写新闻稿,TA也给出了至少已在实习生水平的答案。
在ChatGPT曾“翻车”的鸡兔同笼问题上,文心一言应对自如,这体现出其强大的逻辑推理和数理推算能力:
相较于ChatGPT而言,文心一言在中文理解和多模态生成上有显著优势,比如它可以生成四川话版本的语音内容,也可以给人类画图甚至提供海报制作建议:
有人质疑百度这次活动演示的demo是预先录制的视频而不是实时交互,据百度解释这是考虑到实时交互较为耗时。随着文心一言开放测试,很多用户以及媒体拿到了内测资格,在大量的case中,也能看到文心一言突出的表现,在很多维度它不只是不比ChatGPT差,跟OpenAI最新发布的GPT-4比也丝毫不逊色。
比如它可以给尚未发布的新品写新闻稿,雷科技每年会参加许多手机厂商的发布会,对比了一下文心一言给OPPO即将发布的旗舰机写的新闻稿,虽然有一些细节问题,但整体来说还真有那味儿。
(图片源自“好看商业”)
再比如,它在回答数理推理类问题时表现整体都比ChatGPT更好:
(图片源自“好看商业”)
它甚至可以推断出美联储是否会加息、欧美银行业危机可能会蔓延到哪些领域这样的专业投资问题,也可以给普通人提供最新的投资策略建议:
(图片来自华尔街见闻《我们同时问了GPT-4和文心一言10个问题,这是它们的回答》)
文心一言还有一点特别让人惊喜的是,它的数据更即时。ChatGPT的“知识”截止于2021年9月,因此其答案是比较过时的,在提供一些时效性内容比如热点人物、热点事件时就无能为力。文心一言则可以给出最新的答案,这需要更强的算力,也与百度的搜索引擎业务基础有关。比如文心一言已经知道高叶代言了哪些品牌:
(图片源自“好看商业”)
再比如它可以言简意赅地解释“为什么硅谷银行会倒闭?”:
(图片来源华尔街见闻)
几个或者几十个case的对比都不能说明文心一言或者ChatGPT孰优孰劣。不过从综合表现来看,文心一言并没有像一些有偏见的人所说的那样“不能打”,在数理推理、中文理解以及多模态上它表现出色,万事开头难,文心一言已经有了好的开始,“成功了一半”。
文心一言发布前,外界的期待值被拉得很高。因为独特的舆论环境,也有一拨人对百度一直充满误解,比如有自媒体内测时特意用一些case去对标ChatGPT认为文心一言“技不如人”,这也完全属于意料之中的事情:吐槽总是容易的。“2017年,美国公司在做阿尔法狗,中国公司在送外卖。2023年,美国公司在做ChatGPT,中国公司还在送外卖。”感慨中国互联网公司不做AI等前沿黑科技的,与奚落百度文心一言做得还不够好的,是同一拨人,在百度发布“文心一言”前他们就已先入为主判定百度是“跟随者”,做得不完美自然就冷嘲热讽,做得好也可以说是步OpenAI后尘,他们自然是不会看到百度这些年来在AI上坚定不移的持续投资的。
启动AI战略10年来,百度已累计研发投入超过 1000 亿元,且不说NLP、深度学习、机器视觉等技术近10年的积累,单单是文心一言底层的大模型技术百度就已入局4年,2019年百度发布ERNIE 1.0,现已升级到3.0,每天接受数十亿用户的搜索请求和其他百度移动生态app的训练,在AI开发者生态层面,数百万开发人员使用深度学习平台飞桨进行AI开发。正因为此,对百度来说发布文心一言本质就是一次厚积薄发。
对百度来说,发布文心一言并非平地起高楼,而是“封顶”,它耗时十年、投资千亿精心建造了名为“AI”的摩天大楼,“封顶”后世人皆知,很多人只见大楼却忽视支撑大楼的是深深的地基。
文心一言对标2023年爆红的ChatGPT,两者底层使用一样的大模型技术。此前已有大学发布过学术类的大模型产品,文心一言则是我国首个商用的大模型对话机器人产品。它是唯一由大厂出品的大模型对话机器人,且定位于人人都能使用最先进的生产力工具,因此外界对其期待更高,它的包袱也更重一些。
从百度展示与各界测试的demo来看,文心一言在对标ChatGPT在基础能力上已“人有我有,人有我优”,比如文学创作、商业文案创作、数理推算等典型的深度学习做不好、大模型做得好的AIGC应用,ChatGPT能做的文心一言也能做,且表现丝毫不逊色。
在两个维度,文心一言比ChatGPT表现更优:
一个是中文理解能力。中文是“世界上最复杂的语言”,而百度起家于中文搜索,成立以来就深耕NLP技术,此后做AI的土壤也是中文互联网市场,正因为此它理解中文、理解中国文化,在全世界范围内,还没有一家公司的中文自然语言处理能力以及中文AI技术,能达到百度的水平。在发布会上,文心一言展示了对四川话的理解与生成能力,类似于这样的能力国外的公司不可能做好。基于算法、数据、场景等优势,文心一言在“中文”相关的AIGC场景上战胜ChatGPT是大概率事件。
有媒体让文心一言和GPT-4各自用“鲍威尔停下来”写一首藏头诗,结果高下立判:
(文心一言的回答,图片来自华尔街见闻)
(GPT-4的回答,图片来自华尔街见闻)
另一个是多模态生成能力。大模型竞争日益激烈,技术发展更是一日千里。就在百度发布文心一言的前一晚,OpenAI发布GPT4,在大模型基础上引入多模态,即对视觉内容有了部分加持,但只支持输入,输出的依然是文字,换言之,其不支持AIGC生成——后者更能体现出大模型的能力,具备更大的应用空间。OpenAI CEO Sam Altman在推特上表示,GPT-4“仍然有缺陷,有局限性”。在PPT讲稿上OpenAI透露未来会支持多模态内容生成,但时间不确定。
文心一言基于多模态统一大模型,支持多模态生成能力,包括文本、图片、音频、视频等。此前已有发烧友尝试基于不同的大模型脚本、音频、视频后再合成一部AI电影,理论上来说,文心一言可让AIGC电影一步到位。在接下来的时间里,文心一言可以抢占时间窗口,进一步强化多模态相关的优势。
整体上,文心一言的邀请内测本身就是一个巨大的里程碑,“中国没自主ChatGPT类应用”成为历史,这对我国科技产业乃至各行各业来说都是雪中送炭。国际形势波诡云谲,科技成了角力场。在刚刚结束的两会上,《政府工作报告》就再次强调要建设现代化产业体系,推进科技自立自强。《数字中国建设整体布局规划》则提出要构筑自立自强的数字技术创新体系,筑牢可信可控的数字安全屏障。在AI基础技术领域的自立自强,从芯片层到框架层到模型层再到应用层,从昆仑芯片到飞桨PaddlePaddle到文心大模型再到文心一言,百度作为“AI守门员”牢牢地守住了防线。
自立自强很难、技术创新不易,百度没有满足于“送外卖”赚钱,而是坚定不移地花钱做AI,于是今天我们才有了文心一言这样的自主AI尖端产品,所以,千万不要对文心一言冷嘲热讽了。
在ChatGPT出现后,很多人拿它跟搜索引擎对标,认为它会彻底取代谷歌、百度等搜索引擎。
格局小了。
一方面,站在C端用户的角度看,ChatGPT、文心一言这样的对话式机器人不可能全面取代搜索。对用户来说,搜索需“简单可依赖”,如果对话机器人不能给出高度准确的答案,哪怕只有几次答案是错的,用户就不可能直接用它来“搜索”,很可能在用它获取答案后再用搜索去判断答案是否准确。而且很多时候人们搜索需要多个结果,以对比或综合出自己想要的答案。此外,当前文心一言这类产品都面临计算成本高昂的问题,如果单次计算成本不能降下来,商业模式也难以成立。
当然,文心一言的技术确实也可赋能搜索,让搜索更好用。其实自2019年3月以来,文心大模型就在改进搜索结果方面发挥了重要作用,带来排名改进和多模态搜索能力。接下来基于文心一言百度搜索会有进一步升级,进而持续巩固其在中文搜索市场的主导地位。
另一方面,站在应用场景来看,ChatGPT、文心一言以及底层的大模型技术,是未来各行各业的生产力工具,它们要干的事情,绝非只是搜索。对C端用户来看文心一言是一个对话机器人,相较于传统搜索而言可以给出不一样的答案,可进行文学创作、商业文案创作、数理推算等。
而对产业来说,文心一言的定位则是“人工智能基座型赋能平台”,它底层的大模型以及AI技术可以帮助企业进行业务创新、升级客户体验,用李彦宏的话说是“让任何公司有机会离客户更近”。百度文心不只是有通用的统一多模态大模型,早已面向电力、金融、媒体等领域发布了10多个行业大模型,基于此企业早就可以使用到文心一言的“同款技术”。
反过来,如果企业不用文心一言这样的技术,可能会被采取该技术的对手颠覆,在新媒体、多媒体、传媒出版、营销等产业这样的趋势已在出现,在其他行业则会出现“温水煮青蛙”的格局变化,比如一些企业会慢慢发现,竞争对手的产品价格越来越低,利润却日益增加,自己被打得找不着北,因为竞争对手很可能已经在用文心一言这样的产品实现智能化变革,降本增效与创新升级。
有前瞻性的优秀企业已在布局。自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态,以尽早用上最新最先进的大语言模型,其中很多合作伙伴此前就已从百度的技术、产品和服务中获益,如搜索、智能云、自动驾驶、小度、度小满等。除了业界高度关注的新媒体等新兴产业外,家电这样的传统制造业都已对文心一言表现出“饥渴”,比如TCL、海信、长虹、美的等头部家电巨头早早就已积极加入文心一言生态,它们正在探索将大模型技术应用到智能家居、智能家电、智能制造、智能客服等场景中,拥抱正在到来的更大的智能浪潮。
出现这样的现象不让人意外。大模型即便是大公司也不可能靠突击几个月速成,就算做出来也很难比得上有时间沉淀的玩家的产品,比如百度、OpenAI都在深度学习、自然语言处理、机器视觉等技术上坚持积累多年且投入巨大资源。
做大模型难,做好太难,这也是为什么微软在摸索大模型多年后也不得不投资OpenAI“上保险”的原因。对传统产业的所有企业来说,大模型更是可望不可即。好在市场上还有文心一言这样的产品,百度也一直在将AI、大模型等技术开放给业界,做AI生产力工具是其夙愿。
前些年,不同产业、不同企业的智能化进程参差不齐,百度一直扮演着“教育市场加速智能化推手”角色。此前一位百度内部人士对我表示:很多时候我们需要将“AI技术推给客户用”。现在市场形势变了。李彦宏在发布会上说,“内测中文心一言并不完美,之所以现在要发布,原因在于市场有强烈需求。”这是百度AI技术第一次被市场推着走,智能化浪潮的汹涌程度可见一斑。
市场需求强烈,客户主动“求合作”。中国企业在面临新技术浪潮时大都还是很务实的,观望者只是少数,大多数企业都是积极拥抱的态度。据了解截至3月17日12点,申请文心一言API调用服务测试的企业已达8万。对百度来说,强烈的市场需求也将从根本上改变其商业模式,在原有的搜索等核心消费业务外,靠在B端给产业提供AI生产力工具获得更大的价值,对应的市场空间比搜索大得多。
2007年iPhone发布,2010年移动互联网在中国开始普及,微信、美团、抖音等移动应用崛起,互联网格局彻底被重塑。什么是移动互联网后的下一个Big Case?这些年来,行业从未停止过探索的步伐,从智能硬件/5G/IoT,到VR/AR/元宇宙,再到区块链/量子计算等等,都曾被视作具有“颠覆性”的下一代数字技术。
现在,答案有了。2023年ChatGPT爆红、文心一言面世,大模型成了继移动互联网浪潮后,最有机会颠覆产业格局的新技术,其应用潜力远非元宇宙、区块链、IoT等技术能比的。换言之,在移动互联网后人们一直在苦寻新的技术机会,经历一波波“青铜”技术后,如才终于等到“王者”。
本质上来说,文心一言、ChatGPT本质还是AI技术,只不过底层不再是深度学习,而是更新一代的预训练大模型。早在2017年李彦宏就曾预判:“互联网是前菜,人工智能才是主菜”,现在借用他的话说:对AI产业来说,“深度学习是前菜,大模型才是主菜”。
其实在深度学习出现前,AI技术也早已有几十年发展历史。技术浪潮可以形成正是因为某个技术奇点的到来,让技术的效能实现突破,进而发生“从量到质”的蜕变。如今,AI终于“破茧成蝶”,惊艳地浮出水面。前几天,英伟达CEO黄仁勋在公开活动中表示:“ChatGPT是人工智能领域的iPhone时刻。”
在大模型进入众人视野时,就已被少数科技前瞻者们看到潜力。百度2019年就已在布局,2021年底微软董事长兼CEO萨提亚·纳德拉也直言,他当前阶段关注的一个重点方向就是“正在成为平台的大规模模型,这种大型模型背后的计算,如何继续构建系统。”他认为深度学习在过去20年或10年取得巨大进展,大模型则将是下一个值得期待的大事件,是微软将继续推进的绝佳领域。
对于创业者特别是技术类的创业者来说,机会来了。
一方面,介于文心一言与传统产业间的技术服务模式将会大量涌现。
大模型的兴起从根本上改变了IT架构,在芯片层/框架&系统层/应用层中间,出现了“模型层”,对应到云计算产业将在IaaS、PaaS和SaaS外出现MaaS商业模式,即大模型即服务。
百度是中国最大的MaaS服务商是大概率事件。所有产业都需要文心一言这样的大模型,但它们都不具备对应的技术应用能力,传统的IT服务商在面临大模型时也无能为力。接下来会出现一类服务就是大模型服务商,他们作为云服务生态的成员,负责大模型精调落地,他们具有行业Knowhow,调用通用大模型能力,为行业客户提供解决方案。
另一方面,开发者可基于大模型底座开发创新应用,如同iOS/安卓成就数百万开发者一样。在国外“大模型开发者”已跟iOS开发者一样成为群体,他们不再只是像初期一样折腾一些好玩的应用,而是“更商业化地”去考虑如何创业、如何做产品。在美国版贴吧Reddit的对应板块,每天都有几十个基于OpenAI的新产品上线,大模型以及AI云服务平台已成为催生创新的新土壤,一位国外开发者甚至在其Twitter上表示:“毫不夸张地说,OpenAI很像AI时代的安卓系统。”
文心一言正式发布后,中国势必会出现“大模型开发者”,他们基于文本生成、图像生成、音频生成、视频生成、数字人、3D等能力开发我们想得到、想不到的创新应用,基于大模型技术出现类似于“羊了个羊”这样的爆款应用将只是时间问题。
国外的大模型开发者普遍使用微软Azure构建应用,他们可通过Azure直接调用OpenAI大模型的能力。微软Azure已是TOP云服务商,大模型能力则将助其进一步蚕食亚马逊AWS的份额,因为基于ChatGPT的开发者和企业很多都会成为微软云的增量客户,这一逻辑在国内同样成立,文心一言的相关能力通过百度智能云输出给产业,百度智能云+文心一言将足以改变云计算市场格局。
在发布会上,百度提出文心一言将“将根本性地改变云计算行业的游戏规则。”企业选择云服务部再只看算力、存储等基础云服务,而是看AI能力,特别是大模型能力,看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同能力,在这一点上百度智能云有绝对优势,IDC报告显示,2022年上半年百度智能云在AI公有云服务市场稳居第一,这已是百度智能云连续四年市场份额第一。随着文心一言的发布,百度智能云接下来在智能云服务市场,想输都很难。
因此我认为,百度未来将有机会续写微软的转型神话。从PC转型到移动,微软OS业务面临巨大挑战,Windows Mobile惨败,但其to B业务却大放异彩,可谓是失之东隅,收之桑榆。微软最新市值2.06万亿美元,在科技巨头中仅次于苹果。百度也有望基于AI战略的大获成功,实现B/C业务的并轨发展,在产业端获得更大的增长点。
写在最后:
当大模型技术出现时,业界就认为它的一大特征是“存在一些不确定性”,现在看来,不确定性就意味着更大的可能性。AI大模型最终会带来什么样的成果无人知晓,它可能是强人工智能的终极模式,也可能只是过渡手段,但截至目前其已经越来越清晰地呈现出魅力:从ChatGPT到文心一言均能看出,其在NLP等领域相较于深度学习已展现出肉眼可见的优势,是人类当前看到的最接近强人工智能的训练方式,是推进AI认知智能突破、挑战人类智能的关键。
AI大模型俨然已成AI产业继深度学习后的第二波技术浪潮。深度学习技术让AI从实验室走向商业化,AI大模型则展现出推动AI从作坊式应用迈向工业化生产的潜力。发布文心一言,百度10年努力终于开花结果,养兵千日用兵一时,百度的AI技术底子终于被外界看到,更让人激动的是,一切才刚开始。
一直自我进化是大模型的魅力之一,当文心一言被大规模使用后,将建立起真实用户反馈、开发者调用和模型迭代的飞轮,进步会更快。今天的ChatGPT的表现已远非22年11月发布时可比。四个月后,四年后的文心一言又将如何?这个问题,“等待与希望”,足以回答。
在大仲马名著《基督山伯爵》的最后章节,主人公爱德蒙•唐泰斯将巨大的财富留给了他人,留下一封信转身离去,信的末尾写道“人类的全部智慧就包含在这两个词里面:等待和希望。”这,也是人工智能的“智慧”所在。