文心耀乌镇，“大模型之光”展现了什么？

“乌镇的小桥流水，能照见全球科技的风起云涌。”

多年以来，伴随着中国科技的腾飞，以及世界互联网大会乌镇峰会的连续成功举办，这句话已经成为全球科技产业的共识。乌镇是科技与互联网的风向标、晴雨表，也是无数新故事开始的地方。

而今年的乌镇，主题似乎只有一个——人工智能。

11月8日，2023年世界互联网大会乌镇峰会正式开幕，而这一届峰会的特点，就是无处不弥漫着AI的气息。大模型的崛起与发展成为最受关注的议题，各个论坛探索着大模型的种种未来，每位企业家都在擘画着大模型时代的产业蓝图。

在这样的盛大舞台上，谁才是最能代表中国AI科技实力的“大模型之光”？伴随着“世界互联网大会领先科技奖”的颁布，我们也看到了答案。

可以看到，在众多参选技术成果中，百度知识增强大语言模型关键技术获得了“世界互联网大会领先科技奖”，而这也是大模型领域唯一的获奖成果。

百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰，在现场发布了文心大模型的关键技术成果。他表示，“人工智能正在引领新一轮科技革命和产业变革，大语言模型让人们看到了通用人工智能的曙光。知识增强大语言模型关键技术，突破知识内化和外用技术，具备知识增强、检索增强和对话增强的独有技术优势，并通过模型与框架联合优化，突破了训练规模，提高了训练效率，提升了模型效果”。

世界科技看乌镇，乌镇大模型看文心。

在文心大模型4.0成熟的技术路线与工程化能力受到广泛认可背后，我们可以看到更广阔的未来。比如大模型产业的发展方向，中国科技新十年的创新底座，以及新科技革命的光明前路。

乌镇十年，故事新篇由文心领启

从2014年到2023年，世界互联网大会乌镇峰会刚好走过了十年岁月。因此今年的乌镇峰会有很多格外让人感慨的地方。在十年之前，AI技术还在乌镇舞台上并没有得到广泛关注。而在今天，乌镇已经呈现出了无处不讲AI，无人不说大模型的盛况。

很多人认为，乌镇十年刚好是一个分水岭，它标志着移动互联网为主导的产业周期告一段落，以大模型为主导的AI时代正式到来。

而这个十年变革最具代表性的一幕，就发生在领先科技奖的颁奖台上。

世界互联网领先科技成果是由世界互联网大会组织的评选活动。它面向全球广泛征集前沿科技申报成果，通过评审评出具有国际代表性的年度领先科技成果。这一活动自2016年起连续举办，如今已经在全球科技与互联网产业中发挥了举足轻重的影响。

今年，活动全面升级为世界互联网大会领先科技奖，并首次分为关键技术、基础研究、工程研发三类，面向全球表彰年度领先互联网科技成果。据了解，今年参选的科技成果多达246项，涵盖AI、大数据、5G、车联网等领域。

而在今年大模型崛起，AI时代到来的背景下，谁能摘得大模型领域的领先成果奖就变得意义非凡。经过40名海内外专家评审，百度知识增强大语言模型关键技术成为唯一获奖的大模型技术。可以说，文心大模型的获奖，领启了乌镇新十年的AI故事，开启了全球互联网走向大模型时代的变革序曲。

文心大模型获奖究竟为什么能夺得如此关键的奖项？其获奖的宏观意义究竟是什么？

核心技术与工程化路径，“大模型之光”展现了什么？

获得了世界互联网大会领先科技奖的文心大模型，毫无疑问可以被称为中国的“大模型之光”。而在一系列产业界、学术界认可，以及开发者、用户的广泛支持中，文心究竟做对了什么，是一个值得深入思考的问题。

从技术内核上看，文心大模型最为关键的是知识增强、检索增强和对话增强等独有技术优势。

在知识增强方面，文心大模型可以从数万亿数据和数千亿知识中融合学习，把知识内化至模型参数中，同时灵活高效地运用外部知识，最终实现模型效果更好，效率更高。

在检索增强方面，文心大模型采用了基于语义理解与匹配的新一代搜索架构，能够为用户提供更精准的搜索结果，与生成模型联合优化，最终让输出的内容准确率更高、时效性更强。

在对话增强方面，文心大模型基于领先的通用对话技术，提升大语言模型的上下文理解、对话规划及记忆能力，使对话的连贯性和合理性更好。

在工程化领域，文心大模型展现出了业界瞩目的极高迭代效率。并通过模型与框架联合优化，突破了训练规模，提高了训练效率，提升了模型效果。目前，文心一言的基础模型已迭代到文心大模型4.0版本。在文心大模型和飞桨深度学习平台联合优化下，文心大模型4.0的训练算法效率已经提升到3月发布时的 3.6 倍，推理能力提升了超过50 倍。

在这些关键技术支撑下，文心大模型在全球多个公开测试中实现了技术效果领先。百度知识增强大语言模型相关技术先后获得了国家技术发明二等奖、中国专利金奖、吴文俊人工智能科技进步特等奖、中国电子学会科技进步一等奖等。

核心技术有可持续发展的差异化优势，工程化能力与模型迭代效率极强。这两点构成了文心大模型的发展方案，也形成了中国大模型在全球AI竞赛中的代表性能力。当文心大模型的技术底座，结合广大开发者的应用创新能力，千行百业的智能化需求——大模型之光，最终会点亮中国AI的发展之光，世界互联网科技的进步之光。

多年积累，终为科技革命照见前路

托马斯·库恩在《科学革命的结构》中说，科学家由一个新范式指引，去采用新工具，注意新领域，最终在科技革命之后，我们会面对一个完全不同的世界。

在文心大模型获奖背后，真正值得被看见的是百度在AI技术上的多年积累，不断为科学家、产业界提供新工具，打开新领域。最终，有望通过AI技术推动新一代科技革命到来，帮助互联网产业，乃至整体社会经济抵达一个新的世界。

事实上，在文心大模型获奖之前，百度已经通过百度大脑、小度助手（DuerOS）、Apollo、飞桨，先后四次获得世界互联网大会领先科技成果。这些奖项展示了百度如何一步步探索AI技术的可能性，最终通过不断的技术积累，去敲开新科技革命的大门。

在今天，大模型技术的发展与成型，进一步照亮了科技革命的前路。在百度看来，我们已经有了拥抱变革的清晰目标与实现方式。我们可以通过三个角度，来总结文心大模型背后，百度的AI技术思考。

首先，AI工业大生产，是新科技革命的实现方式。

王海峰表示，人工智能是新一轮科技革命和产业变革的重要驱动力量，深度学习作为人工智能的核心技术，具有很强的通用性，并具备标准化、自动化和模块化的工业大生产特征，而大模型的兴起，使得人工智能应用的深度和广度进一步拓展。人工智能已进入工业大生产阶段。

面向未来，大模型将从更多领域推动AI技术的标准化、自动化和模块化，从而不断降低AI技术的应用门槛，提升其场景化落地的便捷性。这些工业化大生产特征的积累和聚合，将推动新科技革命到来，加速产业智能化升级，最终创造社会生产力的巨大爆发。

其次，“芯片代工厂模式”，是适配大模型发展的产业路径。

大模型有着重投入、广应用的产业特征，这就导致其前期成本巨大，有着不小的产业挑战。面对这一挑战，王海峰表示大模型可以采用类似芯片代工厂的产业模式。通过“集约化生产，平台化应用”模式，让具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来，通过低门槛、高效率的生产平台，为千行百业提供大模型服务。

目前，这一产业化路径已在文心大模型产业实践中得到验证，百度与合作伙伴共建了包括能源、金融、航天、制造、传媒、城市、社科以及影视等10余个行业大模型，加速大模型产业化落地。

此外，AI加强理解、生成、逻辑、记忆四大能力，将带领我们走向AGI的曙光。

王海峰认为，人工智能具有多种典型能力，理解、生成、逻辑、记忆是其中的基础能力，这四项能力越强，越接近通用人工智能。大语言模型具备了这四项能力，且越来越强，为通用人工智能带来了曙光。

在构建基础底座、探索产业路径、锚定未来方向等领域，百度对AI技术与大模型进行了广泛且持续的投入。最终也收获了来自产学各界、开发者、用户的积极反馈。文心一言自8月31日面向全社会开放至今，用户规模已经达到7000万，构建场景超过4300个，助力开发应用2492个。飞桨和文心生态已凝聚800万开发者，服务22万家企事业单位，创建了80万个模型。

文心闪耀乌镇的最大价值，是百度持续的AI探索，正在成长为业界共识，发展成社会底座，凝聚为照亮新科技革命前路的灯塔。

而这些成果，将让AI之花绽放在中国大地上，盛开出乌镇故事新十年的智能花海。文心耀乌镇，AI绽神州，正在成为目之所及的风景。

文心耀乌镇，“大模型之光”展现了什么？

特别声明：文章版权归原作者所有，文章内容为作者个人观点，不代表大咖秀专栏的立场，转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)