导读：商汤AI大装置有两大作用：解决AI落地中的长尾问题，批量打造大参数模型。

当AI技术广泛渗透进各行各业和日常生活，AI越来越被“祛魅”化。

AI随处可见，但远没有达到无所不能的阶段，有时候还挺“傻”的。大众更愿意接受实实在在的生活改变，而不太关心通用人工智能（AGI, Artificial General Intelligence）等太遥远的概念。

近两年从国外火到国内的通用大模型，成为全球AI头部企业不约而同的发力方向。这些大模型在尝试解决小样本长尾应用等实际问题的同时，也引发了业界关于AGI的重新讨论。商汤推出的AI大装置也不例外。

不久前在2021WAIC（世界人工智能大会）上，商汤科技联合创始人、首席执行官徐立首次分享了商汤新型人工智能基础设施——SenseCore商汤AI大装置的全貌。在商汤内部，AI大装置被定位为商汤长线核心竞争力、公司持续经营和实现更大规模跃迁的护城河。

商汤AI将大装置描述为：将算力、算法、平台这三大最重要内核要素打通为“三位一体”的AI基础设施，实现AI技术对企业服务、城市管理和个人生活三大落地方向的持续赋能，从而以更高效率更低成本进一步带动AI产能的创新升级。

从长远看，通往通用人工智能之路，AI大装置也许是个探路石。然而更关键的是，AI大装置可以解决AI落地中的长尾问题，批量打造大参数模型，加深平台型AI公司的护城河。

趋势：万亿参数来袭，大模型有大智慧

AI大装置的名字来源于高能物理中的粒子对撞机，其通过随机的两束粒子流的高速碰撞去认识量子粒子的新规律、新粒子。粒子碰撞结果不可预测，但只有通过不停的探索尝试，才有可能找出一些可解释物理世界的规律。

徐立表示，同理，在人工智能的可能性探索过程中，很多的小样本的问题不是在着手的时候就能够解决的，只有通过尝试不同的、更大的大模型泛化能力，再蒸馏到小样本、零样本的过程中才能够解决。

AI大装置的逻辑与业界火热的通用大模型相似。虽然业界对于通用大模型仍有很多争论，但其基本跑通了“更大模型实现更精准小样本应用”这条路。

2020年5月OpenAI推出有1750亿参数的GPT-3，其使用了几乎所有来自互联网的可用数据进行训练，成为迄今为止最好的自然语言处理模型。更关键的，GPT-3证明了扩展文本量（数据）、参数扩展（模型大小）以及训练计算量的增加，都将更准确地完成小样本自然语言处理任务。

仅仅一年时间，大模型的参数量已经进入到万亿时代。2021年1月，谷歌推出1.6万亿参数大模型Switch Transformer。6月，国内智源研究院发布1.75万亿参数的全球最大预训练模型悟道2.0，同时阿里巴巴也发布了万亿巨模型M6。

商汤在2017年就开始探索大参数深度网络，并对AI大装置投入研究。其AI大装置分为三层结构，九大模块。第一层是算力层，包括计算训练芯片，AI数据中心（AIDC），和底层传感器。第二层是平台层，包括数据平台、深度学习训练框架 SenseParrots、深度学习推理部署引擎 SensePPL、模型生产平台。第三层是算法层，包括创新算法模型以及算法开源计划 OpenMMLab。

AI大装置，可以看做是商汤最先进算法、算力和系统的集大成者。目前，投资56亿的商汤智算中心（AIDC）计划总算力达到3740 Petaflops（1 Petaflop等于每秒1千万亿次浮点运算），计划2021年底交付。商汤的算法工具箱里已经有17000个算法模型。除工具箱外，商汤还将一部分SOTA算法进行整合开源到OpenMMLab体系中，在GitHub上已收获37000颗星。

脚下：批量产出AI长尾应用

商汤为什么推出AI大装置？

首先非常务实的一点，AI大装置直指AI大规模落地的主要障碍，靠堆人工、项目制进行的算法开发模式，效率低周期长而且成本高。AI大装置通过通用大模型，加上小样本单一场景的细分优化，将更快速批量产出海量长尾应用。

在本届WAIC的演讲中，徐立将物理世界的数字化转型划分为三个环节：场景的数据化，要素的结构化，流程的可交互化。他认为，要素结构化是AI大规模落地卡壳的地方，也是真正需要大规模AI赋能的环节。

“80%结构化应用都是低频的、长尾的场景，如果没有通用人工智能，只能采用大量人力投入到单一项目中，而且还不能很好解决这些本质上是小数据、小样本的问题。此外，技术上如果还聚焦于单一问题过程，就很难在很多通用场景下有很好的泛化能力，导致性能不稳定。”徐立表示。

相比身份识别、安防、交通、城市管理等头部AI场景，还有大量的低频但重要的长尾场景亟需智能化改造。比如，扶梯安全管理、垃圾暴露、城市火灾、高空坠物等等，其中一些甚至是小样本、零样本场景。

以比较常见的扶梯安全为例，商汤通过物体检测、行为识别、密度分析等 AI 技术，将包括跌倒、逆行、推轮椅、拉行李箱等可能导致安全问题的异常要素结构化处理，从发现异常到推送上报、再到帮助人工解决问题，全部交给AI。比如，自动识别大件行李、婴儿车等安全隐患行为，并进行语音劝阻；当有乘客摔倒时，自动降低扶梯运行速度等等。整个流程中，绝大部分工作都可以实现AI替代，只有解决问题这一步还需要人工介入。

再比如，在冬奥会场馆中，AI大装置可以快速完成场景数据化（数字孪生）、要素结构化和流程交互化（进行运动员运动轨迹分析等），还可以基于混合现实技术实现观众互动。

商汤认为，基于对泛化能力的复用，AI大装置能够降低人工智能生产要素的价格，推动物理世界的全面数字化转型。

其次，AI大装置另一个重要作用在于批量产出通用大模型。目前，通用大模型在实现了参数量级的大幅提升后，下一步就是在更多垂直场景和行业中进行验证。“每一个领域，是不是都可以有足够多的数据输入，然后用AI大装置对撞生成结果？”徐立表示。

远方：用机器猜想开启人类创新的新范式

图灵奖得主，关系型数据库的鼻祖吉姆·格雷曾将人类的科学研究分为四类范式（Paradigm，某种必须遵循的规范或大家都在用的套路），依次为：实验归纳，模型推演，仿真模拟和数据密集型科学发现。

这四种范式都是基于人类已有的认知展开归纳和演绎。基于大数据的第四范式，也要先有大量的已知数据，然后通过计算得出之前未知的理论。徐立认为，人类历史上很多颠覆性的科学创新和重大突破不在这四大范式之列，更多源于“天才的猜想”，比如砸在牛顿头上的苹果，以及爱因斯坦幼年幻想乘坐的那束光。

然而面对被极大扩展的未知世界，商汤认为仅靠人脑猜想还不够，需要引入“机器猜想”。AI大装置就是商汤进行“机器猜想”的基础设施，也是进行人类创新新范式的探索。

一方面，目前一些AI算法已经不完全依赖于标注的大数据，有很多算法依赖于小数据，甚至不需要人类数据。

另一方面，当未知的空间变大，需要增加更大的算力。此前常识认为算法越精准，需要的算力就越少。事实上，过去10年最好的AI算法对于算力的需求几乎增长了100万倍。徐立认为，生命科学、材料科学、医药领域等基础学科，将最先受益于“机器猜想”，进入科学创新的新范式。

通用大模型是否是通向AGI的重要一步，业界还有很多争论。从大模型到大装置，背后的这种“机器猜想”会带来什么？过去的AI算法生产，更多是“数据越精准，模型越精准”的模式，背后是人类总想找到因果联系的思维模式。人类总是基于过去的认识，获得“确定性”的机理分解，然后建立新的模型来进行推导。

“机器猜想”可能会部分放弃对因果关系的执念，颠覆千百年来人类的思维惯例。AI大装置也将跳出精准数据输入的限制，靠更大规模的数据碰撞出更通用的大模型。

写在最后

由于长周期大规模研发投入，尤其是前几年的AI过热甚至泡沫被挤破后，近两年AI企业普遍面临更加严峻的亏损问题。长期大幅亏损、商业模式和盈利预期成为AI企业上市的最大障碍。

相比之下，处在头部的商汤相对从容一些，在计算机视觉应用市场保持着营收和市场份额的领先。2021年WAIC，商汤成为了AI四小龙中唯一参会的厂商，这也侧面证明了昔日的AI四小龙正在逐渐分化。谁能抢先上市，就有机会借助二级市场的低成本融资，进一步拉开与友商的差距。

目前AI四小龙中，7月20日，云从科技刚刚在科创板IPO过会，这为普遍上市难的AI行业带来好消息。今年以来，关于商汤IPO的消息也不断传出。近日，腾讯一线消息称，商汤科技已确定A+H上市，保荐人为中金公司，最快将于8月向港交所提交上市申请。

商汤很早就明确了平台型AI公司的定位。从技术上看，AI大装置的重要性不言而喻，其“通用模型 + 碎片化场景适应能力”，是降低模型开发成本，提升长尾场景开发效率的关键。AI大装置能否在更多行业场景发挥效果，「智能进化论」会持续关注。

-END-

本文为「智能进化论」原创作品，智能进化论专注云计算和智能科技领域的深度评论。

押注AI大装置，商汤的“月亮与六便士”

趋势：万亿参数来袭，大模型有大智慧

脚下：批量产出AI长尾应用

远方：用机器猜想开启人类创新的新范式

写在最后

特别声明：文章版权归原作者所有，文章内容为作者个人观点，不代表大咖秀专栏的立场，转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)