从波士顿动力的空翻机器人,到特斯拉Optimus机器人走进汽车制造车间,再到北京机器人马拉松比赛……具身智能这个高冷、硬核的专业术语,近年来在全球范围内掀起新一轮技术革命浪潮。
作为人工智能、机器人学与认知科学的交叉领域,具身智能的核心是通过物理实体与环境的动态交互,实现“感知-决策-行动”的闭环,从而推动智能体从虚拟认知向实体操作的跃迁。如今,具身智能被视为人形机器人、工业自动化及服务机器人领域的关键驱动力,并正以前所未有的速度刷新着人们的认知。
不过,从技术创新到场景落地始终需要跨越巨大的鸿沟,尤其是人形机器人依然面临着各色各样的挑战。那么,在具身智能、AI大模型快速发展的今天,人形机器人未来发展趋势有哪些?当下最重要的技术挑战是什么?未来有哪些值得探索的落地场景?
2025年,被产业界视为人形机器人的量产元年、爆发元年。
事实的确如此。在政策驱动和技术进步等多重因素的驱动下,全球人形机器人市场迎来爆发式增长。根据高工机器人产业研究所(Gell)数据显示,中国人形机器人2024年的出货量达到2400台,到20230年则有望达到16.25W台,拥有着广阔的市场前景。
当前,以人形机器人为代表的具身智能产品已经在制造业的部分场景中得到了快速落地与部署,例如像汽车装配线、特种/恶劣环境等;另外,像医疗护理等场景未来也有着较强的需求,不过具身智能在医疗护理场景的技术成熟度有待进一步提升;个人/家庭服务是人形机器人的最终形态,未来市场潜力不可低估。
不过,人形机器人距离真正大规模量产商用化依然有着一定的距离,在数据、硬件架构、成本以及安全性等方面存在不少亟待解决的挑战。英特尔中国边缘计算事业部EIS高级总监李岩直言:“以人形机器人为代表的具身智能行业发展迅速,但也存在系统架构的非一致性、解决方案的泛化能力不足、场景适配的复杂性等问题。”
这其中,当前人形机器人主流采用的大小脑解决方案存在的瓶颈愈发明显。所谓大小脑方案,即机器人需同时处理实时控制(“小脑”功能)与复杂决策(“大脑”功能),导致对异构算力的需求激增。在很多现有方案中,“大小脑双系统”不仅会带来硬件成本的升高,而且通信延迟现象明显,甚至可靠性、功耗等方面等挑战也不容忽视。
例如,大小脑的方案从硬件层面上是分开的,这使得多种传感器融合变得很困难。英特尔中国网络与边缘技术与产品总监王景佳介绍:“大小脑双系统方案更多是产业之前发展阶段的无奈之举。这种架构设计不可避免需要系统之间信息交互、同步,导致带宽限制和通信延迟,还需要维护两套系统。”
那么,是否有大小脑的替代方案,来助推人形机器人进一步加速发展与壮大?对此,英特尔带来了其具身智能大小脑融合方案。
针对人形机器人的大小脑方案的种种挑战,英特尔提出“大小脑融合”的具身智能解决方案,其核心思路是通过异构计算架构与软硬件协同优化,降低系统复杂度与成本。
具体来看,英特尔的具身智能解决方案首先构建起了一体化的计算平台,英特尔 酷睿Ultra处理器通过CPU 、集成的英特尔锐炫 GPU 与 NPU 协同运行,以实现异构计算的融合、高精度实时性能和灵活扩展,且支持具身智能的多样化负载稳定运行,大幅提升具身智能系统的整体效率和响应能力。
“融合方案能够使得人形机器人的感知、交互、任务规划和运动控制在统一的系统中实现高效整合。”王景佳介绍道,“在英特尔SoC一体化计算平台中,CPU可支持具身智能方案进行复杂的运动控制,GPU用于具身智能处理环境感知、任务识别、任务规划、大语言模型(LLM)、视觉语言模型(VLM)和端到端模型等复杂任务,而NPU 则承载语音识别、实时视觉处理、传感器数据分析等需长时间运行的 AI 任务。”
其次,人形机器人本身在在软件层面也在高速进化,除了传统的运动轨迹规划、全身步态控制、定位导航之外,也加入视觉感知、大语言模型和基于AI模仿学习的动作模型等一系列算法与应用。王景佳直言,这不仅仅需要异构算力支撑,还需要在软件层面进行优化,从而实现人形机器人整体性能和用户体验的提升。
为此,英特尔提供具身智能软件全站开发套件,通过包括OpenVINO 工具套件、英特尔 oneAPI 工具包、Intel Extension for PyTorch-LLM(IPEX)、英特尔工业边缘控制平台(ECI)、基于开源机器人操作系统的库、中间件和示例应用程序,使代码实现一次开发多平台部署,缩短评估和开发时间,加快客户应用程序的部署以及算法和应用的运行。此外,英特尔还提供跨平台 AI 模型优化工具以及端到端流程加速方案,以简化方案搭建过程,加快产品上市。
“从长远看,融合一定是人形机器人的趋势。无论是大小脑的融合,还是内置各种模型的融合。相比于其他方案,英特尔的具身智能融合方案从性能、成本、可靠性等综合来看都是具有优势的。”
从短期内来看,以人形机器人为代表的具身智能会聚焦落地场景的进一步突破,通过英特尔大小脑融合方案来加速技术迭代与创新,逐步在更多应用场景中探索落地;从长期来看,人形机器人面临着作业对象和场景多、感知模态和类别多、运动DOF和模式多等情况,未来依然面临着交互行为学习训练数据匮乏、可泛化、自适应、安全性等长期挑战。
如何才能让人形机器人未来发展行稳致远?
在王景佳看来,开放的生态有利于产学研用联动起来,共同推动整个产业链的协同创新。尤其是在中国市场,人形机器人产业发展速度极为快速,更加需要一个良性、健康的生态为产业发展注入活力。
为此,英特尔携手本地生态伙伴展开深度合作,探索从技术研发到场景落地的全链路协同模式,构建起协同共进的产业生态格局,为行业发展注入强劲动力。以信步科技的具身智能硬件开发平台HB03,其具身智能“大小脑”融合构建了有力的硬件支撑;而浙江人形机器人创新中心的“领航者2号NAVIAI”人形机器人,实现了可泛化高精准视觉伺服、多行为联合学习的长序列行为规划、视力融合的操作行为学习等技术突破,使得人形机器人在工业场景中执行复杂任务等。
“构建良性的产业生态一直都是英特尔致力去做的。在具身智能领域,英特尔拥有庞大且健康的ODM产业群和硬件产业群,非常有利于推动人形机器人的规模化发展;另外,在MCU和传感器等周边生态方面,英特尔也与合作伙伴有着广泛与紧密的合作;而且在软件与社区方面,英特尔也是秉持开放的态度,与机器人厂商、科研机构和社区有着深厚的合作基础。”李岩最后表示道。