智能助手走进人类生活已达十年之久。在某弹幕网站,我很喜欢看用户“调戏”各种智能助手,问它们一些奇葩的问题,让它们替自己接电话,每次都能让人忍俊不禁。同时,看着大家吐槽智能助手依然“人工智障”,也难免有一丝遗憾。
数字技术不断进步,智能助手及其产业是否还有新的机会,能否迎来向前进一步的发展契机?在今年的OPPO开发者大会上,我们看到小布助手呈现出的更多可能性。
基于“端云一体的数智大脑”Andeverse的技术能力,小布助手在元空间发布会上,打造出了一个虚实共生的数字平行世界,重磅发布4.0年度版本,集成小布空间等多个创新产品功能,让用户得以提前领略虚实融合的数字体验。
(OPPO数智工程事业部总裁刘海锋的数智人亮相小布元空间发布会)
从中,我们能读到OPPO在人工智能、虚拟数智人等领域的技术突破,同时,也可以把握移动生态和移动交互在新背景下的脉动,当用户们开始熟悉并喜爱智能助手,依赖其完成更多生活体验,小布如同一艘航船,正在成为更多人前往数智新世界的载具。
小布从来没有停止过进化,也代表了智能助手的持续探索,与我们每个人有着千丝万缕的联系。让我们从小布的进化路线图出发,一窥数智人的彼岸风景。
渡海:不断上升的海平面
首先需要明确一下,为什么智能助手的进化,是理解数智未来的一个重要参照点。回顾机器智能的历史,早在上个世纪,机器人专家汉斯·莫拉维克就绘制了“人类能力地形图”,中低地代表着“算数”和“死记硬背”,丘陵代表着“定理证明”和“下象棋”,高耸的山峦代表着“运动”“手眼协调”和“社交互动”。随着人类对机器智能的不断推进,海平面也在逐渐上升,低处的人类能力开始不再独特,逐渐地,一些更高级的能力也可以由智能生命来完成。比如随着预训练技术的发展成熟,机器对话在某些场景下甚至达到了类人的水平。
技术不断拓展着人工智能的能力,智能助手的智慧程度近年来也取得了很大的发展,也意味着智能生命体将在我们的生活中扮演越来越重要的角色,熟悉并掌握数智生活已经不再是一种选择,而是一种必备的生活技能。因此汉斯·莫拉维克提出:我们应该建造一艘方舟,尽快适应航海生活!
智能助手作为连接物理世界和数字世界的交互入口,很适合成为那艘普罗大众都可以搭乘的数智航船。
造舟:AI支撑下的小布身心灵进化
渡过时代之海,我们首先要看看小布助手4.0这艘航船究竟是怎样建成的,有怎样的能力。
小布4.0版本全新升级的5大能力,从主动式智能到情感化交互,再到数智多模态、智慧新体验和多设备协同。从技术角度出发,我们可以将其归纳为三个方面,构成了小布助手4.0这一生命体的核心。
灵魂:汉斯·莫拉维克认为,社交互动、情感交互等是人类最高级的能力之一,也是“人类能力地形图”中尚未被淹没的山巅。而小布作为OPPO AI应用的集中体现,4.0全新版本正在不断抵达这些山峰,表现出更加智慧的一面。
智慧是一种抽象的、虚无缥缈的东西,机器要展现出类人般的智能,理论上要从三个角度完成进化:一是记忆,人类能够把很多长期状态的信息编入大脑的算法内,在未来某一天来调用它,而稳定的长期记忆是机器智能的一大挑战,表现在智能助手上,就是难以在多轮对话中流畅而自然地交流;二是计算,人脑的并行计算能力非常强大,擅长解决复杂的任务,如分析、决策。在算法和算力的快速发展下,AI也开始在决策智能上展现出类人的能力,让智能助手得以从“命令式被动响应”进化为“贴心式主动服务”;三是学习,IBM的深蓝计算机在1997年战胜国际象棋冠军加里·卡斯帕罗夫时,最大的优势是记忆能力和计算能力,到了2016年AlphaGo击败李世石,深度学习让机器实力有了实质性的飞跃。拥有学习能力之后,智能助手能够自我进化与迭代,解决互动程式化、类人感低的问题。
具体到小布助手4.0版本中,我们已经可以看到在记忆、计算、学习这三个层面,小布正在带来真实可感的体验变革。
记忆方面,适当的记忆决定了智能助手的交互体验是否自然顺畅。对于人类来说,根据之前的信息来作出即时反应,几乎是一种本能,根本不需要特别调动记忆模块,但这么简单的事对于AI智能体来说却是很困难的。在长短期记忆神经网络(LSTM)出现之前,传统神经网络没有记忆功能,无法处理较长序列数据,简单来说就是记不住长距离数据的信息,表现在智能助手身上,用户跟它说完“吃完晚饭跟我聊会儿天”,它还会问一句“吃了没”,妥妥地煞风景。要避免用户说“前门楼子”AI说“胯骨轴子”这种前言不搭后语的情况,就需要智能助手很好地理解上下文,以此来生成更自然、情感化的表达,这就离不开强大的记忆能力。所以,研究人员特别为小布研发了记忆能力,让AI在聊天过程中能够理解一些更长距离的关键数据,不至于学过就忘,从而生成有趣、有用的聊天内容,用户不必反复强调一些说过的内容,人机交流也就更加轻松愉快。有了记忆,智能助手才有了可持续成长的人格化基础。
计算方面,在端侧算力的支持下,小布助手得以搭载更强大的算法应用,基于自研的情感识别算法,让小布助手具备智趣单轮、技能引导、话题多轮、情绪感知等基础能力,再引入较为前沿的预训练技术,通过1亿~10亿参数级别的大模型来提升语言理解的泛化能力,缓解因“意图理解不到位”而造成的“智障”问题。同时,注重AI与知识计算的结合,构建了精品知识图谱,规模达到亿级别的实体和百亿级别的关系,让小布具备足够的知识储备,能够解答用户各种各样的疑问,在知识问答方面带来了2%~4%的效果提升。一番技术打磨之下,小布助手对于口语化表达的理解、用户意图的分析、有温度的情感化交互,就得到了有效的提升。
不止于此,小布助手还能够准确判断用户需求、结合上下文场景,进而主动提供服务。将数字服务的各个“断点”串联起来,让服务呈现连贯性,用户感受到的是符合行为惯性的丝滑与顺畅,比如感知到用户的出行需求后,小布会在用户出行前就提供行李准备、酒店预订、交通情况、防疫政策等基础提醒,提前为旅程做好充分的准备。
学习方面,小布更智慧的一面还体现在持续学习和发展进化的能力上。对内,小布会根据用户的行为反馈不断学习进化,变得越来越“懂你”:如果发现用户的需求没有被满足,会反复修改自己的话术进行重试;收到用户的表扬,也会根据口碑满意度体系来进一步优化,持续提升自己。对外,小布会持续学习多场景、跨终端带来的数据资源,不断扩展自身的能力边界和服务场景。比如通过场景理解,支持一句话多指令,让查天气、定闹钟、打电话等常规服务更加便捷高效,只需对小布说一句“打开健康码”指令,能省去手动操作的一系列繁琐流程。另外,小布可以支持手机、手表、电视、Pad等OPPO自有设备控制,以及小布生态的第三方品牌,跨端、跨设备执行指令,打破了数据壁垒,既让用户享受到全场景服务无缝切换的丝滑;又能够通过多终端数据协同反哺算法,为小布助手的自主学习提供多维度的数据养分,进一步提升小布的智慧水平和服务能力。
沿着记忆、计算、学习的路线图,小布正一步步向“人类能力地形图”的山巅攀爬。
身体:很长一段时间以来,智能助手都如同科幻电影《HER》中的女主角一样,只有语音而没有形体,近年来随着数智技术的进步,一些智能助手开始整合语音交互、自然语言理解、图像识别等AI能力,外观形象变得更加鲜活,比如微软小冰、OPPO小布、腾讯云小微等……今年的小布也在技术支撑下进一步迭代。
一方面,小布4.0进行了互动层面的全新升级,支持用户通过手机屏幕的多点触控,与数智人实时互动,如可以戳戳小布的肚子、摸摸小布的头和屁股,小布数智人都可以给出相应的反馈。小布4.0版本推出的小布数智人3D聊天功能,则更进一步,通过3D场景、AI驱动的数智人和故事设定,支持多模态互动的同时,还能创造出真实自然的聊天场景,识别用户情绪,让用户获得以聊天互动为主、兼具游戏娱乐的沉浸式聊天新体验。
另一方面,小布空间为数智人提供了交互的场域,更具沉浸感和互动趣味。尽管XR设备尚未普及应用,但OPPO已经基于小布助手APP打造了虚实融合的元空间概念产品,让用户可以在手机界面下体验虚实融合的魅力。小布空间支持用户在其中创建自身形象,3D视觉效果和真实角色设置让数字生活更具沉浸感和真实感,运用“第二分身”与数智人和真人在广场社交互动,解锁更多创新玩法,比如一起去展厅观看会议直播,足不出户完成线上参会等,提前体验“模拟人生”。
物理学家迈克斯·泰格马克提出,1.0版的生命,其硬件和软件都是靠进化获得的,无法改变。而以人工智能为代表的生命3.0阶段,生命不仅可以自行设计软件(文化),还可以自行设计硬件(身体),从碳基走向硅基。显然,小布数智人所表现出的“身体”形象的可设计、可塑造,正是智能生命向3.0阶段发展的必然过程,也让我们提前感受到了与硅基生命互动的乐趣。
OPPO“科技为人”的理念,推动了小布助手身心灵向更智慧的方向发展迭代,成为秀外慧中的智能生命。有了坚实的身心基础,也就有了进一步探索虚实融合未来的底气。
启航:数智世界的技术彼岸
夯实智能助手的能力只是第一步,此次创新的第二个价值点在于:数智人的世界探寻。
客观而坦率地说,移动互联网发展了十多年,用户对于人机交互的新鲜感也极大下降,大家渴望新体验,而新体验必将建立起移动终端市场的新秩序。而当下,技术指向已经十分明显,那就是一个被反复提及的名词——虚实融合。
此次OPPO开发者大会,可以很清晰地看到OPPO对技术路径和产业方向的判断,小布元空间发布会打造一个现实世界与虚拟世界相互交织、自然融合的交流共享空间,小布4.0集感知和交互为一体的视觉效果。
沿着小布助手和数智人的航线,究竟会驶向一个怎样的技术彼岸?从OPPO的举措,我们可以看到三个正在被释放出的红利。
1.技术红利。数智人的应用场景不断拓展,但技术门槛依然高企,一个具备高互动性的数智人,需要领先的AI算法来对唇形、表情、动作等进行生成和驱动,比如NLP算法生成的语句要跟口型精密匹配,才能让用户有跟真人对话的既视感。要让交互不枯燥,有新鲜感,不能来来回回就是几个固定动作,就需要GAN生成算法等参与构建并驱动数智人的动作。数智人要进入银行、医院、学校、高铁站等各种场景提供服务,不可能所有企业都要靠自己来研发基础能力,通过小布数智人平台和OPPO开放生态合作,避免在底层技术上反复造轮子,能够降低技术门槛,加速数智人的产业化进程。
2.产业红利。随着多模态人机交互被广泛接受,对数智人的产业需求也越来越多,但个性化外形和技能呈现,需要美术设计、3D建模、骨骼绑定、贴图捏脸等一系列操作,高企的制作门槛阻碍了数智人的规模化落地。目前,小布也在数智人平台沉淀了相应的能力,提供个性化、高表现力、多场景的数智人服务,减少落地应用门槛,助力数智人深入到B端市场的更多场景。
3.生态红利。丰富繁荣的数智人应用与服务,离不开个人开发者和企业开发者的创新智慧,让开发者的创意和精力快速转化为商业回报,OPPO在AIoT领域的全面布局和生态建设提供了丰沃的成果转化土壤,前面提到小布助手支持手机、手表、电视、Pad等OPPO自有设备控制,也支持第三方品牌,覆盖全品类硬件,这意味着相关应用和服务能够在多端部署、覆盖OPPO生态内的用户,开发者借助OPPO收获商业价值,又进一步吸引更多人共建虚实融合的数智世界,OPPO创新生态也就进入了良性循环。
不难看出,随着小布助手的潜力不断释放,未来不仅仅会在OPPO万物互融的生态体系中,扮演交互入口的重要角色,还将在整个移动生态内扩散智能生命体的价值,成为更多企业和用户与数字世界的交接点。万物互融、虚实融合的大趋势下,小布的存在价值正前所未有地显现出来。
未来生命研究所的迈克斯·泰格马克认为:有人工智能相伴的生命未来是我们这个时代最重要的对话。小布助手正带着我们参与到与AI生命温暖而有趣的对话中,有理由相信,生于这个人工智能极大发展时代的人们,都应该与智能助手共同成就更好的彼此。
一段精彩的旅程正等待着我们扬帆出海,不妨从一句“小布小布”开始吧。