在人工智能的发展之路上,人类总是在不遗余力地追求极限。
当下,如火如荼的大模型热潮,已经蔓延了数月之久,在各种关于大模型的测评中,优先级最高,也最被人看重的,莫过于各类大模型所展现出的IQ能力。
无论是写代码、做数学题,还是各类考试,都是为了探究大模型的IQ极限。
因为更高的IQ,就意味着更强的生产力,意味着更高的盈利水平,以及更多的可能性。
大模型的IQ在过去几年不断提升(根据MMLU的测评结果)
然而,逐年走高的IQ之下,人们却渐渐发现,这些愈发聪明的AI,似乎还是给人感觉冷冰冰的,少了点“人味”。
随着AI带来的生产力的进步,温饱无忧的人们,想要的已不仅仅是一个工具,而是一个有情感和温度的伴侣。
于是,AI研发的重点,也由大模型本身,转移到了对人的关注上。
因此,提升大模型的EQ,使之更好地与人类交互,就成为了其走进千家万户,并横向扩展市场的关键。
01 不可限量的赛道
当AI的EQ增强之后,人们会与之产生怎样的连接?或许Character.ai的表现能提供一个很好的对照。
Character.ai 是一款基于 LLM 的聊天机器人网站,由前谷歌科学家 Noam Shazeer 和 Daniel De Freitas 于 2022 年 9 月创建。
与 ChatGPT 不同的是,Character.ai 更注重人格属性,试图满足社交、情感、陪伴、支持等需求。
该网站不但预先创建了许多聊天角色,包括 Elon Mask、Steve Jobs 和马里奥等,而且用户还可以根据自身的需求和喜好,自己创作角色。
在Character.ai 推出之后,人们发现,更注重EQ的Character.ai,用户平均交互时长超过28分钟,而ChatGPT只有不到5分钟。
同时,Character.ai 的用户增长非常快,在六个月内就达到了每月1亿次的网站访问量,活跃用户的使用时间,也达到了每天2小时。
也正因如此,Character.ai 在问世后不久,就受到了资本的青睐。
在今年3月,得到了融资后的Character.ai估值达到了10亿美元,成为了情感类AI领域的行业独角兽。而在众多投资方中,就包括了美国硅谷创投界名人Marc Andreessen成立的风投机构a16z。
支持多模态互动的Character.ai
而同样的,Character.ai的同类产品,由Inflection AI开发的Pi,更是将情感类AI的能力发挥得淋漓尽致。
虽然界面看上去十分简单,但在互动过程中,Pi呈现出了很强的“主动性”,会根据聊天的内容,不断地向用户发问,从而一点点探明用户的个性、思想,并以此提供更加针对性的互动。
除了可以不断学习和进化,提高自身的智能水平外,Pi在互动时,还可以使用富有情感的语音进行回答,让人觉得自己是真的和一个“人”在交流,从而更容易让人与之产生情感链接。
这样的功能,像极了电影《她》里善解人意的AI萨曼莎。
由于Pi在EQ方面展现出的强大表现,近期微软、英伟达牵头的一轮融资中,Inflection AI筹集了13亿美元,总计融资达到15.25亿美元。
据路透社报道,该公司最新一轮估值约为40亿美元。
Character.ai和Pi的例子说明了,在当下的AI革命中,情感类AI已经成了一个愈发具有潜力的赛道。
虽然不同的研究机构对情感类AI的市场规模,做出了不同的预测,但都认为其是一个高速增长的领域,具有巨大的发展潜力。
而领投Character.ai的a16z的合伙人Mark Andreessen甚至认为未来每个人都会有一个AI陪伴他/她长大。
这既是技术进步的结果,也是人性和社会的需求。
然而,在当下百花齐放的AI生态中,人们总不免会问:同样是以文字的形式与用户进行聊天、互动,情感类AI与非情感类AI的本质区别是什么?它的应用场景,又有哪些?
只有搞清楚了这些,我们才能明白情感类AI的独特优势所在。
02 AI的IQ与EQ
在人工智能的发展之路上,人类总是在不遗余力地追求AI智力的极限。
从2016年AIphaGo战胜了围棋冠军李世石,到如今ChatGPT令数学天才陶哲轩也为之惊叹的推理能力,不断进化的AI,涌现出了愈发难以限量的智能。
但这样的能力,全都只是IQ,而不是EQ。
因为其只能按照概率和逻辑来执行任务,而不具备心智理论(Theory of Mind)推理和情感分析的能力。而这正是区分情感类AI与非情感类AI的关键。
所谓心智理论(ToM)推理,是指能够推断他人的心理状态,以及理解这些心理状态如何影响他人的行为和决策的能力。
情感分析能力,则是指AI能够从多种数据源中提取和评估人类的情感信息的反应能力。
这两种能力,都是AI理解人类社会和情感交流的关键,也是情感类AI所具备的特征。
举例来说,假设一个人某天发现自己心爱的宠物狗死了,很伤心,很难过,想找身边的AI进行倾诉,在这种情况下,非情感类AI可能会依据逻辑和最优化策略,对你提出一系列冷冰冰的、清单式的建议。
甚至可能会极其不合时宜地建议你“重新养一只宠物狗”。
而相较之下,一个具备了心智理论(ToM)推理和情感分析能力的AI,则会利用这两种能力,分析用户说话的内容、语气、语调等特征,推断出用户遇到了什么困难和压力,以及他可能会怎么想和怎么感觉。
同时,情感类AI还会利用强化学习技术和情感生成技术,根据用户的情感状态和需求,选择最合适的行动策略和回复内容,以表现出恰当的关心和帮助。
也正是由于这样的区别,非情感类AI更适用于那些不与人进行直接互动的场景,例如图像识别、数据分析、智能制造等。
而情感类AI,则更适用于教育、娱乐、医疗等需要与人类进行情感交流和同理心的领域。
然而,尽管如此,情感AI在过去十年里最主要的应用场景,则是用于市场研究,分析人类对各类产品或广告的情绪反应,而不是对人类个体进行情感分析。
这不仅是因为市场研究的数据量更多,需求和目标更明确,更是因为在当时的条件下,情感模型的构建和评估还十分复杂。
这样的模型,需要考虑人类情感的复杂性、动态性、文化差异等因素,因此往往需要高级的算法、理论和技术。
然而,随着新一轮AI革命的到来,越来越多的大模型团队,在攻破其中的难题。
而国内的西湖心辰,就是这样的佼佼者。
03 让AI更具人性
“让AI兼具智商和情商,像人一样地和用户长期沟通。”这是西湖心辰目前的AI愿景。
成立于2021年7月的西湖心辰,总部位于浙江杭州,由西湖大学教授、前谷歌科学家蓝振忠博士带队创办。蓝博士曾成功研发了谷歌大模型 BERT 的轻量化版本“ALBERT“,并应用在Google News、Google Assistant等覆盖数亿用户的产品中。
而团队其他主要成员,均来自谷歌、微软、卡内基梅隆大学、中科院等知名企业和院所。
西湖心辰成立后,与西湖大学等顶级AI研究团队合作,推出了多款AI产品,包括AI绘画、AI写作、AI心理咨询等。
其研发的西湖大模型是一个结合了 文本/语音/视觉 多模态能力的大模型。能对视觉创作、内容生产、心理疗愈等领域进行赋能。
尤其是在情感类AI方面,西湖心辰有着自己一套独特的理念与技术。
而其中之一,就是AI的长期记忆。
一般来说,当前的主流情感类AI,如Character.ai、Pi等,虽然都能根据用户的反馈,进行各种情感回应,但其最大的限制,却是缺乏一种长期记忆的能力。
对情感类AI而言,倘若没有这样的能力,就无法捕捉到人类情感的变化和发展,并适应不同的情境和需求。
虽然在Character.ai使用界面,也能保留用户的聊天信息,但所谓的“长期记忆”,并不能简单地等同于“保存聊天记录”。
因为长期记忆,不仅要求AI能够存储和回放过去的信息,还要求AI能够对信息进行抽象、整合、推理和创造,从而形成更深层次的理解和表达。
在这方面,拥有长期记忆的西湖大模型,能从深度融合的多种模态中获取共同的信息,并进行更深度的推理。
在长记忆能力的支持下,可以展现出和人类一样的基于实时状态+多模态输入+个性化长期记忆综合的交互沟通能力。
所有这些,都是目前的Character.ai和Pi所不具备的。
而在长期记忆的基础上,西湖大模型还会对情绪进行比较细致的分类,并通过存储和更新用户的情绪历史记录,构建用户的情绪轨迹和情绪模型。
而对情绪进行分类与建模,之所以如此重要,情感类AI需要能够适应不同的语言、文化、场景和用户,倘若无法针对各类情绪和性格,进行针对性的建模,模型就会缺乏泛化能力,容易出现过拟合或欠拟合的问题。
在对用户的性格以及所处状态深入建模之后,大模型就能捕捉情绪的组合性、层次性和动态性,以及情绪与多模态信息之间的映射关系,从而增强了模型的可解释性。
如此一来,大模型就能适应不同用户的个性特征和环境变化。
由于上述不凡的技术优势,西湖心辰获得了汤姆猫连续两轮战略投资,并与其达成了深度战略合作。共同推出能听、 能看、 能说、能教知识,能陪伴学习 的汤姆猫系列产品。
在商业方面,汤姆猫是一个全球知名的卡通形象,拥有超过4亿的月活用户和超过130亿的累计下载量。其系列产品涵盖了多种类型的游戏和动画,吸引了不同年龄段和喜好的用户。
通过西湖心辰的情感AI技术,汤姆猫将会变得更加智能、人性化,从而提高用户对汤姆猫的情感依赖和信任,并增加其在动画和游戏中的沉浸感,从而为汤姆猫系列产品带来更大的用户规模。预计全面接入西湖大模型后,每年模型调用次数可能达到千亿级。
而这样的商业案例,也再一次表明了:在当前的大模型赛道上,更注重EQ的情感类AI,将会成逐渐为更多产品和应用的一种“标配”。
因为情感维度所带来的延展性和可能性,要远比追求“效率”、“准确性”的智力维度要丰富得多。
而西湖心辰依据其“让AI像人一样和用户长期沟通”的技术理念,未来也将在教育、医疗和娱乐领域,为更广大的群体提供更具人性和温度的AI。