天极大咖秀

登录 | 申请注册

人工智能发展进入场景时代,AI+耳机开启办公效率跃迁

宗宁 2024-07-10 阅读: 12,184 次

人工智能发展已经是大势所趋,只是对于各种发展的方向和应用的落地,其实还是有很多争议,甚至连做大模型还是小模型,是开源还是闭源业内也没有达成一个统一的共识。所以在这个时间节点,行业的讨论就格外有价值。

2024年全球世界人工智能大会在7月4日于上海召开,数百个AI大模型、千奇百怪的AI+硬件、上千位全球科技、产业界领军人物都济济一堂,要将AI领域的发展共识再向前推进一步。

聚焦场景,奔向Agent

在7月4号的时候,2024世界人工智能大会公布了一系列的“镇馆之宝”,其中包括支付宝智能助理、商汤科技首个面向C端用户的可控人物视频生成大模型Vimi、阿里云AI编程助手通义灵码、智谱AI基座大模型、特斯拉赛博越野旅行车、联想YOGA Book 9i 笔记本、智能飞行器等等。

从这些来头不小的产品中,我们可以看出,AI大模型的应用落地应该是当前最为紧迫的话题,而各大厂商的竞争已经从大模型对海外GPT的追赶开始逐渐聚焦回了本地的应用落地。

此前,业界对大模型的发展趋势充满争议,开源大模型成本高昂,目前的落地前景还在探索之中,当大模型不能以合适的成本带来相应的价值时,选择闭源模型就是更符合商业化需要的选择。同时,小模型比大模型更迅捷、成本更低、落地的可能性也更大,已经有很多AI产品开始了小模型的竞赛。

无独有偶,未来智能的CTO王松也在一场直播中表达了类似的观点,找到合适的商业模式去赚钱非常重要,包括OpenAI现在也在从非盈利转型盈利,做了很多收费和应用落地方面的尝试。

未来智能自研了聚焦在办公会议场景的垂直小模型,一方面这种垂直模型与自己的商业模式匹配,用更经济可持续的成本更好的赋能自己的会议耳机产品上;一方面实现了AI的场景化和实用化,真正为用户创造价值。未来智能的讯飞会议耳机,是目前业界少有的将AI做到实用、真正解决用户痛点的AI+智能硬件产品。

事实上,目前业内在C端应用上还有一定的共识,就是认为AI Agent将会是一条必由之路。AI Agent简单地说可以理解为在某种在大语言模型基础上,能自主感知、规划决策、执行复杂任务的智能体,是可以脱离人为控制,自主决策和执行任务的存在。

如果举一个大家比较熟悉的例子就是钢铁侠的助手“贾维斯”,实际上就是这么一个完成度极高的AI Agent,不过王松也表示,目前在市面上并没有见到做的非常好的AI Agent,很多有希望的产品也要在两三年后才可能成熟落地。因为AI Agent是要真正完成一个指令的,如果出现了AI幻觉,那后果是会非常严重的。

王松也分享了目前未来智能在AI Agent方面的展望及探索,聚焦在帮助用户用AI解决会议场景的各种问题,比如让AI帮助用户能够自动开会,自动参加会议,甚至不需要你本人来听,我帮你听,会后帮你总结、生成摘要、发送文件,甚至会后可以通过问答的形式直接从文字中提炼答案。

所以虽然这是一个小小的耳机,因为有了AI的嵌入,耳机变成用户的超级助手。当然,将AI Agent植入耳机还需要一个过程,未来智能的做法,是先做好做实一个个小场景需求,然后将这些场景Buff叠加,最终实现真正实用的AI Agent。

王松说的对么?

其实看到这个直播的内容,我还是有点熟悉的,因为我一直就是讯飞会议耳机的重度用户,从实时录音转写到翻译功能,再到不断升级AI功能,这款小小的耳机每一项功能设计都非常实用。

作为一个媒体人,讯飞会议耳机其实就是一个高效工作的秘密武器,它不仅更轻便,更方便,而且可以自动把采访内容转成文字,还会分清楚不同的采访对象说的话,甚至viaim AI会议助理可以对记录内容进行“摘要总结”和“待办事项”提取,最新版本甚至推出了全新的“智能询问”功能,只需语音/文字输入问题,viaim AI就能回答关于当前记录内提到的问题和扩展问题,快速获取到需要的会议信息。viaim AI就是一个显而易见的AI场景落地,带来了赤裸裸的生产力提升。

所以王松说的还是非常有道理的,基于自己的商业模式,在一个领域进行聚焦和落地,也是一个非常现实且有效的路径。讯飞会议耳机虽然叫会议耳机,但实际上是适用于任何语言交流和需要文字整理的场景的,当然不管是采访还是谈判,大概都可以归纳在会议这一类中。

除此之外,同传听译和面对面翻译功能也是出国与国际友人对话的利器,外国人说的话会直接翻译成中文出现在你耳机里,而你说的话则会被翻译成文字显示在手机上,科幻电影中的场景终于到今天被科技实现了。这其中支持了32种语言,12种方言和10种行业术语甚至还有两种少数民族语言,对于商务人士来说,这可能是另一个AI带来的重要刚需场景落地。当然,这背后也都是讯飞多年来在AI领域深耕带来的成果。

语音说,属于AI时代的交互方式

未来智能核心团队在AI领域深耕多年,在语音识别、语音转文字、实时翻译等领域都有着非常领先的水准。未来智能公司从建立之初,就聚焦于智能办公场景,非常针对性的进行相应的功能开发,逐渐成为该领域的行业领军企业,产品也得到了广大消费的认同。而人工智能大模型的诞生更为未来智能产品插上了腾飞的翅膀,viaim AI会议助理成为AI Agent领域最具实用性和落地性的产品突破。

现在,使用讯飞会议耳机就可以带来非常直接的工作效率上升和工作强度下降,它掀开了AI时代的一个小小的序幕,更多人通过这款产品才真正切实体验到AI的能力和价值。

在王松的直播中,还提到了一个观点,OpenAI的联合创始人,特斯拉autopilot的主要的技术负责人之一,在推特上表示,未来的computer2.0的架构,可能没有OS的概念了,就是一个神经网络。可能就是一个球,大家跟它对话就可以了。这一点相信喜欢钢铁侠的朋友也不会陌生,贾维斯在电影中的形态就是这么一个能量球,不过它在蜕变成幻视的时候,还是有了一个躯壳。不过它的对头另一个人工智能奥创就更典型一点,它存在于各种不同的设备之中,并不需要一个固定的形态,虽然为了电影好看,也给他做了一个机器人的身体。

这就意味着,之前人们熟悉的电脑键鼠交互和手机触屏交互可能会真正让位于语音交互,而电脑和手机这样的产品也会有全新的形态,而仔细思考下来,讯飞会议耳机这个抢位倒是有些直击本质,毕竟没有什么比一个小小的耳机更方便随身携带和进行交互了,至于说显示设备,完全是可以共享的。

现在,通过viaim AI的智能询问功能,你可以语音向viaim AI提问,viaim AI能快速回答你所需要的信息。未来,走到酒店,打开联网的屏幕,直接用耳机下命令,也许就能完成大部分的工作和娱乐,这一天恐怕并不会太遥远。只不过那时候的耳机可能也会有全新的形态,甚至自带全息投影的屏幕也不一定,按照这个方向思考下去,这个全新的智能时代还真的让人倍感期待。

AI发展到现在,一场“未来”淘汰“传统”的战争其实正在进行中。讯飞会议耳机已成为爆款产品,进入了大众消费市场。在今年618大促中,讯飞会议耳机不仅实现了连续3年销售额同步增长3倍+,保持了会议耳机品类销售额冠军地位,还在代表行业的蓝牙耳机或影音耳机大类目中,销售额进入第一梯队,在天猫和抖音平台位居TOP4。AIGC智能耳机正在快速普及,这也是证明了AI,正在驱动未来。

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)