天极大咖秀

登录 | 申请注册

读懂NotebookLM,或许能治愈AI应用缺失症

脑极体 2024-12-16 阅读: 689 次

中国的AI圈,有一种根深蒂固的顽疾,我们可以称之为:AI商业化恐惧与AI应用缺失综合症。

具体表现为,一种AI技术爆火之后大家先是惊叹,什么“人人都被AI创飞了”之类的。紧接着,在这条赛道真正热起来之后就会转变为质疑:你做的AI能商业化吗?为什么AI还是没有超级应用?为什么我还是没有用到AI应用?

似乎AI总是在对技术的巨大期待,以及对应用的不断失望间轮回。大模型是真的雷声大雨点小,很难带来高增长、有商业化能力的应用吗?

最近外网一款应用的火爆,让我们有了些新的想法。不久之前,NotebookLM的核心团队离职引发热议,团队负责人Raiza Martin宣布将和核心设计师、工程师一起离职,准备打造新的大模型应用。这一消息引发讨论的原因在于,NotebookLM是今年欧美最出圈的大模型应用之一,甚至它出圈的原因根本不是作为AI笔记本的基础功能,而是一个尝鲜类的附加功能——AI播客生成。

透过NotebookLM的爆火,我们可以由此聊聊AI+声音方向的商业化可能性,以及究竟应该如何打造具有高增长潜力的AI应用。

或许可以说,越来越多的热门应用正在证明,AI应用缺失症是能够被治愈的。

NotebookLM原本是谷歌一个小组打造的AIGC写作工具,在全球有非常多的竞品,并且已经推出了几年时间都没有什么水花。但最近让这个看似比较平庸的应用突然爆火的,是它添加了一项功能:播客生成

更新后的这一功能,允许用户上传文档、文本、网页以及YouTube视频来生成由AI制作的音频播客。与其他音频功能不同的是,NotebookLM生成的不是那种照着文本念出来的简单播客,而是有两个主持人的对谈型播客。

AI生成的两位主播,会根据素材提供的内容进行分析、讨论,甚至会相互调侃,还能进行大笑。比如说,如果你输入一本历史类书籍,NotebookLM就能生成多集的历史解密类对谈播客。如果输入自己的资料,它也能生成两位AI主播对你吹彩虹屁的聊天内容,他们有理有据,一本正经地分析讨论你有多么了不起。

这种新颖的内容生成模式给了网友极大的创造和收听动力,玩出的花样也越来越多。甚至有人认为,这可能是第一款不是由于模型能力,而是通过应用体验获得认可的AI。

而在NotebookLM背后作为支持的,是谷歌的Gemini 1.5 Pro大语言模型。它能够一次处理多达1500页的内容,并且支持超长上下文的多轮对话。NotebookLM的音频功能则是基于谷歌的语音模型来实现。

到这里我们会发现,NotebookLM是一个标准到不能更标准的AI原生应用。它基于多个大模型来实现;利用了AIGC和多模态这些非常具有代表性的AI机制;创造了传统移动应用完全无法实现的服务体验。

由此可见,只要做对能力,找准市场,AI应用是完全有可能撑起流量和商业化场面的。

当然,NotebookLM取巧的一点在于它的市场切入点非常精准。播客在美国的市场需求量非常庞大,甚至大有超越短视频的态势。美国用户,尤其是年轻用户大多有收听播客的习惯,而明星、运动员、脱口秀演员也普遍将录制播客作为表达方式。

在这个关注度高、需求量大的市场上,AI带来了两人对谈播客这种前所未见的应用体验,这才让NotebookLM在几个月内爆火出圈。

如果仅仅关注AI播客生成这件事,那么NotebookLM所代表的意义或许会被裁剪掉很多,首先播客市场在国内还远不如欧美火爆,其次AI播客生成的商业化潜力本就有限。

想要深度利用NotebookLM的意义,首先应该看到其所代表的AI音频赛道本就有着更为宽阔的商业化空间。对于AI行业普遍存在的商业焦虑,AI+音频至少是一种纾解。在生活中大量太长不看的内容,都可以通过转换为音频的方式来提升触达效率。比如在谷歌内部,谷歌广告团队就在研究基于NotebookLM的生成能力来打造销售问答,从而对新人进行培训。这样原本厚重的资料,就可以被模拟成销售人员与顾客之间的对话,新入职的销售可以直接学习与顾客进行交流,每个问题应该如何对应、解释等。

类似的例子还有很多,比如产品说明书的音频版、在线教育的问答机制。我们在很多时候都会面临资料太多,过长不看的窘境。这时我们往往会想要跟懂行的人问上两句,而现在问AI或许就可以了。

推而广之,NotebookLM还可以跟机器视觉进行结合。比如去健身房,私教的工作其实就是看着你训练,然后指出动作的正误,回答健身者的问题。如果让NotebookLM附带上视觉能力,或许AI播客可以变成AI私教。

这些探索证明,一个出圈的AI应用往往具备连锁反应。它不仅能够在本圈层得到用户的追捧,同时还具有持续扩散商业影响力的可行性。

即使你不听AI播客,也对AI音频赛道毫无兴趣。NotebookLM也依旧展示了优秀AI应用最底层的东西:输入简单,生产惊喜,贴近用户。

如今,大模型已经能做到很多前所未见的事,但总是无法出现那种能够引发讨论和传播的爆火应用。NotebookLM的火爆告诉我们,其中很大原因出自产品设计的缺失。

与其他AI应用相比,NotebookLM在产品层面有一个鲜明的特点,就是整体UI设计尽量倾向简单。AI播客生成本身只是NotebookLM功能的一部分,用户打开门槛天然较高。在这种情况下,项目团队对其整体UI都进行了尽量简化。比如上传文档是很多AIGC应用都有的步骤,但上传文件的步骤琐碎、容错度低,往往会给用户带来不悦的产品体验。NotebookLM则支持一键上传源文档,并且可以覆盖文档、视频等多种文件源与文件格式。这种非常友好的用户界面设计,让这种创新型的AI应用拥有了极低的门槛。用户不会在UI层面就被琐碎的操作、复杂的文件要求给劝退。

而与输入端尽量简单构成正比的是NotebookLM在输出端给出了非常完整且复杂的内容。用AI生成播客在今天已经不太新鲜,但NotebookLM能够生成两人对谈播客,并且对谈内容是有语气、有节奏,甚至是富有幽默感的。这种惊喜感和意想不到,与极简的内容输入构成了对比,进而变成了能够出圈的产品动力。

除此之外,NotebookLM的成功还有一个关键因素,就是它找到了播客这个在欧美颇具市场号召力的领域。正是因为播客本身有市场需求,受关注程度高,NotebookLM带来的AI惊喜感才能顺理成章激活用户认同。而且NotebookLM又一次证明了,寻找更能接受AI的年轻人认可,贴近年轻市场的生活、娱乐、消费模式,是AI应用能够成功的关键。

总结NotebookLM的故事,可以发现一款成功的AI应用需要具备三要素:

1.极简的用户界面与生成规则。

2.具有惊喜感与震撼力的AIGC效果。

3.贴近用户注意力,尤其是年轻人注意力的市场落点。

从大模型的能力出发,寻找到这三个条件,应该就能勾勒出差不多的AI应用了。

所谓AI应用缺失症,从正面看是一个巨大的问题,反面看则是很多个具体的机会。

脑极体
从技术协同到产业革命,从智能密钥到已知尽头

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)