你喜欢的网络小说,一直没有转换成有声读物?
先来看两组数据:第六届中国网络文学论坛曾经公布一组数据,2020年全国网络文学网站超过550家,作家1750万人,网络小说2500万部;参考头豹研究院的调研,58%的有声阅读用户希望提高音频质量,比“减少广告推送”、“丰富品类和内容”分别高出6.9%、8.5%。
换言之,以当前有声阅读产品的形态,听感这一关还没过,如何能够提升产量?
现在网络阅读平台上有两种听书模式,一种是机器为主,直接将文字由AI转为语音;一种是人力为主,由配音演员录制。前者可以转化所有小说,但情感不足,不够生动,收听体验有待提高;后者情感充沛,体验较好,但成本高,数量受限。
那么,是否有将机器和人优势结合的方式,实现数量和质量的二合一,最终达到省时、省钱、省事的目的?
近日,腾讯PCG AI交互部旗下的音视频创作平台——声咖,发布了AI 有声小说配音功能,机器的低成本、高效率与“人声”的充沛情感、高质量融合在AI下,成为首款针对有声小说配音的AI制作平台。
技术声优时代,即将到来。
1.效率风潮
这两天,李念(化名)将好不容易凑齐的专业录音设备挂到了闲鱼上。
2018年大三时,没了繁重课业负担的他开始网络创作。一方面在晋江平台发布网文作品,一方面录制相关有声小说。在言情小说的圈子,也算小有名气。
刚开始,他的精力集中在文字创作上,后来,投入经费将宿舍改造为录音室。很快,李念意识到了问题。话筒、耳机、放大器、监听音箱……设备还没全部到位,已经花了超过10000元,而他平时创作使用的电脑,加上鼠标、机械键盘、外接曲面屏显示器,一共也不到8000元。
“录制有声小说的投入产出比很低。”只是贵了点,李念也就忍了,可是配音需要大量的练习与试错,逐渐侵占他文字创作的时间。能赚钱的没时间安排,不赚钱的还要继续搭钱,在这样的困境中挣扎了四年,他还是放弃了。
配音的确门槛很高。传统录制场景中,配音员是关键因素,录音设备是必备条件,汇集两样外部资源后,经过角色分析、内容录制、后期剪辑等全制作周期,才能产出优质作品。解决这些问题对专业人士也是挑战,何况李念这样的“门外汉”。
而像李念这样的内容创作者们,是有声小说的重要来源之一。录音设备昂贵、制作周期长的高门槛,“拦住”无数参与者们,直接导致有声小说的产出效率过低。在以配音员为核心的生产模式下,提升产量的方式是找到更多人,谈何容易?
如果找不到那么多人,通过技术手段在网络空间实现功能虚拟化,能否解决这些问题?
之前,有企业借助AI的TTS技术,将文本文案转制为声音文案,比如讯飞快读、配音娃、配音员吧等应用,在一定程度上缓解了有声文本对配音员的依赖,降低了制作成本。然而段落切分与主要角色识别的问题,仍然需要众多人力实现。
眼下,腾讯PCG AI交互部将所有问题汇总后,给出了进一步的解决方案。
“技术手段确实提升了效率。”接触到“声咖”之后,李念对各项功能进行体验。在后台自动完成“AI配音”基础上,他还能手动调节停顿、语速以及词组连续性,朗读更加流畅自然,情绪也更加饱满。
在这些功能帮助下,AI配音不再是过去的文字“流水账”,而是变为一种能够理清主线,区分角色,合理表达情感的定制化流程。这为有声读物摆脱了对人的高度依赖,告别产出难题提供了极大的想象空间。
这样看来,在有声读物领域,声咖正在卷起一场技术引领的效率风潮。
2.“729”成全民标配
只要有效率,所有问题都能迎刃而解吗?未必,这一点在广播剧《三体》上体现得非常充分。
在原创小说大获成功后,喜马拉雅开始策划制作广播剧。一经发行,即获得众多原著粉的追捧。有统计数据显示,截至2021年中旬,《三体》六季广播剧播放量超过7070万次,超过227万人订阅专辑。
《三体》广播剧的成功离不开原著精彩的故事,更少不了幕后精心制作。制作方邀请了729声工场参与制作,专业声优对剧情、人物、感情的理解非常深刻,且拥有高水平的演绎技巧,这是吸引用户的关键。
然而专业的背后,是全剧高昂的制作成本,以及漫长的制作周期。千万级的投入,叠加长达数年的录制,天然决定着有声精品的产量不会太高。精品需要由专业的配音员,用更长的时间打造,他们具有不可替代性。
“声音是一种触觉,帮我们打开更加性感的文学维度。”正如北京大学中文系教授邵燕君所言,用户需要的不只是“声音填满碎片化时间”,还有更加优质的听觉体验。
对于这个问题,声咖也给出了解决方案。它采用跨说话人风格的迁移技术,形成了多情感、多方言配音员的音色模型,这些模型使用层级VAE (Variational Auto-encoder,变分编码器)编码语音中的韵律信息,解耦其中的音色和韵律信息,让声音有了性格。
目前,声咖能模拟几十种小说配音员,具备浑厚、磁性、温婉、亲切、成熟等不同的音质,能够讲出东北话、陕西话、四川话、天津话等方言,表达开心、愤怒、悲伤、惊讶、恐惧、厌恶等6种情绪。
同时,声咖还能够智能识别全文角色,并将这些不同的声音分配给不同角色;此外,通过技术能力识别文章中对话的说话人和情绪,进而实现多角色、多情感的合成,进而实现效率、高质二合一。
更为突出的是,声咖全线功能限时免费,辅以更加友善的操作界面与强大的计算能力,冲破原本束之高阁的专业壁垒。
“一千个读者眼中就会有一千个哈姆雷特”,如今创新技术给了他们机会,创造最符合他们想象的有声读物。
3.“声音自由”
每当出现一款热门作品,发行部门总会尽快协调资源,尽快填补门类空缺,以覆盖更多用户的体验诉求,有声读物是其中重要门类。
现实中并不缺少成熟案例。以热门IP《斗破苍穹》为例,2010年该作品一经发布就获得了众多读者的追捧,热度始终不减。随即,发行方推出有声读物,同样获得理想成绩,参考网络来源的数据,《斗破苍穹》站内播放量累计已超过10亿次。
某种意义上,网络文学已经超越了作者写作、读者阅读的“产出-供给”短线关系,形成了平台方集合各类资源,围绕成熟IP进行长周期、多品类开发,满足多元需求的价值体系。换言之,只要作品质量上乘,就能在平台见到相应有声读物,唯一的问题就是时间。
当一个市场成长的动力,不是企业在前面拉,而是需求在身后推,快速发展是必然的事情。正如某研究院的观点,部分上游出版企业和音频制作企业逐步向中游有声阅读业务渗透,产业链上中游呈现一体化发展趋势,行业将迎来快速发展期。
任何一个产业的快速发展,都离不开生产工具的迭代,对于有声小说来说,依靠爱好者、配音公司的纯“人力”生产模式已不再匹配行业发展的需求,“人力+AI”是大势所趋,各种AI工具的出现让有声小说内容创作者们离“声音自由”更进一步。而对于声咖来说,它的价值从来不是“小众圈子的玩具”,而是实现“声音自由”的生产工具之一。
4.结语
某种意义上,腾讯PCG AI交互部的“声咖”有声小说配音功能,是一次AI在垂直行业的探索。在“耳朵经济”需求,内容产出不断,以及AI降低制作门槛下,有声小说从小众到大众还有多远?
水大才能鱼大,当上游“开闸”,有声小说产业链上的版权方、平台方、用户,都将从中受益。