天极大咖秀

登录 | 申请注册

2024 WAIC:出门问问开启AIGC人机交互新纪元

趣味科技 2024-07-08 阅读: 8,548 次

7月4日至7月7日,世界级 AI 科技盛会——2024 世界人工智能大会(WAIC)在上海举办。“AIGC 第一股”出门问问携 AIGC 艺术展、通用大模型「序列猴子」及其 AIGC 产品矩阵,包括 AI 短视频创作平台「元创岛」、AI 数字分身「奇妙元」、AI 配音助理「魔音工坊」、AI 数字员工「奇妙问」等多个 AI 应用亮相展会,为现场观众带来一场零距离、沉浸式的 AIGC 探索之旅。

出门问问成立于 2012 年,是一家生成式 AIGC 和语音交互为核心的人工智能公司,为全球多个国家和地区提供 AI 智能硬件、AI 政企服务,以及面向创作者的 AIGC 产品。出门问问以「Make AGI Accessible and AI CoPilot everywhere」为愿景,致力于打造国际领先的通用大模型,通过 AI 技术、产品及商业化三位一体发展,成为全球 AI CoPilot 的引领者。

AI短视频生成器「元创岛」:让科技与艺术深度融合

在世界人工智能大会现场,出门问问 AIGC 展区爆火,倍受行业人士与媒体关注,参观问询者络绎不绝,尤其路过出门问问的 AIGC 艺术展,很难不被大屏幕上播放的「 8 个小朋友的创作历程」所吸引。

这场主题为《萌芽》的 AIGC 艺术展,正是由出门问问和 8 位年轻的“艺术家”联合打造,他们之中年纪最小的 5 岁,最大的也不过 10 岁。小朋友用蜡笔画下了自己梦想中的家,而出门问问的AI短视频产品「元创岛」则将这些稚嫩、珍贵的笔触与 AI 结合,虚拟与现实交织间,一部部独一无二的动态艺术绘本就此诞生。

在孩子们的眼中,这次作画可能只是成长中一次不凡的创作体验,但他们的父母却激动不已,「元创岛」的出现意味着孩子们可以在游戏和艺术中有了更多的可能性,是真正能够寓教于乐的探索,代表了儿童绘本充满想象力的未来。被《萌芽》艺术展震撼的观众纷纷走到出门问问服务台,询问艺术展背后的故事与创作方式。

「元创岛」是一款 AI 短视频创作平台,依托出门问问自研大模型「序列猴子」,为创作者提供 AI 一键成片原创短视频,是基于出门问问多模态大模型的重磅产品。除了可以生成《萌芽》同款的儿童绘本,也可以快速生成小说推文、短剧引流广告、书单及歌单等短视频变现内容,是 AIGC 创作者进行艺术探索的不二选择。

3D 数字人打破次元壁,「奇妙元」改变直播行业

出门问问的 3D 互动展区,则是一个不一样的数字世界。身着动捕服的工作人员正以元气满满的舞步传递自己的热情与活力。旁边的显示屏上,一个栩栩如生的 3D 数字人正和工作人员同步跳着舞,动作流畅且自然,与另一边的真人别无二致。

这正是「奇妙元」对于3D 数字人直播解决方案最直观的效果展示,为 3D 数字人注入了生命的力量。它不仅可以提供全身动捕一体化解决方案,更以其海量的形象库、灵活的动作捕捉技术、个性化的定制服务以及强大的兼容性,赢得了市场的青睐。

「奇妙元」不仅仅是一个数字人直播平台,它更是一个全方位的数字人视频制作与直播服务提供商。在这里,用户可以根据自己的需求,选择或定制各种风格的数字人形象,无论是用于直播、视频制作,还是交互式体验,「奇妙元」都能提供一站式的解决方案。

数字人视频的制作,让内容创作更加生动有趣;交互式数字人的应用,让用户体验更加丰富多元;克隆与定制服务的推出,更是让每一位用户都能拥有独一无二的数字形象。

「序列猴子」+「魔音工坊」:多模态大模型让 AI 配音变得“更好玩”

作为出门问问的明星产品,「序列猴子」和「魔音工坊」的配合为现场观众带来了更多新鲜、有趣的玩法。

早在 2020 年,出门问问就已推出自主研发的通用大模型“UCLAI”,随后于 2023 年升级为「序列猴子」。「序列猴子」是一款具备多模态生成能力的大语言模型,模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D 内容生成、语言生成和语音识别等不同任务。后续,「序列猴子」又借助丰富的语音数据优势,迭代出国内领先的语音大模型,为后续产品应用提供了强有力的支持。

「魔音工坊」(海外版 DupDub)是一款全球领先的集文案、配音、剪辑全流程一站式 AI 软件。它拥有千款 AI 音色,全方言多语种,百变风格适合各类视频创作及配音场景的声音商店;独创的精准调音平台“声音的 word 编辑器”;以及含声音搜索,声音克隆、生成式 TTS“捏声音”等多种创造方式,总能找到最适合声音。依托序列猴子大模型,「魔音工坊」可通过 3-10 秒 的短音频,快速地实现声音克隆,并支持跨语言迁移、情感语气生成。其海外版 DupDub 还支持多语音音频生成,目前已涵盖英语、法语、日语、西班牙语、葡萄牙语、泰语等。

声音大模型与「魔音工坊」互相配合,并借助「产模结合」产生的飞轮效应进一步优化升级:一方面魔音工坊自身的用户数据昼夜不息地反哺着声音大模型的训练,另一方面,声音大模型让魔音工坊不断自我突破,有着“超写实”自然音色的惊艳表现,吸引着全球数以百万计的用户深度玩转。现场观众被对「序列猴子」和「魔音工坊」的展台所吸引,纷纷上前感受玩转声音的魅力。

此外,出门问问还带来了面向中小企业的数字员工生成平台「奇妙问」和智能穿戴设备 TicWatch Pro 5 Enduro。

好看的外表搭配动听的声音,搭载智能硬件的数字人,在大模型时代被赋予了高智商的大脑。出门问问在展区展出了「奇妙问」数字人互动大屏解决方案,带来了全新的数字人交互体验。该方案搭建基于「序列猴子」大模型,可自定义数字人人设、形象、声音、背景等,并支持文档上传、模型专属定制,只需轻轻一声,即可唤醒大屏数字人,开启专业互动问答。

出门问问还在现场展示了新一代的智能穿戴设备——TicWatch Pro 5 Enduro。TicWatch 采用谷歌 Wear OS 和高通骁龙平台,续航时长高达 90 小时,可全面追踪佩戴者的健康与健身数据,并提供详细报告。同时,在 AI 算法的加持下,TicWatch 变得更加智能,可带来更好的人机交互体验。目前,TicWatch 已覆盖全球 130 多个国家和地区。

截止目前,出门问问 AIGC 产品累计服务的用户数量已超 1500 万,注册用户数量超 1000 万,其中付费的用户数量约 86.5 万。未来,出门问问将持续升级大模型能力,深耕 AIGC 产品应用,为全球用户带来更好的服务与体验。

趣味科技
年度十大媒体人,十佳科技自媒体,美通社媒体传播专家

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)