时隔四年,中国科技行业年度盛会——百度世界大会,终于真正意义上回归了线下。
2023年10月17日一早,我从亦庄出发,乘坐网约车,跨越52公里,来到首钢园,参加2023百度世界大会。
十几年前还在我上学的时候,就每年关注百度世界大会。在办会之初,百度世界大会就不仅仅是百度的一个活动,更是行业的一场思想盛宴。
与此同时,百度世界大会还是一场前瞻行业发展趋势的大会。举个例子,现在互联网行业最火的概念无非就是“人工智能”“大模型”“自然语言生成”“机器学习”等等,早在2015年的百度世界大会,百度就发布了对话式人工智能秘书度秘,这款产品通过语音识别、自然语言处理和机器学习,让用户可以使用语音、文字或图片,以一对一的形式与度秘进行沟通。后来,很多对话式的数字人产品,都学习了度秘的产品形态。
今年的百度世界大会,处在特殊的历史时期,受到了更广泛的业界关注。奥运冠军全红婵等跳水明星的登台分享,更是将大会气氛推向了高潮。
在大会上,百度掌门人李彦宏宣布文心大模型4.0正式发布,开启邀请测试。李彦宏认为文心大模型4.0是迄今为止最强大的文心大模型,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着显著提升,综合能力可以媲美GPT-4。
可能是现场座位数量有限,有很多媒体人没来。有一位没有入场参会的媒体朋友找我,希望我能帮忙总结下这场大会的亮点,以及行业意义。我爱莫能助,因为2023百度世界大会的信息量太大了,涉及了方方面面的内容,很难“总结出来几条亮点”。况且,详细的媒体报道,早已经铺天盖地。
我仅仅把我感兴趣的几个维度提炼出来,分享给了这位朋友,现在也给大家分享出来。
1、文心4.0是重中之重 生成视频前景无限
今年的大会有什么重点?文心大模型肯定是重中之重。我和那位朋友说,文心一言的发展速度超越预期。可以横向对比一下ChatGPT,ChatGPT从成立到4.0推出,用了好几年时间。而文心一言虽然有百度AI多年的历史积累,但从推出到现在,达到媲美ChatGPT的水平,只用了半年时间。
我自己做过测试,至少在中文的语言环境下,文心一言表现力不弱于甚至超过了ChatGPT。
我还注意到,李彦宏在演示文心大模型应用时,不再播放提前录制的demo,而是现场演示。这体现了百度对自身技术的高度自信,从效果来看,确实超越预期。
在现场,李彦宏提出了一个关于买房的问题,还故意把问题逻辑顺序搞乱,全场担忧:厂长会不会就此翻车?
他的问题是:“我想回承德买房,能用公积金贷款吗,手续怎么办?我在北京工作。”这个问题,表述不清楚,前后文顺序搞混了,但文心一言针对这个问题还是有利具体的回答。此举,赢得了现场阵阵掌声。
这一次文心大模型升级为4.0,文心一言多项能力迎来大升级。其中,最吸引我的,是它生成视频的能力,这是一大突破。我想,如果这项能力继续升级,将会对当前的短视频时代带来巨大影响,任何人都可以把AI生产的视频内容,发布到抖音、视频号、快手等平台,大大提升了信息传播的力度和广度。
2、百度的数字人已经做到了以假乱真
在大会开始之前,我先和老马等朋友到展区进行了参观。在百度电商的板块,有个电商直播的展台。有人可能纳闷,直播带货,这是当下最烂大街的商业模式,为何也要展出?
那么,先请大家看这张图片,看出来有什么问题吗?
再仔细点,还没发现吗?我揭晓答案吧:图片中卖衣服的女孩是数字人!
她的肢体动作、脸部表情、嘴唇发音,甚至和网友的互动等等,都是通过百度AI技术实现的。整个动作表情很协调、很自然,至少我是看不出和真人有啥区别。
看到我一脸不相信的表情,百度展台一位戴眼镜的小姑娘给我解释,用百度AI进行数字人直播带货,只需简单几步,耗费几分钟,就可完成数字人直播间的制作。
具体来说,就是先找一个真人,录制几分钟形象,简单设置几步,构建数字人形象。然后给这个数字人接入百度AI,打通剧本、商品、问答能元素,商品可以是百度商品也可以是第三方商品。具体在实践中,也可以根据场景需求,用AI替换直播间背景。
我在想,像李佳琦和董宇辉这样的优秀主播,如果他们也能化身10个、100个、1000个数字分身,就可以同时带货更多商品,更大程度上助力中国商品经济的发展和流通。
百度的数字人产品,很可能带动百度实现新的增长。
3、全红婵引爆全场 直言百度AI是半个教练
2023年10月17日,大约在上午11时许,中国国家跳水队教练、奥运五金王陈若琳,奥运冠军全红婵、陈芋汐、王宗源惊喜现身会场。
每个人登台时,会场报以掌声欢呼。其中,全红婵稚嫩且紧张的发言赢得了全程最为热烈的掌声。她说:“百度的AI跳水辅助训练系统可以及时回放、打分,平时训练我会用它来抠动作细节,也相当于我的半个教练。”
事实上,中国国家跳水队与百度的渊源由来已久。陈若琳在现场表示,中国国家跳水队与百度从2019年就开展了深入的技术合作,携手走过了东京奥运会、福冈世锦赛、杭州亚运会等多个大赛。目前正在备战明年巴黎奥运会。“感谢百度一直以来提供的技术支持与服务,未来双方将携手持续用人工智能技术帮助跳水队智能训练,通过科学训练提升竞技水平。”
其实,百度AI助力中国体育赛事还有其他案例值得一看。我之前写过《互联网企业助力北京冬奥会:阿里后端保障,百度AI抢镜》,提到有了百度的AI技术,一切看不懂都将成为“哦,原来如此”。就以谷爱凌的大跳台为例,百度智能云通过“3D+AI”技术打造出“同场竞技”系统,将单人比赛项目变成“多人比赛”,实现了冠、亚军比赛画面的三维恢复和虚拟叠加,方便观众通过一个赛道看到不同选手的实时动作。
同时,通过技术手段对运动员动作进行量化分析,将滑行速度、腾空高度、落地远度、旋转角度等一系列运动数据与原始画面叠加起来,这样普通人都有了裁决胜者和分数的能力。
4、大模型有望重塑所有业务 以百度网盘为例
有人说大模型的发展会颠覆甚至取代现有的一切应用,我说也可以改变和重塑现有的一切应用,让现有的一切变得更好,使用效率更快。
李彦宏也说,大模型时代的AI原生应用不是对移动互联网App和PC软件的简单重复,而是要能解决过去解决不了或解决不好的问题。
大模型到底如何重塑现有应用和业务?还是以我常用的百度网盘举例吧。
我是百度网盘的超级重度用户,这十多年来我的百度网盘空间已经填充了6.7T的内容,其中仅仅照片就有超过10万张。随着照片的增多,查找照片成为一件极其困难的事情。
在以前,如果我要找一些某年某月去某地玩的照片,就需要打开网盘的照片类目,辛辛苦苦找寻。有一次,为了找一张十年前参加活动的照片,耗费了好几个小时。
现在好了,用了AI大模型,直接输入相关词汇(哪怕是一个模糊的词汇)就可以找到所需要的照片。比如我要找2021年在河北旅游的图片,我要找证件照,直接输入词汇,就可以出结果,比我自己人工找寻,效率快了何止10倍?
当然,除了找图片,也可以用这种方式找视频。
按照百度的介绍,这个云智能助理“云一朵”,实现从图形界面交互到自然语言交互的转变,增强了多模态信息理解,找图片找视频只是小儿科技术,还能对视频精准定位、一键总结视频内容、提炼金句。
写在最后:AI技术,势不可挡。百度作为行业的先行者,能做的还有很多,我们拭目以待。