天极大咖秀

登录 | 申请注册

AIGC启“元”,百度展开“宏”图

曾宪勇 2023-01-11 阅读: 7,944 次

文|曾宪勇

“随着技术应用门槛不断降低,创造者们将迎来属于人工智能的黄金10年。”站在聚光灯下的李彦宏并不吝惜将“黄金10年”这样的桂冠放置在人工智能的头顶。

2023年1月10日,在百度2022 Create大会上,百度创始人兼CEO李彦宏发出这样的断言,“未来十年,AIGC将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成AI原创内容。”

AIGC元年的疯狂与躁动

将2022年称为“AIGC元年”并不过分。

简单而言,“AIGC”即人工智能自动生成内容(Artificial Inteligence Generated Content),其被认为是继专业生产内容(PGC)、用户生产内容(UGC)之后的新型内容创作方式。

2022年4月8日,人工智能实验室OpenAI发布了 DALL-E 2,它能够将文字描述的场景转换成无数风格的视觉画面,继而一夜爆红。

6月7日,在中国高考首日,百度数字人“度晓晓”仅用一秒钟便按照全国新高考作文题《本手、妙手、俗手》的要求写出来一篇议论文,知名语文老师为之给出48分的成绩,该成绩轻松赶超75%的高考考生。

7月21日,百度世界大会,AI仅仅耗费一秒,便当众复原了元代画坛宗师黄公望的传世名作《富春山居图》残卷,艺惊四座。

百度借助AIGC补全《富春山居图》残卷

8月,在美国科罗拉多州新兴数字艺术家竞赛现场,一幅名为《太空歌剧院》的获奖作品再次提升了世界对AIGC的关注度。

年仅39岁的创作者对借助AI自动生成的约100幅图像进行微调,经过约900次迭代,再经过约80小时的PS修饰,最终完成了这幅画作,并一举摘得该赛事数字艺术类的桂冠。

因AI介入而备受争议的获奖作品《太空歌剧院》

不过,该幅作品的AI制作手法一经公布,也在现场及互联网上引发了激烈争议。

部分网友和画师群体认为AI绘画的介入对于绘画比赛而言等同作弊,而赛事评委则表示不会改变评审结果,因为这幅作品完全符合竞赛评判标准——“有故事感,也有灵魂”,他们在评审时丝毫意识不到AI的介入。

“我们正在目睹艺术的消亡。”一位业内人士为此发出这样的感叹。

8月22 日,人工智能公司Stability AI公开推出一项新的AI文生图模型Stable Diffusion(扩散模型)。人们只需要在最基础的终端设备上输入简单的关键词,就能生成高质量的AI图像。这一结果几乎让整个世界为之疯狂,同时也让传统艺术家们感到强烈的担忧。

“我相信AI绘画无法完全代替整个人类,但是……它可以替代我。”一位网友的危机感引发了民众的普遍共鸣。

11月30日,OpenAI发布了自研的聊天机器人——ChatGPT,引发全球注册热潮。上线 5 天后,注册人数便突破百万。当年为了完成这个数字,推特用了整整两年……

72年前,“人工智能之父”图灵曾经在其《机器能思考吗?》一文中提出“图灵测试”。他认为,当人类无法判断屏幕的另一侧坐着的究竟是人还是机器时,便意味着机器具备和人类一样的智能……

很显然,今天的人们已经体验到了这样的一种“可怕感觉”。

2022年12月16日,当美国《科学杂志》发布“2022年度科学十大突破”榜单时,AIGC赫然在列。

敏感的人们已然产生一丝猜想,国内AIGC行业爆发的前夜或已来临。

AIGC崇尚“长期主义”

从1997年IBM借助超级计算机“深蓝”战胜国际象棋冠军卡斯帕罗夫那一刻开始,到2016年AlphaGo击败围棋世界冠军李世石,AI与人类的两次伟大对决间隔了足足20年。

从此,全世界都在思考AI的未来。众多的传统内容创作者开始忐忑,自己的饭碗是否会被这些虚无缥缈的数字人们打翻在地?

不过,Gartner给出了一个数字——预计到2025年,生成式人工智能将占所有生成数据的10%,而目前这一比例还不到1%。

2023年1月10日,在百度新近举办的2022 Create大会上,百度创始人兼CEO李彦宏明确表示,“深度学习算法这个技术能够带来的效率提升、能够驱动的经济增长,是比很多人想象的要更大的。与深度学习相关的重大创新,包括自动驾驶,也包括水电能等领域的智能调度系统。它们的应用会像汽车、互联网这些发明一样,产生重大社会影响,是重大创新。”他将深度学习算法作为产生第四次科技革命的重大标志。

李彦宏用一个实验故事来帮助公众加深对“反馈驱动创新”的理解。科学家曾经做过一个思想实验:把魔方打乱,交给一个盲人还原,假设盲人每秒转动一次,他需要多久才能将魔方复原呢?答案是137亿年。但如果盲人每转动一次魔方,就有人向他做一次反馈,告诉他是更接近目标了,还是更远离目标了,盲人需要多久能把魔方还原?答案是两分半钟的时间!没有外部反馈的时候需要137亿年,能及时获得反馈的时候只需要两分半钟,这就是反馈的神奇力量。

虽然反馈可以加速和驱动创新,但AI加持下的创新也并非可以须臾而成。

站在聚光灯下的李彦宏回忆自己2000年回国创业后一度遭遇的互联网寒冬。在互联网泡沫破裂,全世界蒸发了8万亿市值之后,很多人被困难动摇了信心,选择放弃、选择离开。最后,反而是那些坚持挺过寒冬的人,成就了互联网发展的黄金十年。

很显然,今日的李彦宏仍然在坚持着一种“长期主义”。

只有偏执狂才能生存

英特尔公司创始人安德鲁·葛洛夫在其所著的《只有偏执狂才能生存》一书中表示,战略转折点就是企业的根基所在即将发生变化的那一时刻。这个变化有可能意味着企业有机会上升到新的高度,但它也同样有可能标示着没落的开端。

当战略转折点席卷某一产业时,原有工业结构中的成员越是成功,其深受变革带来的威胁则愈大,而同时其本身也越不愿实现自我改变。而抓住机遇、最先作出反应的公司越容易战胜对手。

在时代给予的“10倍速变化”面前,企业领导者往往只有依靠感觉和个人判断作为决策指南。

幸运的是,坚持长期主义的李彦宏已然意识到了这一点。

在李彦宏的AI词典中,技术架构越往下越通用,越往上越专用。更通用,意味着不断降低行业使用技术的门槛;更专用,则是深入产业去深化应用。

为了战胜对手,变革者需要更多考虑的是如何为客户带来实质性的好处,如何为行业带来更高的效率。

在AIGC产业,百度同时拥有领先者和挑战者的两面性。

2022年12月27日,百度智能云发布国内首个全栈自研的AI基础设施“AI大底座”。百度集团执行副总裁、百度智能云事业群总裁沈抖表示,百度智能云已经可以标准化输出AI的底层能力,帮助企业真正降本增效。

百度文心大模型的内容生成能力,极大地促进了AIGC的发展。

如果用电影创作来描述AIGC的技术本领,那么不妨做一个形象的比方。AIGC的创造团队不但有编剧、导演、演员、摄影师,还有剪辑师、美术师等角色。

文心ERNIE 3.0 Zeus是一位天才编剧。这个模型不但能够学习丰富多样的百科、小说、新闻、戏剧、诗歌等无标注数据,还可以融入知识图谱以提升学习效率,使模型自身能够实现多种语言理解和生成任务。

笔者通过百度文心一格生成的作品《草原·车行》

文心 ERNIE-ViLG 2.0是一位美术师、插画师。它能根据对用户的一句话或者一段描述文本进行理解,几十秒内就可以生成媲美人类作画水平的图像,而且可以同时生成数百张风格各异的画作,比如写实、意象、中国风、二次元等等。

除此之外,文心大模型还拥有视频内容生成与编辑技术,它们相当于剪辑师和动画师。模型借此可以根据用户提供的一段描述文本或一幅图像,自动地生成高清、流畅的视频,提升视觉内容生产效果和效率。

在视觉编辑方面,文心大模型可以通过对超分辨率、去噪、去模糊、去压缩等多任务的联合预训练,同时实现对多种不同情况的修复和编辑,并通过画质提升、边缘锐化等方式增强视频的清晰度,达到全方位提升视频编辑效率和观感体验。

举个应用中的实例,以前老电影胶片的修复需要人工手动一帧一帧地进行修复,现在使用百度AI大模型则可以大幅提升修复效率,每天单机可修复视频28.5万帧,解决了绝大部分画面的修复问题。即便是需要进一步精修,AI修复速度也能提升到人工修复速度的3-4倍。

AIGC将颠覆内容产业

在这个超级竞争的世界中,一旦出现技术革新或者有其它根本性的变化,机遇就会随时敲响领先者的大门。

在李彦宏看来,AIGC将走过三个发展阶段:第一个阶段是“助手阶段”,AIGC用来辅助人类进行内容生产;第二个阶段是“协作阶段”,AIGC以虚实并存的虚拟人形态出现,形成人机共生的局面;第三个阶段是“原创阶段”,AIGC将独立完成内容创作。

AIGC是PGC、UGC之后全新的内容生产方式。它不仅会提升内容生产的效率,也会创造出有独特价值和独立视角的内容。

相对而言,PGC模式虽然生产质量有保证,但行业门槛较高,生产周期较长,涉及环节较多。UGC模式虽然降低了生产成本与中心化程度,但产品的质量往往最终参差不齐。AIGC则可以有效地在产能和质量两者间进行平衡和兼顾,属于未来内容生产的一大方向。

据金融服务商国泰君安预测,未来五年或将有10%-30%的图片内容由AI参与生成,相应或将产生600亿以上的市场规模。

为了迎接即将破壁而出的巨大市场,百度也为整个AI行业做好了人才储备方面的准备。

“三年前,我们宣布五年内为社会培养500万AI人才,目前已培养了超过 300万。未来,百度会投入更多资源,与各位开发者们一道,为中国AI的发展尽我们最大的努力。”李彦宏表示,百度已经与全国 100 多所高校进行深度人才培养战略合作,共同培养创新实践型AI人才。

相比PGC和UGC,AIGC的内容生产能力将呈现出指数级的提升。因此,很多人在担忧,未来世界或许会大量充斥着无法辨别真伪的海量信息,另外一个显而易见的担心则是,人类的价值迟早会被AI所取代,失业仅仅是一个前奏。

早在2018年,创新工场董事长兼CEO李开复便公开表示,在15年内,人工智能和自动化将具备取代人类40-50%岗位的技术能力。

不过,在笔者看来,未来人类的职责或许不是与AI竞争,而是将自己人类的习惯和认知通过某种方式输入到AI平台中,训练自己的专属AI助手,让不具备独立人格的AI了解人类,帮助自己实现以往无法实现的梦想,这才是人类的真正价值方向。

笔者一幅AI自画像《午夜书房中的男子》

做个或许不是很恰当的比喻,通过人类的提前设定,AI与人类之间的关系恰如病毒与人类之间的关系。失去人类这个“宿主”,AI会彻底“失业”,直至失去生存价值。

“反馈驱动创新”,如果将AI视为李彦宏所讲述实验故事中的那位可以迅速将扭乱的魔方复原的盲人,将“魔方”视为AI成果,那么人类则是在盲人身边时刻提供正向反馈,最终共同获得真正创新价值的信息源头。

李彦宏亲自用百度AI生成的一幅绘画作品

没有热爱,是难以在长期枯燥的研究中坚持的,科学研究需要偏执狂的精神。

AI仍然是百度即将驶向的下一座灯塔坐标。李彦宏将一路拾起各种五颜六色的“魔方”,直至实现他的长期主义。(曾宪勇)

曾宪勇
“阿桶观察”自媒体平台为资深媒体人多年前创办,所发布平台包括微信公众号、雪球、博客中国、大鱼号、今日头条、企鹅号等十多个平台。

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)