天极大咖秀

登录 | 申请注册

李彦宏为什么说AI发生了方向性改变

摩羯商业评论 2022-11-14 阅读: 3,610 次

2012年,在第三届ImageNet 大规模视觉识别挑战赛 (ILSVRC)上,神经网络的坚守者Geoffrey Hinton和他的学生Alex Krizhevsky,所设计的基于卷积神经网络的AlexNet,以 15.3% 的低错误率赢得了挑战,这几乎是之前获胜者错误率的一半,而本届大赛亚军的错误率高达26%。

这场比赛后来被视为是AI发展史上的划时代事件,从那时起,几乎所有的计算机视觉研究都转向了神经网络,而在2012-2022的这十年间,AI已经无处不在,在历史上首次实现了让所有人而不仅仅是少数人或部分人类的生活和工作更好。

第三届LSVRC到今年正好十年,AI取得的成就自不必提,如何看待AI在未来大发展前景,科学家们似乎产生了分歧。

2022年3月,知名 AI 学者、Robust.AI 创始人 Gary Marcus,发表了一篇《深度学习撞墙了》的文章,他认为纯粹的端到端深度学习差不多走到尽头了,整个 AI 领域必须要寻找新出路。之后,Hinton 和 LeCun 都对他的观点发起了驳斥,由此更引发了圈内热议。

“恨铁不成钢”也好,“因相信而看见”也罢,这些处于理论研究一线的科学家们,自然有他们各自的道理。然而更应该引起重视的,其实是来自科技企业对AI进程的判断。

在11月9日举办的联想Tech World大会上,百度创始人兼CEO李彦宏就对此发表了自己的看法。他认为:

“无论是在技术层面还是在商业应用层面,人工智能都有了巨大的进展,有些甚至是方向性的改变。”

李彦宏已经不是第一次作出这个判断了。在2022年WAIC世界人工智能大会上,李彦宏也表达过这个观点。

李彦宏的这个判断值得重视,不仅是因为这是来自以AI为技术核心的科技公司创始人的看法,同样是因为这个判断似乎与论战中LeCun大神的观点趋同。LeCun 认为,深度学习并没有撞墙,但的确有一些障碍需要清除,而解决方案目前还不明朗。

显然,“方向性的改变”与“有障碍需要清除”的意思是接近的,因为目的都是排除障碍物的影响,至于排除影响的方式,可能是直接解构,也可能是绕过障碍另辟蹊径。

那么,LeCun与李彦宏的作出的这个趋同判断,到底是基于近年来的哪些科学理论与产业实践呢?

技术层面方向性的改变

自2012年第三届ILSVRC以来,因为都使用了深度神经网络,大赛的成绩每一年都实现了长足进步。

直到2016 年,在第七届ILSVRC 上,图像识别错误率已经达到约2.9%,远超越人类的5.1%,这也就意味着该竞赛已经完成了它的历史使命,失去了存在的意义,所以2017年ILSVRC就成为了最后一届。

然而,虽然ILSVRC不举办了,但AI的前进步伐并没有放缓。这是因为:一方面,在ILSVRC所指向的图像识别之外,还有更高阶的图像理解、语意理解去探索;另一方面,算力、大数据、边缘计算环境的不断优化,给予了AI向更高阶、更智能的阶段迈进的可能。

这其中最明显的例子就是在ILSVRC偃旗息鼓那一年诞生的Transformer架构,被很多人称为“2010 年代十年中最伟大的发明”。它的诞生让更为高效的“多头注意力机制”技术路线,取代了之前的卷积神经网络,成为更优秀的AI解法。

Transformer诞生后,谷歌搞出了架构Vision Transformer (ViT),OpenAI 发布了 DALL·E-2,DeepMind 发布了 AlphaCode,等等。

就在李彦宏发言中特别提到的2021-2022年,AI还取得了十分引人注目的进步,那就是既有震动科技界的优秀论文(MLP-Mixer,2021),宣称卷积神经网络和注意力之外,还有其他的AI进阶实现路线;亦有香港中文大学研究室在论文中极具突破性提出,Transformer可以与GAN(生成对抗网络)结合实现AI效率倍增。

显然,作为以AI技术为核心竞争力的科技公司CEO,李彦宏与百度技术中台群组(TPG)、百度研究院,肯定会保持对这些AI领域最新研究成果的密切关注。只不过,在面向公众演讲之时,李彦宏使用了一个高度概括且更容易理解的词汇——AIGC,去涵盖自身对AI技术方向性改变的理解。

用李彦宏的话说就是:“这里的方向性改变是,AI从理解语言、理解文字、理解图片和视频,走向了生成内容。我们称之为AIGC,即人工智能自动生成内容。”

的确,李彦宏的观察结论与科技行业从业者感知的完全相符。比如李彦宏在演讲中提到的AI作画,这已经比当年震惊科技界的谷歌识图不知高出了几许。

《经济学人》编辑团队在《Midjourney》上经过250次的文字输入尝试,生成了1,000张缩图,再从中挑选出一张制成2022年6月出版的杂志封面图片。

此外,还有AI创作文章,AI预测一个人的老年阶段相貌,AI根据文字生成图片,等等。

实际上,李彦宏所指出的,正式是一条从机器识别,到机器理解,再到机器创造的AI转型之路,或者称升级之路。

商业应用层面的高速进展

李彦宏演讲中提到的AI作画,仅仅是AI技术在商业应用领域打开想象力的一个代表。

 

实际上,在近两年,连AI理论研究领域都取得了如此重要的进展,商业应用层面就更是百花齐放,百度自身就是一个非常好的例子。

比如,在AIGC领域,其背后是大模型技术,近些年来,伴随数据井喷、算法进步,以及算力突破,预训练大模型成为人工智能发展的新方向。百度文心大模型作为产业级知识增强大模型,真正源于产业实践,又服务于产业落地。在大模型的产业落地上,百度首发行业大模型,探索出一套行之有效的大模型产业落地打法,让大模型“能用、可用”,规模化落地价值显现。

据了解,文心·行业大模型基于通用的文心大模型,融合学习行业特有的大数据和知识,进一步提升大模型对行业应用的适配性。在能源电力领域文心大模型联合国家电网研发知识增强的电力行业NLP大模型国网-百度·文心,在金融领域联合浦发银行研发知识增强的金融行业NLP大模型浦发-百度·文心,通过引入行业特色数据和知识,在电力、金融相关领域取得显著的效果提升。在航天领域,文心大模型携手中国航天发布世界上首个航天大模型——航天-百度·文心大模型,推进航天领域AI技术应用。

百度的AI 数字人度晓晓,今年挑战创作高考作文,在40秒内写了出40 篇,经过专家评阅,其得分可以排在总考生前 25%。

在百度App内,已经有很多视频内容,是AI把百家号的图文内容自动转换成视频的结果,而很难被观者感知到。

然而,比起上边的这些AI进步在打开的商业应用前景,自动驾驶显然是价值更大,也对百度更重要的一个商业应用方向。

今年6月,通用汽车支持的Cruise项目,在美国旧金山开启了全无人自动驾驶的商业运营,虽然中间也有各种磕磕绊绊,但他们还是坚持下来了,并且在不断扩大运营范围。

然而,Cruise跟百度的自动驾驶项目比起来,就显得有点落伍了。

作为国内最早布局自动驾驶的企业,百度已成为全球四大自动驾驶领导者之一,也是唯一上榜的中国公司,拥有全球最多的高级别自动驾驶专利。

百度萝卜快跑已经在北京、上海、广州、深圳等城市实现自动驾驶出行服务,在年初订单量就超过100万,稳坐全球最大自动出行服务平台。

除了自动驾驶,过去一年百度在人工智能领域商业化进展,最明显的是在基础设施的智能化改造方面。

首先是智能交通。目前,中国公路交通网络,还不能通过实时的信号灯调节和车路协同,来提升通行效率和降低事故发生率,城市拥堵让很多人在路上浪费了大量的时间。各地为了缓解交通拥堵,不得不实施对汽车的限购限行政策,这遏制了本来应该有的消费需求,也不能根本解决问题。根据相关数据,通过对交通网络的智能化改造,可以让通行效率提升15%-30%,这意味着GDP大约每年2.4%-4.8%的增长。目前,百度的智能交通方案已经在全国50多个城市落地实践。就在前几天,交通部正式将百度列为交通强国的试点单位,在高精地图、智能汽车、智能道路、云平台、智能交通产业生态发展等方面开展试点。

可以预见,随着通行效率的提升,对汽车的限购限行政策将走进历史,为城市疫情之后的经济增长注入新的活力。

其次是能源水利基础设施的智能化。中国在能源、水利、水务、供热等领域建立起了强大的基础设施物理网络,但是过去的建设,重硬件、轻软件,智能化水平不高。今年全国大面积高温天气,用电负荷屡创新高,整个电网系统都绷得很紧,哪怕一个小故障,都很容易导致大规模停电。现在,很多省级电网都使用了百度智能云的AI巡检,能7×24小时不间断巡视,巡检效率提升了6-10倍,有效保障了供电安全。

另外,在工业互联网领域,凭借云智一体的独特优势,百度智能云打造了一个AI+工业互联网平台“开物”,入选了国家“双跨平台”。开物正在帮助中国企业在质量管理、安全生产、能耗优化、物流调度等主要场景中降本增效,提升创新能力,助力中国从“制造大国”向“制造强国”转变。

在十年前,搜索绝对是互联网技术中的执牛耳者,百度也被大部分人认为是最具技术含量的公司。

实际上,机器深度学习突飞猛进的十年,也是百度跨进AI领域深耕的十年。在这十年中,百度一直坚持高强度研发投入,累计研发投入超过1000亿,每年研发占比都超过15%,去年更是达到23%,研发强度在国内民营企业500强中连续两年排第一。今年9月7日,“2022百度最高奖”颁发,百度创始人、董事长兼首席执行官李彦宏,为“大道”“潮汐”“拨云”三支团队分别颁发最高奖,奖金折合人民币超2000万元。

这样高强度的投入,使得百度在人工智能的各个层面都有领先的自研技术,从最底层高端芯片昆仑,到飞桨深度学习框架,再到预训练大模型,百度最近推出了金融、电力、航天等行业的大模型,从而能实现在应用领域效率的大幅度提升。这是许多其他AI公司所不具备的优势。

如今,百度已经是全球为数不多的提供AI主导的芯片、软件架构和应用程序等全栈AI技术的公司之一。基于压强式、马拉松式的技术研发投入,百度发展出了三大增长引擎,包括以移动生态为代表的稳健基本盘,以智能云为代表的新兴业务,以及以智能驾驶和小度为代表的前沿业务。

根据 2021 年 6 月的 IDC 报告,百度深度学习平台(飞桨)成为中国使用最广泛的平台(排名第一),超过了 Google 的 TensorFlow 和 META 的 PyTorch。

特别是在面向AI时代的业务架构调整之后,百度的MEG、IDG、ACG、TPG、SLG等覆盖各种应用场景的业务部门,都已经在各条赛道取得了举世瞩目的成绩。鉴于百度的这些成绩,百度公司股票在今年夏季被列入恒生指数,成为纳入恒生指数的AI领域第一股。

“要卷就卷创新”,这是李彦宏在演讲中的另一个关键句。其实,《深度学习撞墙了》所挑起的AI理论界争论,离开了产业实力与商业应用,会显得十分空洞。

而《经济学人》封面标题——AI新境界,已经昭示了AI的方向性改变正在发生。

以百度为代表的在AI领域前沿探索的公司,会把最新的AI理论成果进行产品化与商业化,之后再把数据反馈给理论界进行再优化。

这其实才是一条AI技术螺旋式上升的正确路径。

摩羯商业评论
历史纵深,空间透视,深度商业评论。

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)