百度文心一言、讯飞星火,国产的大模型陆续开放给普通用户了,这也是人工智能AI的新阶段产品、预训练语言大模型(LLM)产品在国内的首批产品。文心一言、讯飞星火上线后,很快都登上了国内苹果和安卓应用商店的免费应用排行版前列。
从去年11月30日OpenAI公司推出ChatGPT的9个月后,中国版产品也跟上了,国内民众终于可以合法、稳定地体验、使用新科技。
在人工智能之前的历史上,有过5大相对成熟的应用:机器翻译、搜索引擎、图像识别、语音识别和智能客服。
其中图像识别和语音识别领域滋养了最多的有规模的创业公司,有非常可观的投资和收入规模,著名的公司包括商汤、旷视,科大讯飞、云知声等等。
智能客服在银行、通信运营商和IT、互联网等面向大规模用户的企业中应用广泛,以前采用专家系统,一种半智能的问答系统。后来全面转到自然语言等技术后,AI和自动化水平明显提高,普通民众对此感受深刻,同时也有了很多面对机器人的无奈。著名产品有腾讯企业、环信、网易七鱼等。
机器翻译最早的版本是2006年由谷歌公司推出,10年后的2016年推出了深度学习版的翻译引擎,翻译效果明显提高,达到民用基本无误的水平。谷歌、必应和国内的有道、百度翻译是这个过程里的主要角色。
搜索引擎就更加广为人知了,谷歌的搜索引擎一下把互联网的信息检索从雅虎代表的目录管理水平,(可以想见目录管理源自传统的图书信息管理,是图书时代向互联网时代进化中的过渡方式。)提高到了面对海量数据使用关键词搜索的水平。搜索引擎滋养了美中两大互联网巨型公司:谷歌和百度。
而语言大模型产品,不但囊括了上述应用,还诞生了自己新的功能:AIGC,就是人工智能自动生产内容,无论是文字、绘画、音乐还是计算机代码,人工智能产出的内容达到了让人惊艳和震撼的地步。
这一切,是计算机面对人类诞生以来的所有知识和信息的这个层面上,处理和消化了其中20%多的内容后,训练出的能力,代表了人类至今对数据的处理能力、软件工程能力,以及配套所需的巨量计算能力的最高水平,已经接近达到颠覆人类自己智力的阶层。
按照上述梳理,此前我们在使用AI的时候,像图像和语音识别、智能客服,大部分是场景相对固定的商业、专业应用,用户基本上是被动的。咱们来说说服务大众用户的机器翻译和搜索引擎。
自动翻译是有人类以来对AI梦想的起点。机器翻译从上线那一天开始,对普通用户就是免费的,但是免费中有很多层意思。
免费首先意味着它是网站的纯投入无收入的成本部门,没有现金收入,对机器翻译的考核加了一项重要指标就是流量,作为网站整体服务的重要一环,留住用户。谷歌浏览器Chrome有一个功能,就是用谷歌翻译把整个页面内容自动翻译成用户所需的语种,对跨语种在网上冲浪的用户非常友好。
机器翻译之所以免费,还因为它无论号称多么准确,总会出现对某个单词的错别解释,整句整段的语义不连贯和错误地方就更多了,以及无法纠正的机器腔——它的遣词造句对用户阅读来说很别扭,类似星球大战里机器人C-3PO——说话走路都带着机器的味道。这种层次的产品让用户付费的话,我估计无论是工程师和网站的销售都没有这个底气,于是机器翻译生而免费。
最初,产品经理和工程师还有一项期待:希望通过获取用户对翻译结果的反馈来提高机器翻译质量。这一项指标写在每一任机器翻译的产品经理的项目报告里。但是快20年了,反馈还是不足以让工程师来训练更好的翻译引擎。因为机器翻译和用户的交互非常弱,几乎没有人愿意花时间把自己对译文的看法、尤其是对某个词句的具体意见写下来提交给运营方。
所以机器翻译虽然在AI一度广泛使用的自然语言处理技术NLP中,被称作技术应用的皇冠,在计算机技术专业领域存在感是A级;在用户端受到关注但是好评度并不高、存在感降到C级;在商业和投资价值方面,它是最末流的D-级。因此它就是大型互联网企业养育的一头销金兽。
搜索引擎是另外一番天地,它满足了人们上网的第一需求:获取信息。是搜索引擎第一次真实实现了互联网上的信息自由。同时产品经理还创造了搜索引擎嵌入广告和关键词排名广告方式,彻底改变传统世界商业信息传播介质,互联网取代了传统广播电视报纸杂志和户外等媒体,成为独大的广告平台,谷歌也成为有史以来广告收入最多的公司。
搜索引擎中的人工智能,主要体现在两点:一是尽可能对用户输入的搜索关键词的理解正确,以便展示出最合适的内容;第二是对内容库里的内容进行管理,以匹配用户的需求。
谷歌之所以拿到了有史以来最大的广告收入,是因为它汇集了有史以来最大的用户群,拥有最多的用户画像和最全的资讯数据库,在帮助建立所有人对所有信息的链接的同时,也建立了商业买卖的桥梁,搭建了广告销售的机会。
啰啰嗦嗦说AI的历史,是要来告诉读者,现在使用大模型会是一个什么样的场景?
大模型的基础版是免费的。这个免费也同样有很多层意思。
首先当然是因为所有AI的缺点,它不保证每次提供给你的信息是准确和正确的,它会告诉你“我的回答有90%的概率是对的”,但是哪里不对,什么时候会出错,AI不知道,工程师们也不知道。
但是大模型之所以说横空出世,是它在类似于无所不知的搜索引擎的基础上,把它之前训练模型时所包括进去的信息,用一个有条理的文档来回答你。你可以理解为以前的搜索引擎升级到了智能搜索1.0版,区别是以前用户需要在搜索结果中逐页打开找到自己的目标信息。而大模型不但帮你找到,还帮你总结称流利通顺的文字了。
还有更进一步的功能,大模型会帮你按要求写作、画画、编曲,甚至写计算机代码,帮助你写作业,做科学研究。目前我们但凡涉及到语言(声音、文字、绘画、音阶、计算机代码)的脑力工作,大模型都可以部分甚至完全替代。
以前人们普遍看不上蓝领的技能&体力工作,没想到大模型AI上来就要替代大部分的白领工作。
理论上,人们除了睡觉吃饭出门运动,其他时间可以全身心扑在大模型上完成自己的学习、工作。目前,这些都是免费的。
运营公司因此建立庞大的用户群,最好只来我家不去其他家。因此页面上大概率会和其他互联网公司一样,会出现广告。同时,即使这边免费,大模型还备着很多收费的产品要卖给他们呢。对,大模型将是第一次对大数量级的普通用户收取费用的平台级产品,因为它要从人类整体积累的知识与能力的层次上,给你学习和职业的支持。
庞大用户群的另一个价值,就是利用机器和人的交互对话,大模型能够迅速提高自己的智力水平。而对个人用户来说,也是你在训练符合你的兴趣和需求的个性化大模型的过程。所以,大模型类似于每个人的外脑一样,越用越离不开。这种终生服务,就是大模型公司正在计划和实施的事情。
如何让提高大模型的确定性,提高它服务的正确与准确度,除了和用户交互之外,大模型一定邀请了更多小型垂直的应用服务商来一起开发,比如一个数学学习和研究的应用,比如一个脑外科手术的应用。类似于大模型提供通用的判断和技能,而具体应用把具体服务落地。
以上是目前第一代大模型和用户相处的场景。
从技术和产品来说,科学家们相信和人类智能相当、甚至超越人类的AI一定会出现。其中涉及的道德伦理不是本文要讨论的,仅就使用而言,一切都刚刚开始,机器在疯狂地进步,我们也要尽力跟上。
图片来源于网络,侵权请联系删除。