DeepSeek对全世界的改变都是非常巨大的,尤其是对大模型的一种重新审视,对算力和算法的重新匹配让科技企业开始了深度思考。而且,开源的DeepSeek也让OpenAI感到了压力,后续OpenAI也开始了自己的免费之旅。国内市场也有相应的免费推介,这都应该归功于DeepSeek推出带来的改变。
科技巨头相继接入DeepSeek也是对这种算法的认可。由于DeepSeek的努力让市场的认知也发生了改变。近日,我们看到马斯克也在宣布自己的大模型即将推出了迭代版。Grok3即将推出。马斯克表示,最新大模型Grok 3将于太平洋时间周一晚上8点发布,届时将进行现场演示。
如果仅仅是一个产品的升级还无法达到什么效应,不过,马斯克的高明之处,就是极好地利用各种展现的时候给自己做广告了。马斯克表示:“Grok 3具有极强推理能力,在我们迄今为止所做的测试中,其表现优于我们所知的任何已发布产品。”也就是说,马斯克认为自己的产品会比ChatGPT、DeepSeek的推理能力更强,言外之意就是自己的Grok3更强大了。
那么,是不是Grok3就是“地球上最聪明的AI”?估计也只有发布之后才能验证了。熟悉大模型的用户都知道,Grok大模型是马斯克旗下的xAI公司推出的新一代人工智能模型,2023年11月,xAI发布第一款大模型Grok-1,迈出了在大模型领域探索的第一步。2024年3月18日,xAI团队又推出了参数量高达3140亿的Grok-1模型,这一参数量远超OpenAI GPT-3.5的1750亿,成为当时参数量最大的开源大语言模型。
2024年8月,Grok 2大模型发布 。Grok 2主要应用于训练AI聊天机器人。与Grok 1相比,它在训练数据的使用上有所改进。Grok 1在训练时未完全依赖真实世界数据,采用了大量合成数据,导致在处理真实世界中的细微差别和复杂性时表现欠佳。而Grok 2虽然依旧使用了大规模合成数据集,但同时融入了少量高质量的真实世界数据,在一定程度上弥补了初代模型在处理真实场景方面的不足。
据悉,即将发布的Grok 3,其最大的特点在于引入了“思维链”(Chain Of Thought)推理能力。该能力让Grok 3能够像人类认知过程一样逐步处理复杂任务,显著提高了模型处理复杂查询和提供更连贯、更有逻辑的响应的能力。Grok 3模型在推理、编程能力以及文本和图像分析等多模态功能方面有了显著的提升。
马斯克还表示,Grok 3已完成预训练,其计算量比Grok 2高10倍。众所周知,马斯克一直扮演着追赶OpenAI的步伐,如今显然又增加了DeepSeek了。在DeepSeek刚推出的时候,马斯克表达了认可。不过,其也表示,xAI将会推出“比DeepSeek更强大的模型”。Grok 3无疑就要扮演这样的角色。马斯克表示,大模型市场真正的“革命”需依赖更底层技术的突破(如多模态融合、生成式AI的深度应用)。
众所周知,DeepSeek的“低价高能”模式可能推动大模型商业化落地,但马斯克认为真正的变革需技术质变,而非单纯优化。其实,当一种低价高能在某些应用方面开始落地的时候,这时候就是算法的突出性,对于算力达不到的企业来说,一样可以布局自己的专业化的大模型应用,这才是最关键的。而且,这也暗示了全球AI竞赛的激烈程度将持续升级。