时间回到2022年11月,此时英伟达的股价近乎腰斩,跌至不足3000亿美元。


就在这个时候OpenAI发布了ChatGPT聊天机器人,这一基于生成式人工智能的AI Bot,一时间成为了科技界的头条。此时,甚至Google创始人慌乱,回来紧急发布应对策略。因为在这个时候大家不知道它是如何实现的。


英伟达GPU芯片可以加速AI基础模型的训练,同时具有完善的CUDA平台,它抓住了向上的“新风口”,其股价开始回升,市值逐步恢复。


到2024年的今天,仅仅两年过去,英伟达市值达到3.012万亿美元,成为了全球市值第二的公司。


英伟达的GPU芯片依然在加速生产中,而且他们现在拥有至高无上的定价权,每个人训练大模型的公司都必须接受Nvidia用金汤匙喂养他们的东西。


当前H100的毛利率超过85%,可以说英伟达成了AI2.0时代最赚钱的公司,没办法卖“铲子”的总比“挖金矿”的要先一步挣到钱。


而对于这波风口上的大模型公司来说,所有人都在关注无利可图的支出还将会持续多久。当前大模型创业公司的明确目标还是在赶上甚至超越OpenAI,以及构建更大性能更好的模型,来挣取更多的预期收益。


而OpenAI也一样,OpenAI必须不断推出新的震撼世界的产品,同时推出可以直接触达用户的产品,否则它将陷于Meta和Google包围之中。


优势在缩小


当前许多公司在聊天机器人ELO方面与OpenAI最新的GPT-4相差无几,而在上下文长度和视频模式等某些方面,一些公司已经领先。


前不久Sora和GPT-4o的发布,并未引起像ChatGPT刚发布时引爆的破圈讨论风潮,这是因为ChatGPT刚发布时,我们并不知道它是如何实现的,我们也不知道如何追赶。而现在我们基于开源基础模型,可以大概判断出其实现的技术方案,只是需要时间来进行复现而已。


显然,只要有足够的计算能力,最大的科技公司都可以匹敌OpenAI的GPT-4。据传,阿里最新发布的Qwen-2.0的开源模型已经可以比拟GPT-4 Turbo,Meta的Llama 3 405B也将在开源的同时匹敌GPT-4,Gemini 2 Ultra已经在各方面超越GPT-4 Turbo。


OpenAI现在的优势之一是他们在收集使用数据方面一直处于领先地位,但这种情况相信很快就会改变。所以OpenAI才说人才是第一位的,其他没有什么是不可替代的,OpenAI也在不断的开出百万美元的年薪从Meta和Google等竞争对手的公司挖人。


如果OpenAI没有不断的推出新的技术产品,可以说其技术优势正在逐渐缩小。


微软与OpenAI的合作关系


虽然说微软宣布将为OpenAI投入超过100亿美元的资本支出,而且这其中还有一大部分事用于推理,以便在自己的产品和服务中部署OpenAI模型。


由于OpenAI的怪异结构,微软也并未完全押注于OpenAI,一大部分资源被用于微软自己开发的模型上。


OpenAI是一个非营利组织,其主要目标是创造安全且造福全人类的通用人工智能(AGI)。OpenAI可以而且会违反允许微软访问OpenAI模型的协议,而微软对此没有任何追索权。


这是因为OpenAI仍然是一家完全独立的公司,由OpenAI Nonprofit管理。微软是无投票权的董事会观察员,没有控制权。AGI明确地排除了所有商业和IP许可协议。对于微软来说,最令人担忧的是,OpenAI董事会可以在没有任何微软投票的情况下随时决定他们已经实现了AGI。


虽然说现在OpenAI的产品可以通过微软来直达消费者用户,但他们之前并非完全背靠背的合作关系,OpenAI依然需要寻求独立的产品路线。


而微软也在减少对OpenAI的依赖,包括Copilot和Bing计划。微软最新发布的Phi-3模型,使用来自大型模型的大量合成数据训练小型模型,效果非常出色。其次,微软也正在使用MAI-1~500B参数MOE模型,利用了Inflection预训练团队及其数据集,并结合了微软自己的一些合成数据,来训练自己的GPT-4类模型。


终端产品已成王道


OpenAI的缺点其实非常明显,它并没有拥有像Meta和Google可以更直接地接触消费者终端流量产品。


相比于Google的浏览器,Meta的聊天软件,ChatGPT的用户量还是比较少的,而且其中大多数只使用过几次,不会继续使用它。


未来的大多数可以预见的消费者,将通过现有平台来使用大语言模型,包括Google、Instagram、WhatsApp、Facebook、iPhone/Android。



虽然Meta尚未找到如何将赚钱的方法,但他们的Meta AI(由Llama 3 70B提供支持)已在Facebook、Instagram和Whatsapp上可用。


并且已宣布的推广范围已扩展到包括美国在内的14个国家/地区,这些国家/地区的总人口为11亿。大量用户已经可以使用比ChatGPT免费模型更好的模型。Meta AI正处于其增长曲线的早期阶段,距离实现其32.4亿每日活跃用户群的目标仅完成了三分之一。


Google也宣布将AI融入了Workplace办公工具中,使得Gmail、Google Drive、Docs、Sheets和Slides都可以一键使用AI,同时未来也将打造新的搜索—-用AI组织搜索,同时Gemini生成式人工智能模型添加到广告服务中,探索赚钱方法。


所以在这个背景下,OpenAI推出了自己的手机APP和桌面APP,用于直接面向用户,一方面便捷用户的使用,减少使用上复杂操作的时间成本;另一方面可以直接面对用户和占有用户。


此外,OpenAI也积极与苹果合作,打造新一代的siri,占有这个巨量的终端用户群体。如果OpenAI真的iPhone上独家提供服务,那么OpenAI将一举成功占用最重要的终端市场。


开打价格战抢占用户


价格战的序幕应由DeepSeek-V2的问世拉开,这款产品以其卓越的性能和低廉的运行成本,成功超越了Meta的Llama 3 70B。


DeepSeek-V2的定价策略极具竞争力,它不仅在成本效益上明显优于市场上的其他竞争模型,而且其价格之低,甚至打破了风险投资支持的推理API提供商之间的价格战局面。这些提供商在为Meta和Mistral模型提供服务时,已经面临着亏损的压力。


DeepSeek-V2的推出,无疑在这场激烈的市场竞争中掀起了新的波澜。


DeepSeek声称,一个由8卡H800 GPU组成的节点可以实现每秒超过50,000个解码token的峰值吞吐量,其API定价为每百万tokens输入1元、输出2元。即使在这样的情况下,依然可以实现高达70%以上的毛利率。而且DeepSeek-V2没有照搬国外的开源模型,针对MoE、RoPE和Attention都有全新的创新。


紧接着,智谱AI、字节豆包大模型和阿里Qwen-Long API也都相应的大幅下调价格。百度则直接宣布ERNIE Speed和ERNIE Lite两款模型免费。


OpenAI则对于非企业用户优先采取了免费优先的策略,虽然有一定的频次限制,但对于非企业用户来说是足够的。这标志着他们将去年的定价模式发生了重大商业模式转变,现在开发者和企业进入了完全补贴消费者的时代。


通过贴补消费者来增加用户使用终端频率和习惯,抢占终端用户市场。对于这些没有大规模终端使用的大模型公司来说,如果创新遇到瓶颈,那么这些拥有直接终端用户的企业公司,将可能快速将其包围。


国内价格战时间线:


DeepSeek发布全球最强开源MoE模型:2024-05-06,DeepSeek-V2(32K上下文)API的定价为:每百万tokens输入1元、输出2元


用大模型API就上bigmodel.cn!:2024-05-11,智谱AI的GLM-3 Turbo API价格调整为1元/百万tokens(输入输出同价)


2024春季火山引擎FORCE原动力大会上:2024-05-15,字节Doubao-pro-128k(128K上下文)API的定价为:每百万tokens输入5元、输出9元;Doubao-lite-128k(128K上下文)API的定价为:每百万tokens输入0.8元、输出1元


智谱AI最新推出Batch API:2024-05-21,支持的模型以及价格:GLM-4 API价格为50元/百万tokens,GLM-3-Turbo API价格为0.5元/百万tokens(输入输出同价)


降价,立即生效!:2024-05-21,阿里云Qwen-Long API价格调整为每百万tokens输入0.5元、输出2元。


免费,立即生效!:2024-05-21,百度宣布ERNIE Speed和ERNIE Lite两款模型宣布免费。


战火必将燃向芯片


OpenAI面临的最大风险就是芯片。


尽管OpenAI的芯片野心已经传闻了一段时间,最近OpenAI对谷歌TPU芯片的顶尖人才开始了大胆的偷猎行动。


OpenAI自己做芯片和基础设施也是迫不得已。


一方面,与购买Nvidia芯片相比,它大大降低了计算成本。当前Google的TPU建设速度非常快,而且成本会非常便宜。Meta和亚马逊正在将其内部硅片的产量提升到不同程度,这让他们的大模型获得了计算成本优势。


另一方面,OpenAI公司目前处境尴尬,不能完全依赖微软的芯片和云服务,因为两者的关系紧张且微妙,而且微软正在认真制定自己的AI计划。


从长远的角度来看,OpenAI在成本节约方面可能难以从微软那里获得显著的优惠,因为微软的商业策略倾向于通过向"外部"用户出租其内部芯片和云服务来实现盈利。OpenAI有着更为深远的愿景,它渴望自主设计芯片和系统,以更贴近制造成本的方式打造定制化的解决方案,从而实现成本效益的最大化。


然而,OpenAI对于微软芯片的设计缺乏必要的控制权,这可能导致微软提供的芯片及其系统无法完全满足OpenAI的特定需求。这种局限性可能会影响OpenAI在实现其技术目标和优化成本效益方面的灵活性和效率。


总结


当前AI大模型还处于发展的初期,巨量上升的空间使得资本可以无限制的投入,然而这种无限制的投入会持续多久呢?


在整一条产业上,目前只有卖芯片的英伟达赚到了钱,其他公司都是在赚取对未来期望的钱。一旦OpenAI所带来的创新性不足,那么也就意味着AI2.0将进入平台期。


OpenAI必须利用当前的优势,快速的占领终端用户,吸纳自己的用户群体。否则一旦式微,Google和Meta这种已经拥有巨量流量的现成产品公司,将具有非常大的后发优势。


所以说,终端产品成为市场竞争的关键,Google和Meta等公司拥有直接接触消费者的平台和产品,而OpenAI则需要通过推出自己的APP和与苹果等公司的合作来拓宽用户基础。通过价格战和补贴消费者将成为抢占市场份额的重要手段。


最后,芯片或许会成为OpenAI面临的最大风险。尽管OpenAI有意自主开发芯片和基础设施,但与微软的合作关系紧张,OpenAI需要在芯片开发和成本效益之间找到平衡,以保持其在AI领域的领先地位。


本文来自微信公众号:Tim在路上 (ID:CNSF-2016),作者:Pulsar planet