在大模型日新月异的今天,不少人预测2024年将成为大模型应用落地的关键一年。但是随着618消费节临近,谁都没想到,AI大模型的低价内卷在疯狂上演。

国内这场“战役”始于几大巨头。字节、阿里、百度、科大讯飞、腾讯先后官宣降价或免费,对于所有行业用户、开发者用户而言,大模型应用落地的成本越来越低,物美价廉才是模型API的最优选。自“百模大战”开始,AI赛道真正的产品力竞争才算由此拉开了序幕。

国内外大模型降价风起云涌

如今大模型究竟“内卷”到什么程度呢?

讯飞星火是业界首个宣布大模型基础版本“永久免费”的公司。从功能上来看,讯飞星火Lite API支持在线联网搜索,适用于需要在较低计算能力环境下进行模型推理和精调的定制化场景,旨在为开发者提供一个易于接入且成本效益高的轻量级大语言模型。讯飞星火已经学习了包括金融、能源、工业等12个行业的知识,这使得Lite API能够在这些领域内提供更加精准的服务。

科大讯飞董事长刘庆峰曾一针见血地指出:“大模型发展,应用才是硬道理。”

此次讯飞星火调整的大模型定价极具竞争力,以输出价格为例,讯飞星火 Max API价格低至0.21元/万tokens(文本处理过程中的最小单位)。在讯飞星火,1 token相当于1.5个中文汉字,因此2.1元就足够调用“讯飞星火3.5 Max”生成一部余华《活着》的内容量。

科大讯飞表示,当前公司基于国产自主可控大模型工程化优势,讯飞星火API能力正式免费开放,有利于帮助开发者降低调用成本,驱动产品创新验证,加速大模型赋能及AI普惠化的到来。

阿里云从年初开始就不断降价,将国产大模型的使用成本打到地板价。

“我觉得AI推理成本只有每年有十倍甚至百倍的降低,才能真正推动行业各行各业的AI应用的爆发。”5月21日,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在阿里云“AI智领者峰会”上表示。

随后,阿里云官宣,旗下9款核心商业化及开源系列模型将全数降价,且都已经可以通过阿里云百炼官网开通使用。阿里云的这款大模型对标GPT-4级别的长文本模型Qwen-Long,降价至GPT-4价格的1/400。

这意味着什么?在阿里云,用户可以用1块钱买到200万tokens,来完成5本《新华字典》的文字量。

阿里云智能集团副总裁、公共云华北大区总经理高飞提到,降价后更多企业选择公共云+API的方式直接调用通义大模型,接近“免费”的调用成本,让中小企业更愿意“先跑起来”。

也是在同一天,百度智能云宣布,百度文心大模型的两款主力模型ENIRE Speed、ENIRE Lite全面免费,即刻生效。这两款大模型发布于今年3月,支持8K和128K上下文长度。

百度创始人、董事长兼首席执行官李彦宏表示,公司正在从以互联网为中心转向人工智能优先,推进用文心大模型重构To C和To B业务。李彦宏判断,搜索最有可能成为AI时代的“杀手”应用,而百度搜索的AI重构工作仍处于早期阶段。

实际上,今年5月以来,大模型降价的风潮就初现端倪。

豆包APP是字节跳动于2023年6月推出的AI对话助手。

2024年5月15日,火山引擎举办2024春季 Force 原动力大会,首次发布了字节跳动豆包大模型家族、升级火山方舟大模型服务平台,并联合中国电动汽车百人会、一汽、吉利、长城、广汽、捷途、智己、宇通等20余家厂商,正式发布汽车大模型生态联盟,共同探索新一代人车交互形态、提升汽车全场景 AI 新体验。豆包大模型目前正在以每日1,200亿 tokens的大使用量持续打磨,并于5月15日以最高低于行业价格99.3%的价格正式开启对外服务,豆包主力模型在企业市场的定价为0.0008元/千tokens。

火山引擎总裁谭待表示,降价的基本逻辑是,火山引擎有信心用技术手段降低成本,市场也需要更低价的大模型。

字节跳动产品与战略副总裁朱骏表示,豆包的用户规模在快速增长,豆包已经有超过2600万的月活用户,和800多万个被大家创建出来的智能体。

依托豆包大模型打造的豆包 App 自去年8月上线至今,在 AIGC 类应用中的下载量、使用量一直遥遥领先。今年4月,豆包 APP,在苹果 APP Store 和各大安卓应用市场,豆包 APP 的下载量在 AIGC 类应用中排名第一。

在应用领域,依托豆包大模型家族强大的模型实力,豆包大模型家族已实现 to C、to B 全覆盖。在 to C 终端应用上,豆包大模型驱动了字节旗下豆包 App、即梦、猫箱、扣子、河马爱学等多款 AI 产品面向消费者提供了 AI 对话助手、AI 创作、AI 互动娱乐、AI 应用开发等功能。

面向 B 端,豆包大模型已应用于字节跳动内部日常办公、营销创作、电商导购、售后客服、编程助手等50多种业务场景之中,并通过火山引擎服务了汽车、金融、消费等众多行业,加速千行百业 AI 应用落地。其中,在汽车行业,豆包大模型已服务了领克、捷途、北汽、长安福特和吉祥等多家车企,并借大会建立了汽车大模型生态联盟,共同探索大模型在汽车领域的广泛应用。

近期,面对“如何看待大模型厂商开打‘价格战’”、腾讯云是否有降价策略等提问时,腾讯云副总裁、腾讯云智能负责人吴运声表示,无论是底层能力发展,或是构建应用工具链发展,大模型技术和应用还在快速发展过程中。因此,腾讯云把所有的、大量的精力放在怎样提高底层大模型能力上,包括怎么让用户真正用起来混元大模型、如何多层次对外提供大模型等工作。

此后,腾讯云相继公布全新大模型升级方案。其主力模型之一混元-lite模型,API(应用程序编程接口)输入输出总长度计划从目前的4k升级到256k,价格从0.008元/千tokens(人工智能处理单元)调整为全面免费。混元-standard API输入价格从0.01元/千tokens降至0.0045元/千tokens,下降55%,API输出价格从0.01元/千tokens降至0.005元/千tokens,下降50%。混元-standard-256k API输入价格下调至0.015元/千tokens,下降87.5%,API输出价格下降至0.06元/千tokens,下降50%。而腾讯最高配置的万亿参数模型混元-pro,API输入价格从0.1元/千tokens降至0.03元/千tokens,降幅达70%。

即使在国外,OpenAI也有降价趋势。据了解,从 2023 年年初以来,OpenAI 已经进行了 4 次降价,不久前,OpenAI最新推出了GPT-4o,价格为GPT-4 Turbo的一半,输入、输出每百万 tokens的收费是5美元、15美元。

当然,也有一些企业选择“独善其身”。5月22日,明星初创公司百川智能发布新一代基座大模型Baichuan 4,以及首款AI应用、AI助手“百小应”。百川智能创始人王小川认为,对于降价影响,需要看未来的商业模式:如果是面向B端企业客户,那往后就是直接卖云服务的方式,中间的应用层反倒会繁荣起来。百川不会掺和到价格战当中,而是将更多的精力放在超级应用当中。

大模型降价意义何在

有观点认为,从“卷”参数到“卷”价格,国内大模型价格体系出现巨变。

华龙证券研报表示,随着国内外大模型厂商技术角逐越来越激烈,大模型行业开启价格战信号明显。通过降低价格门槛,大模型厂商有望吸引更广泛的企业用户群体,从而进一步平衡收入和成本。同时,更多C端用户有望免费使用基础AI应用,庞大的访问量有助于企业进一步提升模型服务能力,完成良性循环。

对开发者和企业而言,大模型大幅降价甚至免费,将很大程度解决大模型落地的成本问题,能够让开发者以更低的成本实现大模型在各个场景的落地,也加速了大模型技术的普及和商业化进程。

生成式AI所依赖的算力不仅仅是CPU和简单的技术带来的策略,更多是一个大规模集群,大规模GPU集群带来算力的基础,包括网络存储背后能力的提升。所以生成式AI,无论是推理和训练,逐渐更多走向云端,再一次点燃了公共云的爆发。

据IDC预测,2026 年中国AI大模型市场规模将达到211亿美元,人工智能将进入大规模落地应用关键期。麦肯锡报告指出,其研究的63种应用中使用生成式AI,将为全球经济带来每年2.6万亿-4.4万亿美元的增长。此轮国内大模型轮番降价,既代表着“百模大战”竞争的加剧,也代表着大模型商业化拐点将至。

除了喝彩,业界也免不了一些不同的声音。

Lepton AI创始人、原阿里巴巴副总裁贾扬清直言,大模型的落地难题并不在“贵”,而在于如何帮助客户真正创造价值。

猎豹移动董事长兼CEO傅盛认为,这次价格战,降得最凶的都是有云服务的大公司,通过大模型来获取云客户,羊毛出在猪身上,降得起。大模型创业公司没有这样的生态,必须找到新的商业模式。

傅盛表示,大模型降价的目标不是为了用户直接使用,而是为了吸引开发者。短期来看,大模型的性能遇到了瓶颈。“谁也甩不开谁,谁也拿不出杀手锏,降低推理成本、降低售价成了现在每一家的高优先级任务”。

有观点认为,这次大模型轮番降价,很大程度上是由于各大模型间性能差异不大,同质性较强,在用户数量难以进一步增长的情况下,通过低价策略吸引开发者,从而建立生态壁垒。当国内多家大模型企业在低价上激烈竞争时,反观国外几家大模型厂商拼的却是每秒生成的Token数量。

实际上,免费并非大模型独有的商业模式,千禧年初期就已经存在这样的商业模式。从百度的免费搜索到360集团免费提供杀毒软件,“免费”似乎一度成为互联网的代名词。

不得不承认,低价战对于扩大用户群体,提高应用产品普及率有很大帮助。公开资料显示,目前阿里的通义千问API日调用量过亿,服务9万多家企业用户;百度文心大模型API日调用量则超过2亿,服务超过10万家企业用户。

但是,随着越来越多的用户接受大模型,对于大模型企业而言,在保持较高活跃度的同时,如何帮助用户解决业务瓶颈问题,形成产业健康发展的商业生态,或许是更高层次的命题。

张子鹏(newsmedia007)

---------------------

不保证以上内容的准确性和真实性。市场有风险,投资交易需谨慎。所涉标的不做任何推荐,据此投资交易,风险自担。

科记汇,资深财经媒体人创办,财经报道先锋,年阅读观看量数亿。关注研究重大财经动态、企业家精神、商业文明发展历程,报道大型企业、上市公司、创业公司关键发展节点。内容同步近三十家网络平台。欢迎提供报道线索和采访机会。