
当巨匠算力结构透澈回转、推理占比飙升至70%,\"谁更低成本跑模子\"正在成为比\"谁模子更强\"更性感的生意。Fireworks AI两年估值暴涨27倍至150亿好意思元,日处罚15万亿Token——接近中国全社会AI调用量的15%。它意外验模子,只作念\"卖水东说念主\":帮企业跑开源模子,按Token收费。
———— / BEGIN / ————
AI行业,又出现一家千亿公司。
5月27日,据彭博社报说念,好意思国AI推理平台Fireworks AI正在洽谈新一轮融资,指标估值150亿好意思元(约1024亿元东说念主民币)。
而7个月前,它的估值如故40亿好意思元。若是再往前看:2024年7月,它B轮估值仅5.52亿好意思元。也即是说,不到两年,Fireworks AI估值暴涨约27倍。

Fireworks AI估值变化
更猛的是收入。盘问机构Sacra数据显现:2026年2月,Fireworks AI年化收入还是达到3.15亿好意思元(约22亿元东说念主民币),同比增长416%,较2024年B轮时增长约3-4倍。

与此同期,它的平台每天处罚约15万亿Token。
这个数字是什么见识?国度数据局此前知道:2025年12月,中国日均Token浮滥量约100万亿。
也即是说,Fireworks AI一家公司的日Token处罚量,还是接近中国全社会AI调用量的15%。而它成就才不到4年。
01 一帮华东说念主,在AI行业卖Token
Fireworks AI成就于2022年,总部位于好意思国加州Redwood City。
公司共有7位议论首创东说念主,其中3位是华东说念主。CEO乔琳(Lin Qiao):复旦本科、硕士,UCSB博士,前Meta工程高等总监。

Fireworks AI的中枢团队
她曾主导PyTorch在数据中心、出动开荒和AR/VR开荒上的开发部署。
另外两位华东说念主议论首创东说念主:Benny Chen曾在Meta作念到首席软件工程师;Chenyu Zhao则长久负责Google Cloud Vertex AI关系业务。
这家公司意外验大模子,也不告成作念AI运用。它作念的事情很浅近:帮企业运行各式开源模子,然后按Token收费。
咫尺,其支抓的模子包括DeepSeek、Kimi、MiniMax等多家开源或绽放API模子。
开发者无需我方购买GPU、搭建推理集群或进行底层优化,即可通过兼容OpenAI顺次的API告成调用。

Fireworks AI家具界面
而Fireworks AI则按调用量收费。AI运用跑得越猛,它赚得越多。咫尺,中文区中文字幕免费看巨匠最火的AI编程用具之一Cursor,即是其客户。
据官方知道:Cursor在Fireworks AI平台上,还是收场1000 token/秒的生成速率。
02 钱从“测验”流向“调用”
昔时两年,AI行业最烧钱的场所,是测验。
OpenAI、Google、Anthropic、xAI王人在豪恣囤GPU,单轮大模子测验成本动辄数亿好意思元。
但当今,一个变化运转越来越廓清:模子测验越来越像“一次性插足”,而推理调用运转念成“长久收费”。
算力结构还是透澈回转:2023年,巨匠AI算力中测验占2/3、推理仅1/3;到2026年,推理占比飙升至65%–70%,是测验算力的4.5倍。
在中国,这一趋势更极点 ——推理算力已是测验算力的8倍。英伟达黄仁勋致使判断:翌日推理边界将达到测验负载的十亿倍。
市集边界相似爆发:Lightspeed此前知道:昔时3年,AI推理市集还是从0增长到跳动50亿好意思元。
老本也运转豪恣涌入这一赛说念。
除了Fireworks AI,Baseten最近被曝出正以110亿好意思元估值融资,亚洲AV综合色区无码一二三区Together AI估值达到75亿好意思元,Modal估值46.5亿好意思元,Fal估值45亿好意思元。
其中,Baseten在2026年1月刚完成一轮融资估值50亿好意思元,5个月后新一轮融资估值告成翻倍至110亿好意思元。
更夸张的是收入增速。
据The Information报说念:Baseten年化收入还是从2026年头的2亿好意思元,增长到Q1末的6亿好意思元。3个月,增长200%。
这些公司有一个共同特质:它们王人不告成作念大模子,而是帮悉数AI行业“跑模子”——作念AI时间的“卖水东说念主”,靠永续的Token调用收费,赚取长久、贯通的现款流。
03 NVIDIA等巨头进场投资
Fireworks AI背后的投资方越来越豪华。其推动包括Lightspeed、Index Ventures、红杉老本,以及NVIDIA和AMD。
原因很现实:AI运用爆发后,悉数行业信得过稀缺的东西运转念成GPU,而推理平台实验上是在匡助悉数行业更高后果地使用GPU。
NVIDIA此前曾公开暗示:基于Blackwell架构的新一代推理系统,还是将单Token成本缩短约10倍。在部分大模子场景下,成本致使可降至蓝本的1/35。
这意味着,DeepSeek、Llama 3、Kimi等开源模子,在推理成本上已接近致使挑战GPT-4等闭源API,性价比拐点负责到来。
而谁能把Token成本压得更低,谁就更容易拿下AI运用公司。
咫尺,Fireworks AI估值对应约3.15亿好意思元ARR,市销率约47倍。放在2023年AI泡沫期,这个数字不算离谱。
横向对比同业:Together AI估值75亿好意思元、对应ARR约1.5亿好意思元,市销率约50倍;Baseten估值110亿好意思元、对应ARR约6亿好意思元,市销率约18倍。

放在2023年AI泡沫期,头部AI公司市销率多半在80–150倍,这个数字不算离谱;在2026年,这种估值仍能成就,中枢原因是AI调用量仍在爆炸式增长。
Fireworks AI的平台日Token处罚量,已从2025年底的10万亿增长到2026年5月的15万亿,5个月增长50%。按此增速,2026年底有望冲破25万亿 / 日,全年处罚量将超7000万亿Token——颠倒于为巨匠AI运用提供了近1/5的推理算力支抓。
04 中国,何时出现千亿公司?
Fireworks AI最值得温暖的,其实不仅仅150亿好意思元估值,而是“按Token收费”这件事还是信得过造成交易边界。
昔时许多东说念主以为推理平台仅仅手艺业绩,但当今3.15亿好意思元年化收入、416%增速、15万亿日Token处罚量,这些数字还是讲解:AI调用自身,正在变成一门信得过的大生意。
这亦然为什么国内越来越多公司运转进入推理层,包括硅基流动、无问芯穹,以及越来越多AI Infra创业公司。仅2025–2026年,国内新增推理赛说念创业款式就跳动200家。
昔时几年,AI行业拼的是谁能测验更大的模子。而当今,越来越多东说念主运转盯上另一件事:谁能替悉数AI行业,更低成土产货“跑模子”。
本文信源:Bloomberg、Sacra、AIWire、The Information、Fireworks AI官网等。融资尚未最终完成,估值可能变化。
本文来自公众号:铅笔说念 作家:惜文 剪辑:王方