文章作者、来源:铅笔道
短短18个月,融资四轮。
AI基础设施公司Baseten,最近又融了15亿美元(约合人民币101亿元),估值达到130亿美元(约合人民币882亿元)。
Baseten自己不训练大模型,而是帮企业把各种AI模型稳定、便宜、高效地运行起来。
短短18个月,Baseten已经完成四轮融资,它宣称,过去一年其收入增长了20倍。多家媒体报道,今年一季度,它的年化收入达到6亿美元。
该新闻折射出哪些赚钱机会?详见铅笔道机会情报系统:5分钟,了解新闻信号背后的赚钱机会。
Baseten创立于2019年,总部位于旧金山。
创立时,Baseten专注于研究机器学习,将机器用于反欺诈、识别滥用行为、处理用户生成内容。但头三年,收入“基本上为零”。2022年底,ChatGPT问世,Baseten决定转型帮助客户简化部署大语言模型的繁琐过程。
真正做AI应用的公司来说,不一定需要永远使用最强、最贵的闭源模型。它们需要的是:在不同场景下,用合适的模型,以可控成本、稳定速度,把产品跑起来。
比如,一个AI编程工具,可能在复杂代码生成时调用前沿模型,在简单补全、检索、分类、上下文整理上使用开源模型或自研模型。一个AI销售工具,也可能把不同任务拆开,让不同模型分别完成。
开源模型的能力正在提高。Llama、Qwen、DeepSeek等模型让企业有了更多选择。但开源模型不是拿来就能直接服务亿级用户的商品。企业还要解决GPU在哪里、如何部署、如何优化吞吐、如何降低延迟、如何应对流量波动、如何监控故障、如何控制成本、如何保护数据等一整套问题。
Baseten提供的,就是这套“把模型放进生产环境“的系统。它从多家云供应商采购算力,再通过自己的软件栈进行调度、优化和交付。对客户来说,不必自己到处抢GPU,也不必重建一整套推理平台。
Baseten服务的客户,很多都是快速增长的AI应用公司,包括Abridge、Clay、Cursor、Lovable、Mercor、OpenEvidence等。这些公司横跨医疗、销售、编程、招聘、企业软件等领域,但共同点是:它们的产品都高度依赖模型调用。
Baseten部分客户
这门生意有点像云计算早期。
当互联网公司快速增长时,亚马逊云卖的不是某个网站,而是网站背后的服务器、存储、数据库和弹性计算。当移动互联网爆发时,云服务商吃到的是整个应用生态的红利。今天,AI应用公司越多,模型调用越频繁,推理基础设施的需求就越大。
Baseten想成为的,就是AI推理时代的基础设施层,这也是它估值快速飙升的根本原因。
今年1月,Baseten刚宣布完成3亿美元融资,估值达到50亿美元。几个月后,新一轮融资把最高估值推到130亿美元。估值半年暴增2.5倍还多。
Baseten走红,还有一个更大的背景:AI公司开始认真算账了。
推理不是一次性投入,而是持续消耗。一个AI产品越受欢迎,模型调用次数越多,成本可能越高。如果每一次调用都依赖最昂贵的闭源大模型,产品规模越大,亏损也可能越大。
这就逼迫AI应用公司寻找更灵活的模型策略,不是所有任务都需要最强模型。AI应用能不能赚钱,很大程度取决于推理成本能不能被压下来。
当AI进入真实工作流,推理需求会变得极其庞大。推理优化不是模型公司单独能解决的问题,也不是普通云服务商天然擅长的问题。它需要介于模型、GPU、云厂商和应用之间的一层系统软件。这一层越复杂,越容易诞生新的基础设施公司。
Baseten吃到的,就是这层红利。它让AI产品有机会变成一门正常生意。
然而,推理基础设施可能是AI行业最诱人、也最残酷的赛道之一。
第一个风险,是竞争。
Baseten并不是唯一看到推理机会的公司。Fireworks AI、Together AI、Modal、Replicate、Groq、Cerebras,以及大型云厂商都在争夺这块市场。比如Groq 2026年5月被曝寻求最高6.5亿美元融资;Together AI打算融资10亿美元,而它的估值也达到75亿美元。
第二个风险,是毛利率。
推理基础设施公司看上去像软件公司,但并不完全是软件公司。它背后需要大量GPU和云资源。算力成本、采购价格、利用率、客户定价,都会影响利润。
如果GPU长期紧缺,采购成本高,客户又不断要求降价,推理平台的毛利率就会承压。尤其当竞争加剧,大家都用低价争抢客户时,这门生意可能变成“高收入、低利润“的重资产服务。
这也是为什么推理优化能力如此关键。
同样一块GPU,谁能服务更多请求、降低空闲时间、提升吞吐、减少延迟,谁才有更好的经济模型。推理基础设施不是简单转售算力,而是要通过软件效率把利润挤出来。
第三个风险,是技术变化太快。
AI模型、芯片、编译器、推理框架、开源生态都在快速变化。今天最优的部署方式,几个月后可能就落后。
这对Baseten既是机会,也是压力。
机会在于,技术变化越快,客户越不愿意自己维护复杂基础设施,更愿意交给专业公司。压力在于,Baseten自己必须始终跑在前面。一旦它的技术栈跟不上新模型、新芯片、新需求,客户可能迅速转向其他平台。
Baseten有个重要的股东:英伟达。2026年1月,英伟达成为Baseten E轮融资的重要投资方(1.5亿美元)。
这笔投资,似乎是被DeepSeek“逼“出来的。
2025年初,DeepSeek突然爆红。它给美国科技市场带来的冲击,不只是“中国也能做出强模型”,而是另一件更敏感的事:原来强模型可以做得这么便宜。
这直接戳中了英伟达的神经。过去几年,英伟达最核心的故事是:AI越来越强,所以需要越来越多GPU。
但DeepSeek出现后,市场突然开始问一个问题:如果模型训练成本能大幅下降,如果更少的芯片也能做出接近一流的模型,那么英伟达还能继续高速增长吗?
这个问题一度让英伟达股价大跌。
但英伟达后来押注Baseten,恰恰说明它看到了另一个方向:便宜模型不一定会减少算力需求,反而可能放大算力需求。
原因很简单。
当AI模型很贵,只有少数大公司能用。但当DeepSeek这样的模型把价格打下来,当开源模型越来越强,更多创业公司、中小企业、垂直行业都会开始使用AI。
Baseten提供的是AI推理基础设施,帮助企业把开源模型、自研模型、定制模型部署到生产环境中,并尽量提高速度、降低成本。
这时候,行业真正的瓶颈就变了,不再只是“谁能看到最强模型”,而是“谁能把成千上万个模型稳定、便宜、快速地跑起来”。
Baseten帮企业部署、调度GPU、控制成本、降低延迟、处理高峰流量。大量公司会使用不同模型;大量模型需要在不同场景里运行;大量推理任务会持续消耗GPU。
这时候,英伟达需要的不只是OpenAI和微软这样的大客户,也需要Baseten这样的基础设施公司,把更多开源模型、专用模型和企业模型带到英伟达GPU上运行。
英伟达投Baseten,本质上是在给自己的下一阶段增长铺路。
本文不构成任何投资建议。
AI时代,“一人公司“正在爆发。现在,华为云发起「2026人工智能OPC应用创新大赛」。各阶段公司都能报名。点击图片,立即参赛。
本文来自微信公众号“铅笔道“(ID:pencilnews),作者:黄小贵,36氪经授权发布。
