大家好,我是王利杰。今天,我们来深入剖析一份基于300家AI公司的深度研究,看看顶尖的构建者们是如何思考和打造未来的AI产品。我们的分析发现,整个AI应用市场已经形成了“三分天下”的格局。大约三分之一的公司是在现有产品中加入AI能力,我们称之为增强型;三分之一是基于AI创建全新的产品线;还有三分之一则是AI原生公司,其核心商业模式完全由AI驱动。一个非常有趣的趋势是,无论公司属于哪一类,他们最常构建的产品形态都是“代理式工作流”,也就是Agentic Workflows。这背后的逻辑已经不是简单地给用户一个工具,而是创造一个能代替用户去使用工具的AI代理。有产品负责人就表示,用户没时间探索产品里的数据,所以他们要构建AI代理,来替用户规划并执行有价值的操作路径。在底层技术上,一个重大的转变正在发生:单一模型的时代正在结束。越来越多的公司开始构建多模型、多策略的组合架构。目前最主流的组合方式,是以OpenAI的模型作为主力,再搭配一到两个其他模型,比如来自Anthropic、Mistral或各类开源模型,来应对不同任务。为什么这么做呢?主要是为了在不同场景下优化效果、平衡成本与性能,并满足不同地区的合规要求。我们的研究显示,高增长的公司在这方面走得更远,他们更倾向于微调基础模型,甚至从零开始开发自有模型,以追求极致的控制力、数据安全和定制化。为了实现这一点,灵活的模型切换能力已经成为技术架构的核心要求。在模型训练方面,检索增强生成,也就是RAG,与模型微调是目前最主流的两种手段。而高增长公司则更擅长探索各种提示词工程技术,显示出他们在交互设计上更具创造性。那么,这些AI产品如何变现呢?目前,混合定价模式是主流,也就是订阅制与按使用量计费相结合。但值得注意的是,有近四成的公司表示暂时没有调整定价的计划,而另外近四成的公司则在积极探索基于用量、投资回报率和分级套餐的新模式,这说明AI的商业化路径仍在探索之中。在组织和成本方面,当公司年营收达到1亿美元后,通常会设立专门的AI负责人。目前,公司平均会将20%到30%的工程团队投入到AI方向,而AI和机器学习工程师也是招聘周期最长的岗位。AI的成本结构也很有意思。多数公司将10%到20%的研发预算用于AI,并且计划在明年继续增加。随着产品规模扩大,人才成本占比会下降,而算力和基础设施的支出则会上升。其中,API调用费用被认为是最大、也最难控制的不确定成本。为了降本,企业正在积极探索开源模型和推理效率优化。最后,我们来看看企业内部的AI应用。数据显示,企业对内部提效的AI工具预算预计在2025年翻倍。但挑战在于,即便有70%的员工能接触到AI工具,真正持续使用的也只有一半左右。与对外产品不同,企业内部选择AI工具时,成本和数据隐私的考量甚至高于准确性。目前来看,内部最有成效的用例是编程辅助,GitHub Copilot几乎是绝对的王者,被近75%的开发团队采用。总而言之,AI产品的构建正在进入一个更加成熟和务实的阶段。灵活的多模型架构、以代理为核心的产品设计,以及精细化的成本与组织管理,将是决定未来成败的关键。对于所有从业者来说,这既是挑战,也是巨大的机遇。
Iconiq Capital 的《The Builder’s Playbook》:300家AI公司构建策略揭秘
Iconiq Capital上周发了一个报告:《The Builder’s Playbook》。这份报告调查了 300家构建AI产品的公司 ,受访对象包括 CEO、工程负责人、AI负责人、产品负责人等。其中还特别包括了 40家处于高速增长阶段的公司 ,这些公司已经具备一定的市场验证和执行力,数据更具代表性。
受访公司概况
AI应用形态“三分天下”
Iconiq 将这些公司按产品AI化程度分为三类,三类公司各占约三分之一 :
- AI-Enabled(增强型) :在现有产品中加入AI能力
- AI-Enabled(新建型) :基于AI创建新的非核心产品
- AI-Native(原生型) :其核心产品或商业模式完全由AI驱动
产品形态:Agentic Workflows 占主导
不论是 AI-Native 还是 AI-Enabled 公司,最常构建的产品 是Agentic Workflows(代理式工作流) 。
AI Agents 应用趋势:不只是工具,而是替你用工具
很多公司开始把 AI agents 用作“用户替身”来执行任务。
“用户虽然很喜欢我们产品中呈现的数据洞察和分析,但他们没时间去探索。所以我们想要构建 AI agents,由代理来使用产品,为终端用户规划并执行有价值的路径 。”— 某全栈AI公司产品副总裁,年营收在1000万到2500万美元之间
🔧大模型使用趋势:多模型、多策略,构建灵活AI应用架构
随着生成式AI产品的普及,越来越多公司不再只依赖单一模型 ,而是根据实际业务需求,构建起多模型、多策略 的组合架构。
主流公司依赖第三方API,高增长公司开始自研
- 大多数公司仍在使用如 OpenAI GPT 系列模型 等主流第三方API;
- 高增长公司则更多尝试微调(fine-tune)基础模型,甚至从零开发自有模型 ;
- 这体现了对模型控制力、数据安全性和定制化的更高追求。
“我们之所以使用多个自研模型和第三方模型,是因为客户的需求极其多样。定制化模型能让我们在销售自动化、客服代理、内部工具等方面,提供更适配的体验。”—某全栈AI公司产品副总裁,年营收超10亿美元
多模型策略的优势:
- 按场景优化效果 (如:网络安全 vs 销售自动化)
- 平衡成本与性能
- 满足不同地区的合规性要求
- 提供更灵活的定价与部署模式
目前,多数公司选择以 OpenAI 为主力模型 + 1~2个其他模型 (如Anthropic、Mistral或开源模型)的组合方式来应对不同任务。
快速切换模型成为技术架构核心要求
- 公司开始在架构层设计 可热插拔的模型接口 ;
- 对推理速度和成本敏感的任务,会倾向采用开源模型 ;
- 一些公司则在用户敏感区域优先部署本地私有模型 ,确保数据合规。
训练策略:RAG + 微调最主流,高增长公司更灵活
- RAG(检索增强生成) 与 fine-tune(模型微调) 是最常用的两种模型训练手段;
- 高增长公司则在此基础上更擅长探索多种 prompt engineering 技术 (如:CoT、ReACT、ToT 等);
- 说明他们不仅在模型结构上多元化 ,在交互设计上也更具创造性 。
💰变现方式
多数公司采用混合定价模式 ,结合订阅/套餐制与按使用量或结果计费。
目前,大多数 AI 产品会将 AI 功能纳入高阶版本,或直接免费提供。
40% 公司暂无调整定价计划 ,但 37% 公司正探索基于用量、ROI 和分级套餐的新模式 。
🏗️组织结构
多数公司在年营收达到 $1亿 后,会设立专门的 AI 负责人,以应对日益增长的复杂性,并统一 AI 战略。
目前常见配置包括:AI/ML 工程师、数据科学家、AI 产品经理 ,其中 AI/ML 工程师的招聘周期最长 。
对招聘节奏的看法两极分化。
对于认为自己招聘不够快的公司,普遍认为“人才稀缺 ”是招聘放缓的主要原因。
整体来看,公司平均会让 20%-30% 的工程团队专注于AI ,而高增长公司这一比例更高。
💸AI 成本
多数公司将 10-20% 的研发预算 用于 AI 开发,并计划在 2025 年进一步增加投入。
随着产品规模扩大,人才成本占比下降 ,但 算力和基础设施支出上升 。
其中,API调用费用 被认为最难控制,是主要的不确定成本来源。
为降低成本,企业正探索 开源模型 和 推理效率优化 。
大多数公司每月至少训练/微调模型一次 ,月度训练开销在$16万-$150万不等,视产品成熟度而定。
🏢内部提效
企业对 AI 提效的投入正在快速上升,2025 年预算预计翻倍 ,整体投入范围为收入的 1-8%。
大部分预算仍来自研发费用 ,但也有公司开始从人力预算中划拨资金 用于AI工具应用。
尽管约 70% 员工可接触到 AI 工具 ,但真正持续使用者仅约 50%,在 年收入超 $10亿的大型企业中落地更难 。
“仅仅部署工具远远不够。真正的赋能需要培训、示范、内部支持,最关键的是高管持续推动。”—Don Vu,纽约人寿首席数据与分析官
在选择内部使用的大模型时,成本是首要考虑因素 ,其次是 准确性和隐私 。与外部产品部署以“准确性优先”不同,内部场景更关注成本和数据安全 。
企业内部部署AI的主要难点并非技术,而是战略方向,如用例选择与ROI验证 。
高效落地AI的公司通常会在 7个以上职能场景 中使用GenAI。
覆盖研发、销售等领域;相比之下,行政/财务类(G &A)场景渗透率偏低。
目前最具实际成效的内部用例是:编程辅助(Coding Assistant) ,显著提升研发效率。
高增长公司则更积极试验和推广AI工具,将其视为提效核心杠杆 。
多数公司已在追踪AI带来的效率提升与成本节省 。
内部提效场景
💼 销售提效(Sales Productivity)
多数团队直接使用 Salesforce 内建 AI 功能 (如推荐、预测、机会评分);也有使用 Apollo、Salesloft、Gong 等销售互动平台,或采用 Clay、People.ai 进行智能获客。未来可能出现平台整合或点式工具差异化发展。
📣 市场自动化与内容生成(Marketing Automation)
Canva 的生成式功能 是使用最广泛的 AI 接触点;n8n、自建工具 用于更复杂的定制化流程。中后期公司更常用 Writer、Jasper 等专用AI写作工具。
💬 客户互动(Customer Engagement)
多数团队依赖 Zendesk 或 Salesforce 的 AI 功能 处理客服需求,因其易于嵌入现有工单系统。部分需求更复杂的团队会选用 Pylon、Forethought、Grano.la、Intercom 等专业平台。
📚 知识检索与文档管理(Documentation & Retrieval)
大多数公司仍以 Notion 或现有Wiki 为基础构建知识系统,部分团队则使用 Glean、Writer 等 AI 工具实现语义搜索与索引功能。
🔐 IT 与安全(IT & Security)
ServiceNow(33%)与 Snyk(30%) 领先,显示大企业倾向于在既有 ITSM 和安全平台中集成AI;Zapier、Workato 也常被用作跨工具自动化编排器。
⚖️ 法务(Legal)
目前主要通过 ChatGPT 与脚本 辅助合同审核、合规研究;但更专业的 AI 法律平台开始出现,预计未来将分化为非正式研究 vs 合规关键流程 两类产品。
👥 人力与招聘(HR & Recruiting)
近半数团队依赖 LinkedIn 的 AI 功能 (如人才推荐、消息编排);HireVue(视频面试) 与 Mercor(人才互动) 等垂类工具也开始获得初步关注。
📊 财务预测与分析(FP&A Automation)
许多团队选择 Ramp 作为自动化平台,集成支出管理与数据同步。Pigment、Basis、Tabs 等专用工具也在增长,表明“驱动因素建模”需求上升。约三分之一团队仍使用 自建脚本、Excel 宏、定制管道 连接 ERP、BI 与账单系统。
🧱AI Builder 技术栈
🔧 模型训练与微调(Training & Finetuning)
- PyTorch 与 TensorFlow 仍是主流深度学习框架,合计占比过半;
- 与此同时,OpenAI 微调服务 与 AWS SageMaker 等托管平台也在快速普及,显示团队在“自建 vs 托管”之间呈现二分;
- Hugging Face 和 Databricks Mosaic AI 提供更高层封装,正赢得开发者青睐;
- AnyScale、Fast.ai、Modal、JAX、Lamini 等新兴工具使用占比仍在个位数,说明仍处于试验阶段;
- 年收入 $5亿+ 的公司更青睐如 Databricks Lakehouse 或 AnyScale Ray 集群 等,满足更复杂的数据治理与安全合规需求。
⚙️ LLM 应用开发(LLM & AI App Development)
- LangChain 与 Hugging Face 工具链 是目前最常用的编排框架,简化 prompt 链接与模型调用;
- 约 70% 公司使用自建或私有 LLM API ,强调安全性与可控性;
- Guardrails(安全检查) 与 Vercel AI SDK(快速部署) 开始获得关注,分别被约 30% 和 23% 的公司采用;
- CrewAI、Instructor、DSPy、DotTXT 等长尾工具 虽已被试用,但尚未形成大规模标准化。
📈监控与可观测性(Monitoring & Observability)
- 多数团队仍沿用现有的 APM / 日志系统,如 Datadog、Honeycomb、New Relic 等,因其易于集成、组织内已标准化;
- 原生ML工具如 LangSmith 与 Weights & Biases 已达 ~17% 使用率,适用于追踪 prompt 链、嵌入向量和模型漂移;
- 除此之外的工具使用率分散(如 Arize、Fiddler、Helicone、Arthur 等),10% 的受访者甚至不知道自己在用什么 ,显示出生成式AI领域在可观测性方面仍不成熟。
⚡推理优化(Inference Optimization)
- NVIDIA 生态 仍占主导地位:TensorRT 与 Triton 总共占据超过 60% 使用率 ,适用于大规模 GPU 推理;
- ONNX Runtime(18%) 和 TorchServe(15%) 是主要的跨平台或纯 PyTorch 替代方案;
- 17% 不确定自己用的优化方式,14% 明确表示未使用任何优化手段 ,说明推理优化仍存在知识盲区和教育机会,尤其是在量化、剪枝等技术方面。
☁️模型托管(Model Hosting)
- 大多数公司直接使用模型提供商的 API (如 OpenAI、Anthropic),因其简单、集成成本低;
- AWS Bedrock、Google Vertex AI 等超大厂托管平台也占据重要份额,尤其在年收入 $5亿+ 企业中更受青睐;
- 头部之外使用率迅速分散,如 Fireworks、Modal、Together.ai、AnyScale、Baseten、Replicate、Deep Infra 等,主要由于价格机制、服务等级协议(SLA)或特定功能 (如本地部署、定制推理环境)差异所驱动。
📊模型评估(Model Evaluation)
- 无明显主导工具 :约四分之一的团队依赖平台内建功能(如 Vertex、W&B、Galileo),20% 表示不知道自己用的评估工具 ;
- LangSmith、Langfuse 等专用评估平台开始受欢迎,具备 prompt 级指标、漂移监测和可定制测试;
- 一些团队仍在自行搭建评估流程,显示出市面工具未能覆盖所有需求,也反映出生成式AI评估标准尚不清晰 。
🧮数据处理与特征工程(Data Processing & Feature Engineering)
- 经典大数据工具仍占主导 :Apache Spark(44%)和 Kafka(42%)是主力,适用于批处理与实时数据流;
- Pandas 使用率高达 41%,说明在原型开发、小数据场景中,Python 工具依旧不可替代;
- 仅17% 使用专用特征库(Feature Store) ,说明“构建一次、复用多处”的理念虽被关注,但尚未规模化落地。
📦向量数据库(Vector Database)
- Elastic 与 Pinecone 位居前列,说明不少团队选择在搜索引擎基础上构建嵌入检索能力;
- Redis 也被广泛使用,用于集成已有内存数据架构;
- 开源解决方案快速增长 :如 Chroma、Weaviate、Faiss、Qdrant 等,正通过易用性、可扩展性和云原生优势挑战早期领导者。
🧬合成数据与数据增强(Synthetic Data & Augmentation)
- 52% 团队自研生成工具 ,说明现有通用平台难以满足复杂需求或集成要求;
- Scale AI 是目前最常用的第三方平台,使用率达 21%,但也只服务了约五分之一的团队;
- Snorkel AI 与 Mostly AI 等程序化生成工具已有初步市场基础,但距离广泛普及仍有差距。
✍️编码辅助(Coding Assistance)
- GitHub Copilot 是当前绝对主力,被近 75% 的开发团队采用 ,依托 VS Code 集成与 GitHub 社区的网络效应;
- Cursor 作为第二选择表现强劲,约 50% 的受访者表示使用 ,显示出市场对不同 IDE 生态的兴趣;
- 除此之外工具使用率迅速下滑,说明大多数团队虽试用过其他 AI 助手,但未形成标准化替代;
- 低/无代码平台 如 Retool、Lovable、Bolt、Replit 也被提及,说明从“想法到应用”的产品生成需求正在增长。
🛠️DevOps / MLOps 工具
- MLflow 使用率达 36%,是实验管理、模型注册和基础管道编排的首选;
- Weights & Biases 使用率为 20%,因可视化和协作功能被广泛认可;
- 16% 受访者表示“不知道自己用的是哪套 MLOps 工具” ,显示该领域职责界限(DevOps vs MLOps)尚未清晰;
- 整体来看,多数团队仍停留在“实验追踪”阶段 ,真正实现自动化部署、漂移监控和回滚机制的仍是少数。
🎨产品与设计(Product & Design)
- Figma 使用率高达 87%,成为 UI/UX 设计事实标准,因其实时协作、组件库和插件生态优势显著;
- Miro 也有 37% 使用率 ,在产品头脑风暴、用户旅程图和跨职能协作中扮演重要角色;
- 当前还未看到 AI 原生设计工具的大规模采用,但团队已开始借助 Bolt、Lovable、Vercel V0 等工具进行快速原型设计。
关于 ICONIQ Capital
ICONIQ Capital 是一家私密度极高的「多家族办公室」(multi‑family office)。它成立于 2011 年,总部位于旧金山,为包括扎克伯格在内的多位科技巨头和娱乐界高净值人士提供财富管理服务。ICONIQ Capital 管理着扎克伯格(以及达斯汀·莫斯科维茨、Sheryl Sandberg、Jack Dorsey 等多位硅谷大佬)的财富,总资产管理规模达 800 亿美金左右。他们采用「家族办公室 + 成长型投资基金」的混合模式,一边为家族提供理财、风险管理、慈善规划等服务,一边通过旗下的 Iconiq Growth 投资科技和成长类企业。
🎥 Watch the Animated Story
📺 Experience the complete creation story in this beautifully animated video