如果你还没听说过 Agnes AI,这不奇怪。它主战场在东南亚和拉美,北美欧洲的媒体对其鲜有报道。但有几个数字你可能需要先看一眼:
- 2024 年 7 月上线,一年不到注册用户破百万,DAU 过 10 万
- 2025 年 9 月商业化,当时 RRR 就做到了 800 万美元
- 2026 年 6 月,宣布全模态 API 无限期免费——文本、图像、视频,一个 Key 全通,不收一分钱,不用绑银行卡
而它的核心团队,不过是新加坡国立大学走出来的一帮博士生和连续创业者。
这事儿有点意思。不是因为它”技术有多强”——而是它的打法和市面上所有 AI 公司的路径都不太一样。
很多人以为 Agnes AI 就是个 API 提供商,其实它有三个面。
Agnes(主端)是一个 AI Agent 工作台,内置自研的 Agnes-2.0-Flash 模型,能做多步复杂任务——写代码、做 PPT、数据分析、长文撰写。这个 Agent 在 Claw-Eval(真实 Agent 场景评测榜)上进了全球前十,跟 OpenAI 和 Anthropic 的模型排在一起。

Pavo 是一个多模态视觉创作引擎,专注文生图和文生视频。画质自己去官网看,确实能打。
Echo 是互动剧情平台——你做一个选择,AI 实时生成下一段剧情和对应的场景图。本质上是一个”带视觉渲染的文字冒险游戏生成器”。
然后才是那个拿来当流量入口的 免费全模态 API:文本用 agnes-2.0-flash,生图用 agnes-image-2.1-flash,视频用 agnes-video-v2.0。API 完全兼容 OpenAI 接口,改个 base_url 就能切过来。
这是产品层面的”组合拳”——C 端应用拉活跃,API 拉开发者,两端在一个生态里互相导流。
接下来聊策略,这才是 Agnes AI 最值得看的地方。
创始人 Bruce 在新加坡国立大学读 AI 博士,之前在伯克利读数学与计算机双学位,去过微软和领英。联合创始人 Will 也是伯克利出身,之前跟他一起创过业。
2024 年下半年,他们原来的 toB 数字营销业务碰到天花板,团队一咬牙全部转了 AI。当时他们问了自己一个问题:全球 60 亿人,真正用上 AI 的有几个?
答案是一小撮。不是技术门槛,不是需求不够,而是成本和体验门槛。好的模型 API 贵——OpenAI 要绑卡、Anthropic 要绑卡、Google 也要绑卡。开发者想试个功能,先掏出信用卡填一圈表单,然后看着 token 计数器心算成本,这还怎么玩?
所以他们做了两个核心决策。
第一个是把 DAU 当成北极星指标,不是收入。联合创始人 Will 在访谈里说得直白:AI 应用的付费率不会超过 5%,指望那 5% 养不活产品。唯一的出路是先把另外 95% 拉进来,靠规模和停留时长换未来。所以 Agnes 主端免费,API 免费,每月赠送的任务量比一些付费套餐还多。
第二个更狠:把免费从文本延伸到图像和视频。 文本 Token 便宜,你给我免了那叫诚意。图像和视频的推理成本比文本高两个数量级,你给我免了——这叫战略。
你可能想问:免费怎么活下去?
答案是技术降本。
Agnes 团队自研了多个专用模型,包括一个 7B 参数的编排调度模型和一个 32B 参数的行动模型,通过蒸馏整合成 MOE 架构用于特定任务。在 Agent 间的内部通信中,他们用代码代替自然语言——代码比人话紧凑得多,经实测通信 Token 消耗降低了 40%~70%。再加上任务编排剪枝和 A* 搜索替代传统 DFS/BFS 的路径优化,推理成本被压到了行业水平的几分之一。
这是一笔账:产品免费 → 用户涌入 → DAU 暴涨 → 但通过自研模型和工程优化,每个用户的推理成本远低于同行 → 免费策略可持续。
这才是 Agnes AI 最核心的东西——它不是用资本补贴打市场,是用技术降本换市场。
回到这次的全模态 API 免费政策。
RPM 限制是每分钟 20 次(免费用户),对个人和小型项目够用,高并发场景不适用。视频生成走异步任务,3-5 秒的内容大约等 2-3 分钟。实测中发现的坑——视频 URL 返回字段名跟文档对不上、文生图传了不该传的参数会报错——也算是早期产品的正常现象。
但对比一下同行:你在 OpenAI 跑一个文生视频大概要几块钱,在 Google 跑也不便宜。Agnes 全模态免费,而且明确说”核心模型长期免费,无过期限制”。绑卡?不需要。预充值?跳过就行。
这个定位像极了当年的 DeepSeek——用远低于行业的价格(甚至免费),倒逼整个市场重新思考”什么才是一个合理的定价”。只不过 DeepSeek 打在文本推理上,Agnes 打在多模态上。
不过这里面有也很大的不确定性。
首先,RPM 限制下,免费 API 目前显然不适合生产级高并发场景。其次,Agnes 的模型在绝对性能上跟 GPT-4o、Claude Sonnet 4 比还有差距——Claw-Eval 前十固然不错,但那是 Agent 场景下的专项评测,覆盖面和主流综合基准不是一个维度。团队自研的模型还在快速迭代中,32B 的行动模型也还没完全落地。
最大的不确定性还是商业模型本身:无限期免费 + 技术降本,这依赖于推理成本持续下降的速度快于用户规模增长的速度。这条路 DeepSeek 跑通过一次,但 DeepSeek 背后有量化基金的利润撑着。Agnes 是创业公司,资方和团队能有多少耐心,决定了这个免费窗口到底能开多久。
如果你是个独立开发者,想低成本跑通一个带图像甚至视频生成能力的 MVP——Agnes 的全模态 API 是目前市面上门槛最低的选择,没有之一。改个 base_url 就能用,不值得在这个环节犹豫。
评论列表 (0条):
加载更多评论 Loading...