
开源项目 huobao-drama 宣称“一句话生成完整短剧”,这不是营销噱头——它用 5 个 Mastra AI Agent 串联起从剧本改写、角色提取、分镜拆解、音色分配到宫格提示词生成的全流程,搭配多厂商 API 实现图生视频、TTS 配音和 FFmpeg 合成。
开源项目 huobao-drama 宣称“一句话生成完整短剧”,这不是营销噱头——它用 5 个 Mastra AI Agent 串联起从剧本改写、角色提取、分镜拆解、音色分配到宫格提示词生成的全流程,搭配多厂商 API 实现图生视频、TTS 配音和 FFmpeg 合成。当前 GitHub 收获 13.1k Star 和 2.5k Fork,技术栈完整,部署门槛清晰,值得短剧制作团队和技术爱好者深入研究。
技术架构:全栈 TypeScript,Agent 驱动
项目采用前后端分离架构:
- 前端:Nuxt 3 + Vue 3 + TypeScript,纯 CSS 无 UI 库,意味着可定制性强且体积可控。
- 后端:Hono(轻量 Web 框架)+ Drizzle ORM + better-sqlite3,数据库和生成资源全部本地存储,不依赖外部服务。
- AI 层:Mastra AI Agents 框架,内置 5 个可配置 Agent,每个 Agent 拥有独立的 Skill 定义(skills/ 目录下的 SKILL.md),支持通过数据库动态扩展。
核心数据流:用户输入一句话 → scriptrewriter 将自然语言转为结构化剧本 → extractor 提取角色和场景并去重 → storyboardbreaker 生成分镜序列 → voiceassigner 自动匹配音色 → gridprompt_generator 生成角色/场景/宫格图提示词。后续调用图片、视频、TTS 厂商 API 完成素材生成,最后 FFmpeg 合成单镜头和整集视频。
工作流与差异化优势:全流程自动化与本地可控
相比市面已有的 AI 视频工具(如 Sora 仅文生视频,HeyGen 侧重数字人),火宝短剧的差异化在于:
| 维度 | 火宝短剧 | 其他工具 |
|---|---|---|
| 输入 | 一句自然语言 | 需要手动编写剧本或提示词 |
| 角色管理 | 批量生成+音色分配+图片管理 | 通常需外部工具 |
| 分镜控制 | AI 自动拆解,支持首帧/尾帧/分镜板 | 多依赖人工介入 |
| 素材存储 | 本地 SQLite + 文件系统 | 云端依赖 |
| 厂商锁定 | 无:图片/视频/TTS 均可切换 | 通常绑定单一模型 |
尤其值得关注的是“宫格图生成与切分”功能:AI 生成一张包含多个分镜的宫格图,后端自动切分并分配到对应分镜,这大幅降低了逐张生成的 API 调用次数和成本。
多厂商模型适配:灵活的后端配置
项目支持按类型自由切换 AI 厂商,且 API Key 在 Web 界面“设置”页面中实时配置(无需修改代码):
- 图片:OpenAI、Gemini、MiniMax、火山引擎、阿里、Chatfire
- 视频:MiniMax、火山引擎/Seedance、Vidu、阿里
- TTS:MiniMax
这意味着用户可以根据预算和效果选择最经济的组合,例如用开源模型生成图片,用 Seedance 做视频,用 MiniMax 做配音。配置文件 configs/config.yaml 仅控制默认厂商,真实 API 凭证通过前端面板管理。
部署与使用:开发与生产模式清晰
项目对开发者友好:
- 环境要求:Node.js 20+、npm 9+、FFmpeg 4.0+(必须)。
- 启动方式:开发模式支持前后端热重载(npm run dev),生产模式可构建前端后由后端单服务运行。
- 数据持久化:SQLite 数据库和素材文件全部存储在 data/ 目录下,迁移备份仅需拷贝该文件夹。
- Docker 支持:项目根目录包含 Dockerfile 和 docker-compose.yml,可一键容器化部署。
唯一的限制是 AI 厂商 API 需要自行申请,但项目文档给出了明确的配置指引(复制 config.example.yaml 后通过 Web 设置填入)。
局限与适用场景
项目当前仍处于快速迭代中(275 次 commit),README 中“示例作品”为外部链接,实际视频质量取决于所选厂商模型。对于追求极致画面质量或复杂叙事逻辑的用户,可能需要自行优化 Agent 提示词或引入更多模型。此外,开源版与商业版(火宝短剧商业版)的关系尚未完全披露,但开源版提供了完整的前后端代码,足以支撑个人或小团队的二次开发。
适用人群:AI 视频创作者、独立短剧工作室、希望低成本验证“AI 生成视频”流程的技术探路者。如果你需要从零搭建一套自动化短剧生产线,火宝短剧是目前 GitHub 上最完整、最可复现的方案。

评论列表 (0条):
加载更多评论 Loading...