想做短视频的人很多,但大多数人卡在第一步: 不会写脚本:绞尽脑汁想不出文案 不会找素材:不知道去哪找高清无版权的视频片段 不会剪辑:PR、剪映上手有学习成本 不会配音:自己录声音不好听,AI 配音又不知道怎么调 不会加字幕:手动打轴太费时间 一个 60 秒的短视频,从构思到发布,
想做短视频的人很多,但大多数人卡在第一步:
- 不会写脚本:绞尽脑汁想不出文案
- 不会找素材:不知道去哪找高清无版权的视频片段
- 不会剪辑:PR、剪映上手有学习成本
- 不会配音:自己录声音不好听,AI 配音又不知道怎么调
- 不会加字幕:手动打轴太费时间
一个 60 秒的短视频,从构思到发布,熟练的创作者也要花 1-2 小时。新手可能要半天甚至一天。如果每天要发 3-5 条,基本就不用干别的事了。
找专业团队做一条短视频,报价从几百到几千不等。对于个人创作者、小商家、自媒体新手来说,这笔费用很难承担。
这些问题现在可以很容易解决,MoneyPrinterTurbo是一个让你只需要输入一句话,就能自动生成一条完整短视频的开源工具。
项目介绍
MoneyPrinterTurbo —— 利用 AI 大模型,一键生成高清短视频。只需提供一个视频主题或关键词,即可全自动生成视频文案、视频素材、视频字幕、视频背景音乐,并合成一个高清短视频。
这个项目是经典项目 MoneyPrinter 的 Turbo 升级版,在社区中拥有极高的人气——80.5k Stars 足以说明它的受欢迎程度。
核心功能
AI 自动生成文案
- 支持输入主题/关键词,AI 自动撰写视频文案
- 也支持用户自定义文案,灵活度高
- 支持中英文双语文案生成
高清视频素材自动匹配
- 素材来自高清、无版权图库
- 自动根据文案内容匹配合适的视频画面
- 也支持使用本地素材(自定义品牌素材库)
多种语音合成
- Edge TTS(免费):无需额外付费,开箱即用
- Azure TTS V2(付费):更高品质的语音合成,适合商业场景
- 支持实时试听,选好再生成
智能字幕生成
两种模式可选:
| 模式 | 速度 | 准确度 | 说明 |
|---|---|---|---|
| edge 模式 | ⚡ 快 | 标准 | 快速生成,无需下载模型 |
| whisper 模式 | 🐢 较慢 | ✅ 高 | 基于 faster-whisper,需下载模型 |
- 支持调整字体、位置、颜色、大小
- 支持字幕描边设置,画面更清晰
背景音乐
- 自带了背景音乐库(位于
resource/songs目录) - 支持随机选择或指定特定音乐文件
- 可调节背景音乐音量大小
多尺寸支持
| 尺寸 | 分辨率 | 适用平台 |
|---|---|---|
| 竖屏 9:16 | 1080×1920 | 抖音、快手、视频号、TikTok |
| 横屏 16:9 | 1920×1080 | YouTube、B站、西瓜视频 |
批量生成
- 支持一次生成多个视频
- 从中选择最满意的成品
- 可设置视频片段时长,调节素材切换频率
多种 AI 模型接入
支持接入几乎所有主流 AI 模型:
| 类型 | 支持的模型/平台 |
|---|---|
| OpenAI 系 | OpenAI、gpt4free、one-api、AIHubMix |
| 国内大模型 | 通义千问、DeepSeek、文心一言、MiniMax、Moonshot |
| 国际大模型 | Google Gemini、Azure OpenAI |
| 本地模型 | Ollama(可本地部署) |
| 其他 | Pollinations、ModelScope |
技术栈一览
| 组件 | 用途 |
|---|---|
| Python | 主要开发语言 |
| moviepy | 视频合成编辑 |
| streamlit | Web 界面框架 |
| faster-whisper | AI 语音识别(字幕生成) |
| Pillow | 字幕渲染(字体、描边) |
| Edge TTS / Azure TTS | 语音合成 |
| Docker | 容器化部署 |
安装指南
方式一:Windows 一键启动包(推荐新手)
- 下载最新版一键启动包(v1.2.6+,路径不要有中文、特殊字符、空格)
- 解压后,先执行
update.bat更新到最新代码 - 双击
start.bat启动 - 浏览器访问
http://127.0.0.1:8501
方式二:Docker 部署
git clone https://github.com/harry0703/MoneyPrinterTurbo.gitcd MoneyPrinterTurbodocker-compose up
方式三:手动部署
# 克隆代码git clone https://github.com/harry0703/MoneyPrinterTurbo.gitcd MoneyPrinterTurbo# 推荐使用 uv 创建虚拟环境并安装依赖uv sync --frozen# 启动 Web 界面uv run streamlit run ./webui/Main.py --browser.gatherUsageStats=False# 或使用脚本(Windows)webui.bat# (Linux/Mac)# ./webui.sh
方式四:Google Colab
无需本地环境,直接在线体验,适合只想尝鲜的用户。
配置环境变量
复制并编辑配置文件:
cp config.example.toml config.toml# 填入 AI 模型的 API Key# 如:OPENAI_API_KEY、DEEPSEEK_API_KEY 等
使用方式
通过 Web 界面
启动后,浏览器访问 http://127.0.0.1:8501:
- 输入主题:填写视频主题或关键词
- 选择配置:视频尺寸、语音、字幕、背景音乐
- 点击生成:等待几分钟,一条完整短视频就出来了
- 预览 & 下载:满意就下载,不满意重新生成
通过 API 接口
启动 API 服务后:
uv run python main.py
访问 http://127.0.0.1:8080/docs(http://127.0.0.1:8080/docs) 查看 Swagger API 文档,可以集成到自己的自动化工作流中。
注意事项
配置要求
| 配置项 | 最低 | 推荐 | 理想 |
|---|---|---|---|
| CPU | 4 核 | 8 核 | 16 核 |
| RAM | 8GB | 16GB | 32GB+ |
| GPU | 可选 | NVIDIA 6GB+ VRAM | 高性能 GPU |
| 硬盘 | 10GB 可用空间 | SSD 50GB+ | SSD 100GB+ |
语音合成选择
| 方案 | 费用 | 质量 | 推荐场景 |
|---|---|---|---|
| Edge TTS | 🆓 免费 | 良好 | 个人试用、非商业用途 |
| Azure TTS V2 | 💰 付费 | ⭐ 优秀 | 商业项目、追求高品质 |
字幕生成模式
- edge 模式:速度快,无需下载额外模型,适合多数场景
- whisper 模式:准确度更高,但首次使用需下载大模型文件(约 1-2GB)
- 如果下载失败,可在 Hugging Face(https://huggingface.co/Systran/faster-whisper-large-v3) 手动下载后放到指定目录
常见问题
| 问题 | 解决办法 |
|---|---|
| ffmpeg 未安装 | 安装 ffmpeg 并确保在 PATH 中 |
| Whisper 模型下载失败 | 手动下载模型文件到本地 |
| Too many open files | Linux/Mac 下调高文件打开限制 |
| 中文路径报错 | 项目路径不要包含中文、空格、特殊字符 |
| 视频生成太慢 | 减少视频时长或使用 GPU 加速 |
项目总结
亮点
- 完全免费,开源 + 可选择免费 AI 服务(Edge TTS + 免费大模型)
- 上手极快,Windows 一键启动包,解压即用
- 全自动流程,输入主题 → 自动出片,几乎零人工干预
- 扩展性强,支持 API 集成,可嵌入自动化工作流
- 多模型支持,几乎兼容所有主流 AI 大模型
- 多尺寸输出,兼顾抖音、YouTube 等不同平台
不足
- ❌ 视频素材来自公共图库,版权上需要注意二次创作合规性
- ❌ AI 生成的文案质量依赖所选大模型,免费模型效果一般
- ❌ 长视频生成耗时较长(尤其使用 whisper 字幕模式)
- ❌ 语音合成的自然度和真人配音仍有差距
- ❌ 批量生成时的资源消耗较大
如果你想做短视频但缺时间、缺技能、缺预算,MoneyPrinterTurbo 就是你的最佳选择。 输入一个主题,3 分钟后你就拥有一条可以发布的完整短视频——而且完全免费。这类工具现在更多的还是服务于技术团队的,普通的小商家成本可能会降一些,但不会断崖式下跌。但这是一个好的方向,将来会有越来越多的团队让这类产品做成更低门槛的工具。
开源信息
| 项目 | 信息 |
|---|---|
| GitHub 地址 | https://github.com/harry0703/MoneyPrinterTurbo |
| Stars | ⭐ 80,500+ |
| 开源协议 | MIT License |
评论列表 (0条):
加载更多评论 Loading...