2026 年 4 月最新热门开源项目

数据截至2026-04-21，均为近期周增速最快、开发者刷屏顶流项目，含 AI Agent、大模型、前端、后端、多模态、工具、国产开源等类别。

一、AI Agent / 智能体（当前顶流赛道）

1. NousResearch/hermes-agent（爱马仕 Agent）

Star：7.5 万 +，本周周增 3.8 万 +，全球 Trending 连续榜首

语言：Python

协议：MIT

地址：https://github.com/NousResearch/hermes-agent

Hermes Agent 是开源 AI 研究机构 NousResearch 推出的下一代自进化个人 AI 智能体框架，也是 2026 年 Q4 最炸裂黑马项目，彻底区别于传统被动式 Agent。项目核心创新是闭环自主学习系统：Agent 完成每一次任务后自动复盘、提炼可复用技能、优化执行策略、压缩长期记忆，实现越用越强、持续成长，而非每次从零执行。

原生支持终端操作、文件读写、浏览器自动化、定时任务调度、多平台消息接入，内置持久化记忆库与工具调用沙箱，安全隔离执行环境。兼容所有 OpenAI API 格式模型，包括 Llama、Qwen、DeepSeek、Claude 等，开箱即用 Docker 部署。

相比 OpenClaw，它在记忆效率、自主决策、长期成长上全面升级，是目前开源界主动式智能体标杆，适合个人 AI 助手、桌面自动化、企业内部智能员工、复杂任务编排开发，社区更新极快，4 月 v0.8 新版本大幅提升稳定性。

2. OpenClaw/openclaw（龙虾 Agent）

Star：35.6 万 +，长期霸榜，生态最完善通用 Agent

语言：TypeScript

协议：MIT

地址：https://github.com/openclaw/openclaw

OpenClaw 是目前全球生态规模最大、插件最丰富的跨平台全能 AI 自动化智能体网关，俗称 “龙虾 Agent”，长期占据 GitHub 智能体榜单前列。项目主打全渠道连接一切，原生适配 Telegram、WhatsApp、微信、桌面客户端、浏览器、Slack 等 25 + 消息与操作平台，内置 90 + 官方插件、13000 + 社区技能库，支持全自动电脑操作、网页交互、文件处理、代码执行、数据分析、外网检索全能力。采用全量持久化记忆架构，完整保存跨会话历史上下文，提供可视化管理后台、权限控制、任务日志监控。

工程化高度成熟，支持 Docker 一键部署、二次开发扩展、MCP 工具协议对接，兼容 Ollama 本地模型与云端 API 混合调用。适合多平台运营自动化、个人桌面助手、团队协作 Agent、爬虫与办公自动化，是开发者快速落地 AI Agent 项目的首选成熟框架，缺点是长期记忆 Token 消耗偏高，正在持续优化。

3. bytedance/deer-flow（字节鹿流 AI Agent）

Star：5.7 万 +，单月新增 3 万 +，国产工业级 Agent 框架

语言：Python

协议：MIT

地址：https://github.com/bytedance/deer-flow

Deer-Flow（鹿流）是字节跳动官方开源的企业级多智能体协同编排框架，完全国产自研，基于 LangGraph 生态重构，是国内最成熟可商用 AI Agent 工业底座。

核心能力为复杂任务自动拆解、子智能体并行执行、多 Agent 协作调度、流程可视化编排，内置标准化记忆管理、文件系统、安全沙箱、技能插件体系，完全兼容国产通义千问、DeepSeek、GLM 及海外全系列模型。提供可视化低代码工作流画布，非技术人员也能拖拽搭建 AI 工作流，开箱内置搜索、文档分析、代码执行、报表生成 50 + 工具。

支持 Docker/K8s 部署，普通电脑即可本地运行，无需专业高端 GPU，完全开源可商用。适合企业内部流程自动化、财报分析、学术调研、运维自动化、知识库问答、大型复杂业务智能体开发，解决开源 Agent 难以落地生产环境、稳定性不足、多 Agent 协同困难的行业痛点，是国产 Agent 生态核心支柱项目。

4. browser-use

本周 Trending 置顶，AI 浏览器自动化第一库

语言：Python

协议：MIT

地址：https://github.com/browser-use/browser-use

browser-use 是基于 Playwright 深度封装的开源 AI 浏览器自动化专用库，2026 年 4 月极速爆火，彻底降低 Agent 网页操作开发门槛。

项目核心是让大模型 Agent自主理解网页结构、自动点击、填表、滚动、爬虫、下单、数据提取、页面交互，无需人工编写复杂 XPATH/CSS 选择器，模型原生感知页面元素语义。内置智能等待、反检测、异常重试、会话保持、多标签管理能力，完美对接 Hermes、OpenClaw、LangChain 等所有主流 Agent 框架，一键集成工具调用链。相比传统 Selenium、Playwright，它专为 AI Agent 设计，语义化操作、容错率极高、开发量减少 90%。

支持无头浏览器、可视化调试、Docker 部署，适合 AI 网页爬虫、自动办公填表、电商自动化、网页数据分析、Agent 互联网信息检索场景，是当前 Agent 生态必备配套工具库，社区迭代速度极快，每周更新功能。

5. everything-claude-code

Star：10.4 万 +，周增 2.1 万 +，Claude Code 全套开源增强套件

语言：TypeScript/Python

协议：Apache2.0

地址：https://github.com/everything-claude-code

everything-claude-code 是 Anthropic Claude Code 官方最佳开源实现与增强全家桶，完整复刻并扩展 Claude 原生代码能力，是 AI 编程领域顶流开源项目。

项目完整实现 5 层上下文压缩、流式工具预执行、Prompt 缓存共享、代码增量修改、断点调试、项目级代码理解、SWE-bench 代码修复基准全能力。

原生支持 VSCode、JetBrains IDE 对接，支持本地模型 + Claude 云端混合调用，内置代码重构、漏洞检测、注释生成、单元测试自动编写全套能力。解决原生 Claude Code 闭源、无法二次开发、无法本地私有化部署、无扩展插件的问题，完全开源可二次改造，提供完整 MCP 工具链与 API 接口。

适合 AI 编程开发者、IDE 插件开发、企业私有化代码助手、代码审计优化场景，是 Claude 生态最权威开源分支，全球大量开发者基于此搭建自有 AI 编程助手。

6. thedotmack/claude-mem

Star：5.9 万 +，Claude 长会话记忆增强神器

语言：Python/TS

协议：MIT

地址：https://github.com/thedotmack/claude-mem

claude-mem 是专门针对 Claude 系列模型开发的开源长会话记忆持久化增强插件，完美解决 Claude 原生上下文截断、跨会话记忆丢失、长对话 Token 爆炸问题。核心技术为智能语义压缩、自动记忆分层、跨会话知识继承、重要信息永久保存、冗余内容自动清理，动态平衡记忆完整度与 Token 消耗。支持向量数据库本地存储、云端同步、记忆手动编辑、记忆检索查询，无缝对接 Claude API、Claude Code、Open WebUI 等所有 Claude 生态产品。无需改动原有代码，一行配置即可接入，支持私有化部署，数据完全本地可控。适合长期项目开发、复杂持续对话、知识库问答、长期个人 AI 助手场景，是 Claude 用户必备开源工具，4 月新版本大幅提升中文记忆理解能力，社区好评度极高。

二、本地大模型 / 推理框架

1. ollama/ollama

Star：9 万 +，本地大模型事实标准，全球最流行本地 LLM 工具

语言：Go

协议：MIT

地址：https://github.com/ollama/ollama

Ollama 是目前全球最主流、最易用的本地开源大模型一键运行工具，彻底简化本地部署复杂流程，已经成为本地 LLM 领域行业标准。项目将模型下载、环境配置、GPU 加速、量化推理、API 服务全部封装为极简命令行工具，一行命令即可本地启动 Llama、Qwen、DeepSeek、GLM、MiniMax 等全系列开源模型，CPU/GPU/ 边缘设备全兼容。原生支持 OpenAI 兼容 API 接口，可无缝对接所有 LLM 应用、Agent、前端界面，支持模型量化、自定义 Modelfile、Docker 部署、多模型管理、模型导出分享。完全本地私有化运行，对话数据不离开本机，极致保护隐私，提供 Python/JS 官方 SDK，生态极其完善，Open WebUI、Dify、OpenClaw 全部原生支持对接。适合个人本地 AI、私有化部署、开发者本地测试、边缘端大模型运行，是所有本地 AI 项目的底层基础设施，2026 年持续更新多模态、长上下文、更快推理优化。

2. google-ai-edge/LiteRT-LM

Star：8000+，周增 2100+，谷歌边缘端大模型推理引擎

语言：C++/Python

协议：Apache2.0

地址：https://github.com/google-ai-edge/LiteRT-LM

LiteRT-LM 是谷歌官方开源的超低延迟边缘端大模型专用推理框架，专为手机、嵌入式设备、工控机、边缘盒子设计，是移动端本地 LLM 最优解决方案。

基于 TensorFlow Lite 深度优化，针对 ARM 架构极致压缩算子，推理速度比传统框架提升 3–10 倍，内存占用大幅降低，支持 INT4/INT8 量化、动态 Batch、流式输出、长上下文优化。原生适配 Qwen、Llama、Gemma 等轻量开源模型，支持离线完全本地运行，无需云端联网，提供 Android/iOS 原生 SDK、C++ 跨平台接口。

解决传统推理框架体积大、功耗高、不适合移动端、延迟高的痛点，适合手机本地 AI 助手、车载 AI、物联网智能设备、嵌入式语音交互、离线边缘智能场景，是谷歌 Edge AI 生态核心组件，2026 年 4 月新版本大幅增强中文模型适配能力。

三、AI 应用开发 / 低代码平台

1. langgenius/dify

Star：13.2 万 +，生产级 LLM 应用低代码开发平台

语言：Python/TS

协议：MIT

地址：https://github.com/langgenius/dify

Dify 是目前国内外最成熟、可直接上生产的LLM 可视化低代码开发平台，一站式覆盖 Prompt 编排、RAG 知识库、Agent 工作流、API 发布、监控运维全链路。提供可视化画布拖拽搭建 AI 工作流，无需编写代码即可创建问答、写作、数据分析、Agent 智能应用，原生支持上百种云端 + 本地模型（Ollama、Claude、OpenAI、国产模型全兼容）。

内置完整 RAG 文档 pipeline，支持 PDF/Word/PPT/ 网页一键解析入库，50 + 内置 Agent 工具（搜索、画图、计算器、代码执行），完善 LLMOps 日志监控、流量统计、权限管理、版本管理。

支持 Docker 一键部署、私有化开源商用、API 对外服务输出，企业与个人开发者通用。

适合快速搭建 AI 客服、知识库问答、内容创作工具、企业内部 AI 应用、Agent 后台管理，是 LLM 应用开发首选开源平台，社区活跃、文档完善、商业化落地案例极多。

2. langchain/langchain

Star：12.9 万 +，LLM 应用开发全球主流底层框架

语言：Python/TS

协议：MIT

地址：https://github.com/langchain/langchain

LangChain 是全球最权威、生态最完善的大模型应用底层开发框架，是所有 LLM 应用、Agent、RAG 项目的基础底座。

核心解决原生大模型知识静态、无法调用工具、无长期记忆、无法复杂任务拆解的缺陷，提供模块化链式调用、工具集成、记忆管理、RAG 检索、Agent 推理、多模型统一抽象接口全套组件。标准化模型接口，一键切换所有云端 / 本地模型，支持自定义工具、自定义记忆、自定义工作流逻辑，完全开源可扩展，Dify、Deer-Flow、browser-use 全部基于 LangChain 生态构建。

提供 Python/TypeScript 双语言 SDK，完善文档、大量示例项目，适合专业开发者深度定制 LLM 应用、自研 Agent 框架、企业级复杂 AI 系统开发，是 LLM 开发领域事实标准底层库，2026 年持续升级多 Agent 协同、MCP 协议、长上下文能力。

四、前端 / UI / 渲染

1. chenglou/pretext

Star：2.8 万 +，前端近期刷屏顶流，React 官方团队开源排版引擎

语言：TypeScript

协议：MIT

地址：https://github.com/chenglou/pretext

Pretext 由 React 核心团队成员开源，是新一代纯 TypeScript 高性能文本排版渲染引擎，彻底解决前端多行文本布局、换行、对齐、富文本排版性能极差的行业痛点。项目体积仅几 KB 零依赖，渲染速度比传统 DOM 排版、Canvas 方案快 500 倍，支持复杂富文本、自动换行、段落间距、多行对齐、中文排版优化、动态文本实时重排。

完全基于函数式声明式 API，与 React/Vue 完美兼容，无 DOM 副作用、内存占用极低，支持服务端 SSR 渲染。区别于传统排版库，它内核自研排版算法，不依赖浏览器原生排版引擎，跨端表现完全一致，解决浏览器兼容性、排版不一致问题。

适合富文本编辑器、笔记软件、文档网页、移动端 H5、复杂 UI 文本展示场景，是 2026 年前端最具革命性开源库，一经开源立刻刷屏前端社区，大量头部项目开始迁移接入。

2. open-webui/open-webui

Star：12.7 万 +，自托管开源 AI ChatWeb 界面标杆

语言：TS/Go

协议：MIT

地址：https://github.com/open-webui/open-webui

Open WebUI 是功能最完善、体验最好的私有化开源 ChatGPT 式 AI 网页前端，完全离线自托管、数据本地可控。原生深度对接 Ollama 本地模型，同时兼容所有 OpenAI API 兼容云端模型，支持多模型一键切换、聊天历史管理、对话分组、自定义 Prompt、RAG 知识库、插件扩展、多用户权限分组管理。

界面现代化响应式设计，PC / 手机自适应，支持暗黑模式、对话导出、代码高亮、文件上传解析，Docker/K8s 一键部署，开箱即用无需复杂配置。内置完善后台管理、流量监控、模型管理，完全开源可二次定制界面与功能。

适合搭建私有本地 AI 聊天站、企业内部 AI 门户、Ollama 可视化管理后台、个人私有化 AI 助手前端，是本地 AI 生态必备 UI 项目，社区插件生态极其丰富，每周持续更新功能。

五、多模态 / 图像 / 语音生成

1. comfyui/comfyui

Star：10.6 万 +，节点式 AI 图像生成工作流标杆

语言：Python

协议：MIT

地址：https://github.com/comfyui/comfyui

ComfyUI 是全球最流行、最强大的节点式可视化 AI 图像 / 视频生成工作流编辑器，是 AI 绘画领域事实标准工具。完全原生兼容 Stable Diffusion、Flux 全系列模型，通过拖拽节点搭建完整生成、修图、放大、ControlNet、Inpaint、超分、视频生成工作流，无需编写代码，可视化调试每一步参数。

相比 WebUI 传统界面，它显存占用更低、推理速度更快、支持复杂非线性工作流、批量生成、工作流导入导出、自定义节点插件扩展。社区拥有上万开源工作流与插件，支持文生图、图生图、局部重绘、高清修复、AI 视频生成、多模态融合全能力。

适合 AI 绘画创作者、设计师、AI 图像二次开发、批量内容生产、高阶图像生成调试，2026 年持续升级 Flux 原生支持、视频生成加速、本地轻量化部署能力，是 AI 图像领域必用开源项目。

2. OpenBMB/VoxCPM

Star：1.1 万 +，周增 1200+，国产无分词器多语言语音 SOTA 模型

语言：Python

协议：Apache2.0

地址：https://github.com/OpenBMB/VoxCPM

VoxCPM 是智源 OpenBMB 团队开源的新一代国产端到端语音合成 TTS 模型，是目前中文语音生成 SOTA 级别开源项目。最大创新是无分词器端到端架构，无需中文分词、韵律标注，直接输入文本原生输出自然流畅人声，韵律自然、情感丰富、多音字准确率极高，解决传统 TTS 生硬、断句不合理、中文效果差问题。支持多音色、情感语音、语速调节、长文本流式合成、本地离线运行，体积轻量化，普通 CPU 即可推理，兼容移动端部署。

中文效果远超海外开源 TTS 模型，支持中英混合语音合成，开源可商用，提供 Python SDK、API 服务、推理加速优化。适合语音交互产品、有声书制作、AI 助手语音播报、车载语音、内容创作语音生成场景，是国产语音开源生态核心标杆项目。

六、文档 / 工具 / 效率库

1. microsoft/markitdown

Star：10.6 万 +，周增 2500+，微软开源全格式转 Markdown 神器

语言：Python

协议：MIT

地址：https://github.com/microsoft/markitdown

Markitdown 是微软官方开源的全能结构化文档转 Markdown 工具库，是知识库、RAG 系统必备基础设施。

支持 PDF、Word、Excel、PPT、图片、网页、EPUB 等几乎所有常见格式一键精准转换为标准结构化 Markdown，完美保留标题层级、列表、表格、代码块、图片链接、段落排版，提取精度远超同类开源工具。内置 OCR 图片文字识别、PDF 版式分析、乱码修复、表格还原、复杂文档解析能力，轻量无重型依赖，Python 一键安装调用，支持批量转换、本地离线运行、Docker 部署。

解决传统转换工具排版混乱、表格丢失、格式错乱、无法解析扫描版 PDF 的痛点，适合搭建 AI 知识库、RAG 文档预处理、文档批量归档、内容爬虫结构化提取场景，一经开源立刻霸榜工具类榜单，是开发者必备效率开源库。

七、安全 / 渗透 AI

pentagi（本周 Trending 热门 AI 渗透 Agent）

Star：6800+，周增 1800+，全自动 AI 渗透测试智能体框架

语言：Python

协议：开源非商用

地址：https://github.com/vxcontrol/pentagi

Pentagi 是 2026 年 4 月安全圈爆火的自主 AI 自动化渗透测试开源 Agent 框架，彻底改变传统人工渗透测试模式。Agent 具备自主漏洞扫描、端口探测、弱口令检测、漏洞利用、内网横向移动、权限提升、渗透报告自动生成全闭环能力，无需人工干预自动完成完整渗透流程。内置安全沙箱隔离执行、漏洞库匹配、攻击策略智能决策、防御绕过优化，兼容 Nmap、Metasploit 等主流安全工具链，可视化渗透过程监控、日志审计、报告导出。

专为安全从业者、企业安全运维、攻防演练设计，大幅提升渗透测试效率，项目严格开源仅限安全研究使用，禁止恶意非法攻击。是目前开源界最完整 AI 渗透智能体项目，技术架构先进、自动化程度极高，安全社区热度爆发式增长。

2026 年 4 月最新热门开源项目

一、AI Agent / 智能体（当前顶流赛道）

1. NousResearch/hermes-agent（爱马仕 Agent）

2. OpenClaw/openclaw（龙虾 Agent）

3. bytedance/deer-flow（字节鹿流 AI Agent）

4. browser-use

5. everything-claude-code

6. thedotmack/claude-mem

二、本地大模型 / 推理框架

1. ollama/ollama

2. google-ai-edge/LiteRT-LM

三、AI 应用开发 / 低代码平台

1. langgenius/dify

2. langchain/langchain

四、前端 / UI / 渲染

1. chenglou/pretext

2. open-webui/open-webui

五、多模态 / 图像 / 语音生成

1. comfyui/comfyui

2. OpenBMB/VoxCPM

六、文档 / 工具 / 效率库

1. microsoft/markitdown

七、安全 / 渗透 AI

pentagi（本周 Trending 热门 AI 渗透 Agent）

ClawPanel – OpenClaw 和 Hermes Agent 双引擎，内置智能 AI 助手

SenseAudio – 商汤AI语音开放平台

延伸阅读: