数据截至2026-04-21,均为近期周增速最快、开发者刷屏顶流项目,含 AI Agent、大模型、前端、后端、多模态、工具、国产开源等类别。

一、AI Agent / 智能体(当前顶流赛道)
1. NousResearch/hermes-agent(爱马仕 Agent)
Star:7.5 万 +,本周周增 3.8 万 +,全球 Trending 连续榜首
语言:Python
协议:MIT

Hermes Agent 是开源 AI 研究机构 NousResearch 推出的下一代自进化个人 AI 智能体框架,也是 2026 年 Q4 最炸裂黑马项目,彻底区别于传统被动式 Agent。项目核心创新是闭环自主学习系统:Agent 完成每一次任务后自动复盘、提炼可复用技能、优化执行策略、压缩长期记忆,实现越用越强、持续成长,而非每次从零执行。
原生支持终端操作、文件读写、浏览器自动化、定时任务调度、多平台消息接入,内置持久化记忆库与工具调用沙箱,安全隔离执行环境。兼容所有 OpenAI API 格式模型,包括 Llama、Qwen、DeepSeek、Claude 等,开箱即用 Docker 部署。
相比 OpenClaw,它在记忆效率、自主决策、长期成长上全面升级,是目前开源界主动式智能体标杆,适合个人 AI 助手、桌面自动化、企业内部智能员工、复杂任务编排开发,社区更新极快,4 月 v0.8 新版本大幅提升稳定性。
2. OpenClaw/openclaw(龙虾 Agent)
Star:35.6 万 +,长期霸榜,生态最完善通用 Agent
语言:TypeScript
协议:MIT
OpenClaw 是目前全球生态规模最大、插件最丰富的跨平台全能 AI 自动化智能体网关,俗称 “龙虾 Agent”,长期占据 GitHub 智能体榜单前列。项目主打全渠道连接一切,原生适配 Telegram、WhatsApp、微信、桌面客户端、浏览器、Slack 等 25 + 消息与操作平台,内置 90 + 官方插件、13000 + 社区技能库,支持全自动电脑操作、网页交互、文件处理、代码执行、数据分析、外网检索全能力。采用全量持久化记忆架构,完整保存跨会话历史上下文,提供可视化管理后台、权限控制、任务日志监控。
工程化高度成熟,支持 Docker 一键部署、二次开发扩展、MCP 工具协议对接,兼容 Ollama 本地模型与云端 API 混合调用。适合多平台运营自动化、个人桌面助手、团队协作 Agent、爬虫与办公自动化,是开发者快速落地 AI Agent 项目的首选成熟框架,缺点是长期记忆 Token 消耗偏高,正在持续优化。
3. bytedance/deer-flow(字节鹿流 AI Agent)
Star:5.7 万 +,单月新增 3 万 +,国产工业级 Agent 框架
语言:Python
协议:MIT

Deer-Flow(鹿流)是字节跳动官方开源的企业级多智能体协同编排框架,完全国产自研,基于 LangGraph 生态重构,是国内最成熟可商用 AI Agent 工业底座。
核心能力为复杂任务自动拆解、子智能体并行执行、多 Agent 协作调度、流程可视化编排,内置标准化记忆管理、文件系统、安全沙箱、技能插件体系,完全兼容国产通义千问、DeepSeek、GLM 及海外全系列模型。提供可视化低代码工作流画布,非技术人员也能拖拽搭建 AI 工作流,开箱内置搜索、文档分析、代码执行、报表生成 50 + 工具。
支持 Docker/K8s 部署,普通电脑即可本地运行,无需专业高端 GPU,完全开源可商用。适合企业内部流程自动化、财报分析、学术调研、运维自动化、知识库问答、大型复杂业务智能体开发,解决开源 Agent 难以落地生产环境、稳定性不足、多 Agent 协同困难的行业痛点,是国产 Agent 生态核心支柱项目。
4. browser-use
本周 Trending 置顶,AI 浏览器自动化第一库
语言:Python
协议:MIT
browser-use 是基于 Playwright 深度封装的开源 AI 浏览器自动化专用库,2026 年 4 月极速爆火,彻底降低 Agent 网页操作开发门槛。
项目核心是让大模型 Agent自主理解网页结构、自动点击、填表、滚动、爬虫、下单、数据提取、页面交互,无需人工编写复杂 XPATH/CSS 选择器,模型原生感知页面元素语义。内置智能等待、反检测、异常重试、会话保持、多标签管理能力,完美对接 Hermes、OpenClaw、LangChain 等所有主流 Agent 框架,一键集成工具调用链。相比传统 Selenium、Playwright,它专为 AI Agent 设计,语义化操作、容错率极高、开发量减少 90%。
支持无头浏览器、可视化调试、Docker 部署,适合 AI 网页爬虫、自动办公填表、电商自动化、网页数据分析、Agent 互联网信息检索场景,是当前 Agent 生态必备配套工具库,社区迭代速度极快,每周更新功能。
5. everything-claude-code
Star:10.4 万 +,周增 2.1 万 +,Claude Code 全套开源增强套件
语言:TypeScript/Python
协议:Apache2.0
everything-claude-code 是 Anthropic Claude Code 官方最佳开源实现与增强全家桶,完整复刻并扩展 Claude 原生代码能力,是 AI 编程领域顶流开源项目。
项目完整实现 5 层上下文压缩、流式工具预执行、Prompt 缓存共享、代码增量修改、断点调试、项目级代码理解、SWE-bench 代码修复基准全能力。
原生支持 VSCode、JetBrains IDE 对接,支持本地模型 + Claude 云端混合调用,内置代码重构、漏洞检测、注释生成、单元测试自动编写全套能力。解决原生 Claude Code 闭源、无法二次开发、无法本地私有化部署、无扩展插件的问题,完全开源可二次改造,提供完整 MCP 工具链与 API 接口。
适合 AI 编程开发者、IDE 插件开发、企业私有化代码助手、代码审计优化场景,是 Claude 生态最权威开源分支,全球大量开发者基于此搭建自有 AI 编程助手。
6. thedotmack/claude-mem
Star:5.9 万 +,Claude 长会话记忆增强神器
语言:Python/TS
协议:MIT
claude-mem 是专门针对 Claude 系列模型开发的开源长会话记忆持久化增强插件,完美解决 Claude 原生上下文截断、跨会话记忆丢失、长对话 Token 爆炸问题。核心技术为智能语义压缩、自动记忆分层、跨会话知识继承、重要信息永久保存、冗余内容自动清理,动态平衡记忆完整度与 Token 消耗。支持向量数据库本地存储、云端同步、记忆手动编辑、记忆检索查询,无缝对接 Claude API、Claude Code、Open WebUI 等所有 Claude 生态产品。无需改动原有代码,一行配置即可接入,支持私有化部署,数据完全本地可控。适合长期项目开发、复杂持续对话、知识库问答、长期个人 AI 助手场景,是 Claude 用户必备开源工具,4 月新版本大幅提升中文记忆理解能力,社区好评度极高。
二、本地大模型 / 推理框架
1. ollama/ollama
Star:9 万 +,本地大模型事实标准,全球最流行本地 LLM 工具
语言:Go
协议:MIT
Ollama 是目前全球最主流、最易用的本地开源大模型一键运行工具,彻底简化本地部署复杂流程,已经成为本地 LLM 领域行业标准。项目将模型下载、环境配置、GPU 加速、量化推理、API 服务全部封装为极简命令行工具,一行命令即可本地启动 Llama、Qwen、DeepSeek、GLM、MiniMax 等全系列开源模型,CPU/GPU/ 边缘设备全兼容。原生支持 OpenAI 兼容 API 接口,可无缝对接所有 LLM 应用、Agent、前端界面,支持模型量化、自定义 Modelfile、Docker 部署、多模型管理、模型导出分享。完全本地私有化运行,对话数据不离开本机,极致保护隐私,提供 Python/JS 官方 SDK,生态极其完善,Open WebUI、Dify、OpenClaw 全部原生支持对接。适合个人本地 AI、私有化部署、开发者本地测试、边缘端大模型运行,是所有本地 AI 项目的底层基础设施,2026 年持续更新多模态、长上下文、更快推理优化。
2. google-ai-edge/LiteRT-LM
Star:8000+,周增 2100+,谷歌边缘端大模型推理引擎
语言:C++/Python
协议:Apache2.0
LiteRT-LM 是谷歌官方开源的超低延迟边缘端大模型专用推理框架,专为手机、嵌入式设备、工控机、边缘盒子设计,是移动端本地 LLM 最优解决方案。
基于 TensorFlow Lite 深度优化,针对 ARM 架构极致压缩算子,推理速度比传统框架提升 3–10 倍,内存占用大幅降低,支持 INT4/INT8 量化、动态 Batch、流式输出、长上下文优化。原生适配 Qwen、Llama、Gemma 等轻量开源模型,支持离线完全本地运行,无需云端联网,提供 Android/iOS 原生 SDK、C++ 跨平台接口。
解决传统推理框架体积大、功耗高、不适合移动端、延迟高的痛点,适合手机本地 AI 助手、车载 AI、物联网智能设备、嵌入式语音交互、离线边缘智能场景,是谷歌 Edge AI 生态核心组件,2026 年 4 月新版本大幅增强中文模型适配能力。
三、AI 应用开发 / 低代码平台
1. langgenius/dify
Star:13.2 万 +,生产级 LLM 应用低代码开发平台
语言:Python/TS
协议:MIT
Dify 是目前国内外最成熟、可直接上生产的LLM 可视化低代码开发平台,一站式覆盖 Prompt 编排、RAG 知识库、Agent 工作流、API 发布、监控运维全链路。提供可视化画布拖拽搭建 AI 工作流,无需编写代码即可创建问答、写作、数据分析、Agent 智能应用,原生支持上百种云端 + 本地模型(Ollama、Claude、OpenAI、国产模型全兼容)。
内置完整 RAG 文档 pipeline,支持 PDF/Word/PPT/ 网页一键解析入库,50 + 内置 Agent 工具(搜索、画图、计算器、代码执行),完善 LLMOps 日志监控、流量统计、权限管理、版本管理。
支持 Docker 一键部署、私有化开源商用、API 对外服务输出,企业与个人开发者通用。
适合快速搭建 AI 客服、知识库问答、内容创作工具、企业内部 AI 应用、Agent 后台管理,是 LLM 应用开发首选开源平台,社区活跃、文档完善、商业化落地案例极多。
2. langchain/langchain
Star:12.9 万 +,LLM 应用开发全球主流底层框架
语言:Python/TS
协议:MIT
LangChain 是全球最权威、生态最完善的大模型应用底层开发框架,是所有 LLM 应用、Agent、RAG 项目的基础底座。
核心解决原生大模型知识静态、无法调用工具、无长期记忆、无法复杂任务拆解的缺陷,提供模块化链式调用、工具集成、记忆管理、RAG 检索、Agent 推理、多模型统一抽象接口全套组件。标准化模型接口,一键切换所有云端 / 本地模型,支持自定义工具、自定义记忆、自定义工作流逻辑,完全开源可扩展,Dify、Deer-Flow、browser-use 全部基于 LangChain 生态构建。
提供 Python/TypeScript 双语言 SDK,完善文档、大量示例项目,适合专业开发者深度定制 LLM 应用、自研 Agent 框架、企业级复杂 AI 系统开发,是 LLM 开发领域事实标准底层库,2026 年持续升级多 Agent 协同、MCP 协议、长上下文能力。
四、前端 / UI / 渲染
1. chenglou/pretext
Star:2.8 万 +,前端近期刷屏顶流,React 官方团队开源排版引擎
语言:TypeScript
协议:MIT
Pretext 由 React 核心团队成员开源,是新一代纯 TypeScript 高性能文本排版渲染引擎,彻底解决前端多行文本布局、换行、对齐、富文本排版性能极差的行业痛点。项目体积仅几 KB 零依赖,渲染速度比传统 DOM 排版、Canvas 方案快 500 倍,支持复杂富文本、自动换行、段落间距、多行对齐、中文排版优化、动态文本实时重排。
完全基于函数式声明式 API,与 React/Vue 完美兼容,无 DOM 副作用、内存占用极低,支持服务端 SSR 渲染。区别于传统排版库,它内核自研排版算法,不依赖浏览器原生排版引擎,跨端表现完全一致,解决浏览器兼容性、排版不一致问题。
适合富文本编辑器、笔记软件、文档网页、移动端 H5、复杂 UI 文本展示场景,是 2026 年前端最具革命性开源库,一经开源立刻刷屏前端社区,大量头部项目开始迁移接入。
2. open-webui/open-webui
Star:12.7 万 +,自托管开源 AI ChatWeb 界面标杆
语言:TS/Go
协议:MIT
Open WebUI 是功能最完善、体验最好的私有化开源 ChatGPT 式 AI 网页前端,完全离线自托管、数据本地可控。原生深度对接 Ollama 本地模型,同时兼容所有 OpenAI API 兼容云端模型,支持多模型一键切换、聊天历史管理、对话分组、自定义 Prompt、RAG 知识库、插件扩展、多用户权限分组管理。
界面现代化响应式设计,PC / 手机自适应,支持暗黑模式、对话导出、代码高亮、文件上传解析,Docker/K8s 一键部署,开箱即用无需复杂配置。内置完善后台管理、流量监控、模型管理,完全开源可二次定制界面与功能。
适合搭建私有本地 AI 聊天站、企业内部 AI 门户、Ollama 可视化管理后台、个人私有化 AI 助手前端,是本地 AI 生态必备 UI 项目,社区插件生态极其丰富,每周持续更新功能。
五、多模态 / 图像 / 语音生成
1. comfyui/comfyui
Star:10.6 万 +,节点式 AI 图像生成工作流标杆
语言:Python
协议:MIT
ComfyUI 是全球最流行、最强大的节点式可视化 AI 图像 / 视频生成工作流编辑器,是 AI 绘画领域事实标准工具。完全原生兼容 Stable Diffusion、Flux 全系列模型,通过拖拽节点搭建完整生成、修图、放大、ControlNet、Inpaint、超分、视频生成工作流,无需编写代码,可视化调试每一步参数。
相比 WebUI 传统界面,它显存占用更低、推理速度更快、支持复杂非线性工作流、批量生成、工作流导入导出、自定义节点插件扩展。社区拥有上万开源工作流与插件,支持文生图、图生图、局部重绘、高清修复、AI 视频生成、多模态融合全能力。
适合 AI 绘画创作者、设计师、AI 图像二次开发、批量内容生产、高阶图像生成调试,2026 年持续升级 Flux 原生支持、视频生成加速、本地轻量化部署能力,是 AI 图像领域必用开源项目。
2. OpenBMB/VoxCPM
Star:1.1 万 +,周增 1200+,国产无分词器多语言语音 SOTA 模型
语言:Python
协议:Apache2.0
VoxCPM 是智源 OpenBMB 团队开源的新一代国产端到端语音合成 TTS 模型,是目前中文语音生成 SOTA 级别开源项目。最大创新是无分词器端到端架构,无需中文分词、韵律标注,直接输入文本原生输出自然流畅人声,韵律自然、情感丰富、多音字准确率极高,解决传统 TTS 生硬、断句不合理、中文效果差问题。支持多音色、情感语音、语速调节、长文本流式合成、本地离线运行,体积轻量化,普通 CPU 即可推理,兼容移动端部署。
中文效果远超海外开源 TTS 模型,支持中英混合语音合成,开源可商用,提供 Python SDK、API 服务、推理加速优化。适合语音交互产品、有声书制作、AI 助手语音播报、车载语音、内容创作语音生成场景,是国产语音开源生态核心标杆项目。
六、文档 / 工具 / 效率库
1. microsoft/markitdown
Star:10.6 万 +,周增 2500+,微软开源全格式转 Markdown 神器
语言:Python
协议:MIT
Markitdown 是微软官方开源的全能结构化文档转 Markdown 工具库,是知识库、RAG 系统必备基础设施。
支持 PDF、Word、Excel、PPT、图片、网页、EPUB 等几乎所有常见格式一键精准转换为标准结构化 Markdown,完美保留标题层级、列表、表格、代码块、图片链接、段落排版,提取精度远超同类开源工具。内置 OCR 图片文字识别、PDF 版式分析、乱码修复、表格还原、复杂文档解析能力,轻量无重型依赖,Python 一键安装调用,支持批量转换、本地离线运行、Docker 部署。
解决传统转换工具排版混乱、表格丢失、格式错乱、无法解析扫描版 PDF 的痛点,适合搭建 AI 知识库、RAG 文档预处理、文档批量归档、内容爬虫结构化提取场景,一经开源立刻霸榜工具类榜单,是开发者必备效率开源库。
七、安全 / 渗透 AI
pentagi(本周 Trending 热门 AI 渗透 Agent)
Star:6800+,周增 1800+,全自动 AI 渗透测试智能体框架
语言:Python
协议:开源非商用
地址:https://github.com/vxcontrol/pentagi
Pentagi 是 2026 年 4 月安全圈爆火的自主 AI 自动化渗透测试开源 Agent 框架,彻底改变传统人工渗透测试模式。Agent 具备自主漏洞扫描、端口探测、弱口令检测、漏洞利用、内网横向移动、权限提升、渗透报告自动生成全闭环能力,无需人工干预自动完成完整渗透流程。内置安全沙箱隔离执行、漏洞库匹配、攻击策略智能决策、防御绕过优化,兼容 Nmap、Metasploit 等主流安全工具链,可视化渗透过程监控、日志审计、报告导出。
专为安全从业者、企业安全运维、攻防演练设计,大幅提升渗透测试效率,项目严格开源仅限安全研究使用,禁止恶意非法攻击。是目前开源界最完整 AI 渗透智能体项目,技术架构先进、自动化程度极高,安全社区热度爆发式增长。