盘点 6 个本周 yyds 的 GitHub 项目。
原创 逛逛 2025-07-18 15:04 北京
01
图解 AI 大模型、强化学习
100 多张原创图解,让你轻松看懂大模型和强化学习。
这个名为 LLM-RL-Visualized 的开源项目用最直观的方式:原创图解,让你理解 AI 大模型。
图解的作者是《大模型算法:强化学习、微调与对齐》的作者,绘制了 100 张精心绘制的原创原理架构图。
开源地址:https://github.com/changyeyu/LLM-RL-Visualized
这些图片可不是简单的示意图,而是作者投入大量时间、力求准确表达复杂算法和流程的呕心沥血之作。
比如第一张是大模型算法总体架构(以LLM、VLM为主),后面还有 100 多张类似的、很大的思维导图/流程图/讲解图。
对里面的每一个模块进行仔细拆解,相当 Nice。
02
阿里开源的 WebAgent
阿里巴巴 NLP 团队开源了一个名为 WebAgent 的项目,是一套旨在让 AI 模型更聪明地在互联网上查找信息和完成任务的工具集。
开源地址:https://github.com/Alibaba-NLP/WebAgent
这套工具主要包含三个核心部分:
① WebWalker:用来测试和比较不同 AI 模型在浏览网页、点击链接、查找特定信息这些基础操作上的能力有多强。
② WebDancer:一个已经训练好的「上网小能手」模型,你可以下载它的模型,按照说明部署在自己电脑上试用。
特别擅长处理需要多步骤操作(比如点开好几个链接、在不同网站间跳转)才能找到答案的复杂任务。
③ WebSailor:是一个超级搜索专家,专攻最难、最模糊的问题,找资料和推理能力超强(据说是开源里最好的)。
03
打造靠谱的 AI Agent
一个教你用工程方法打造真正靠谱、能上线给用户用的 AI 智能应用(Agent)的准则手册。它借鉴了经典的 12 Factor Apps 的精神,旨在总结出一套工程实践原则。
帮助开发者构建出更可靠、更可扩展、更易维护的、真正能投入生产环境、面向客户的 AI 应用。
开源地址:https://github.com/humanlayer/12-factor-agents
项目的作者尝试了市面上几乎所有的AI Agent框架,也和许多创业公司的技术创始人深入交流过。
他标榜自己是 AI Agent 的产品,很多其实并不那么「智能」,实现方法很粗暴.. 最后总结出上面这个 12 个准则,快去看看吧。
04
让 AI 操作你的数据库
MCP Toolbox for Databases 是谷歌开源的 MCP 神器,直接让 AI 模型连数据库,但是解决了连接管理复杂、权限控制难、安全性风险高等问题。
开源地址:https://github.com/googleapis/genai-toolbox
你只需要通过一个简单的 tools.yaml 配置文件,在里面定义好哪些数据库操作是被允许的,MCP Toolbox 就能把这些操作封装成标准的工具。
然后,你的 AI 应用就可以非常方便地调用这些预定义好的、安全的工具去操作数据库了。
它替你处理了繁琐的数据库连接池、身份认证、安全防护等底层工作,让你专注于开发 AI 的逻辑本身。
05
AI 实时知识图谱引擎
专为 AI 智能体打造的实时知识图谱引擎,Graphiti 能自动将用户对话、业务数据等动态信息编织成持续更新的知识图谱。
开源地址:https://github.com/getzep/graphiti
它精确记录信息的发生时间和录入时间,并融合语义、关键词和图关系三种方式进行极速信息查找。
通过提供实时、全面且可追溯的历史上下文,Graphiti 让 AI 智能体在复杂多变环境中做出更精准的理解、推理和决策。
06
高性能分布式对象存储
一个用 Rust 打造的高性能分布式对象存储,它想成为 MinIO 的强力替代品。
开源地址:https://github.com/rustfs/rustfs
把你的多台普通服务器变成一个大容量、能自动备份(分布式)的文件存储系统,专门存海量图片、视频这些“对象”数据。
靠 Rust 语言的本事,它跑得飞快、内存管理贼安全;并且完美兼容亚马逊 S3 的标准,你现有的那些备份工具、网盘应用基本都能直接用它,不用折腾。
但官方明确说了目前是“测试版”,千万别用在正式的生产环境里,得等它再成熟点。
07
都看到这了,关注下吧。
这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了。
#逛逛GitHub #开源 #GitHub #AI #大模型
