今天看到一个有趣的工作叫jina-grep,本地clone测了一下,分类模式在处理代码库的时候把我的Mac mini干卡死了,貌似是因为缓存了太多搜索结果导致的。管道模式因为精确查询后再处理,要处理的数据量少很多。这是个有趣的思路。
Jina AI 开源的 jina-grep,一个很有意思的工具——它把传统文本搜索和语义理解结合起来了。
简单说,它让 grep 能"看懂"你在找什么,而不是只匹配关键词。
三种用法:
1️⃣ 管道模式:先 grep 过滤,再语义重排序
grep -rn "error" src/ | jina-grep "错误处理逻辑"
2️⃣ 独立模式:直接用自然语言搜索
jina-grep "内存泄漏" src/
3️⃣ 分类模式:给每行打标签
jina-grep -e "数据库" -e "错误处理" src/
性能很顶:nano 模型(239M 参数)单次查询 2.9ms,吞吐量近 100K token/s。完全本地跑在 Apple Silicon 的 MLX 框架上,不需要 PyTorch。
最实用的场景:找代码时不用记精确函数名。比如搜"指数退避重试机制",即使代码里没这八个字,也能找到相关实现。
这就是 Unix 哲学 + AI 的正确打开方式:小工具组合,但每个工具都更聪明了。
GitHub:
github.com#AI #开发工具 #命令行 #开源