即刻App年轻人的同好社区
下载
App内打开
Million_Y
313关注281被关注0夸夸
与自己和解 与世界和解
而后高举长枪 遥指风车
枪尖含着月光 无声呼啸
置顶
Million_Y
11月前
2025 Q1 展望
- Transformer 架构的 AI 似乎已经达到瓶颈,OpenAI 开始引领 Agent / MutliAgent 路线,但这只仅仅工程上的妥协,有价值,但不多,更重要的事情在于 AI 基础能力的提升。量化技术能够加速,但是肯定对 AI 的生成质量有所损害,dLLM 似乎是一个可能路径,但是我认为没有免费的午餐,可能还存在我尚未发现的缺陷。但是 dLLM 的生成速度非常有价值,极有可能会成为 AI 族群的重要组成部分。
- 多模态 AI 还在持续迭代,ChatGPT 4o 的出圈即为一例,2025 Q1 结束之时,多模态 AI 在图片理解和生成上有了足够大的进步,进一步应该是音频理解和生成,然后是视频理解和生成。视频理解和生成部分限于算力问题可能不太容易,但是对于 AI 理解现实世界肯定是跨越式的进步。且看今年年底之前能否完成这一步跨越。
- 到2026年,应该进入具身智能的时代,将触觉(也许对物理世界的具身体验更合适)融合入视觉和听觉是另一个巨大的跨越。另一个容易被忽略的是嗅觉和味觉,这是对分子级别的感知。至此 AI 应能从硬件上全面感知人之所感。
- 另一个让人难以忍受的瓶颈是 AI 的在线学习能力,如果 AI 只能使用外挂知识库的方式来解决问题,那叫开卷考试,不叫真正的学习。最近看到的一些论文似乎想要解决这个问题。窃以为人类大脑的[三重脑假说](zh.wikipedia.org)是有借鉴意义的,关键在于如何将旧脑和新脑分开训练,旧脑负责完成对这个世界的基础学习,新脑则负责在线学习,推理时结合新旧脑一起推理,完成真正的在线学习。这部分期待明年有新的突破。
34
Million_Y
1天前
今天看到一个有趣的工作叫jina-grep,本地clone测了一下,分类模式在处理代码库的时候把我的Mac mini干卡死了,貌似是因为缓存了太多搜索结果导致的。管道模式因为精确查询后再处理,要处理的数据量少很多。这是个有趣的思路。

Jina AI 开源的 jina-grep,一个很有意思的工具——它把传统文本搜索和语义理解结合起来了。
简单说,它让 grep 能"看懂"你在找什么,而不是只匹配关键词。
三种用法:
1️⃣ 管道模式:先 grep 过滤,再语义重排序
grep -rn "error" src/ | jina-grep "错误处理逻辑"
2️⃣ 独立模式:直接用自然语言搜索
jina-grep "内存泄漏" src/
3️⃣ 分类模式:给每行打标签
jina-grep -e "数据库" -e "错误处理" src/
性能很顶:nano 模型(239M 参数)单次查询 2.9ms,吞吐量近 100K token/s。完全本地跑在 Apple Silicon 的 MLX 框架上,不需要 PyTorch。
最实用的场景:找代码时不用记精确函数名。比如搜"指数退避重试机制",即使代码里没这八个字,也能找到相关实现。
这就是 Unix 哲学 + AI 的正确打开方式:小工具组合,但每个工具都更聪明了。
GitHub: github.com
#AI #开发工具 #命令行 #开源

Million_Y: 如果你认可这个观点,那么自然而然地就会去思考,现在的操作系统还差了哪些基础设施呢? 我的一个想法是:现在的agent的查询文件的方式还是很简单的,基本上就是grep,原因是针对文本文件额外添加一个vectordb其实很复杂繁琐,对现有文件系统的的使用方式改造太大了。 计算机领域有一句名言:计算机科学领域的任何问题都可以通过增加一层间接性(indirection)来解决。 那么通过在原始的文件系统和命令行之间增加一个vector层,写入、修改和删除文本文件的时候自动修改对应向量。这样一来,agent只需要额外掌握一个语义搜索的tool就够了。 而这样的操作系统,原生就支持语义查询文件的功能。 围绕着agent来重新思考如何设计操作系统,这是一个大概率确定的未来,你认可吗?或者你还有什么类似的想法,可以分享一下。

00
Million_Y
1天前
Million_Y
2天前
欧美版龙王赘婿

一直审核不过,审核过了排队排半天,排完了说视频不过审,裂了,累觉不爱。。。

#seedance2
00:15
11
Million_Y
3天前
简化成 TPD 就够了,因为好用的会再用 //@-Will: Build for Human 核心是DAU(日活用户);Build for AI/Agent 的核心简化结果指标是:

🎯 核心简化指标(最常用)

• TPD(Token Per Day):每日 Token 消耗量(算力/计算量)

• Task Completion Rate(TCR):任务完成率 / 成功率

• Agent DAU:Agent 日活操作次数(后台执行量)

• Cost per Successful Task:单次成功任务成本

📊 常用组合(落地常用)

• 生产力场景:TCR + 人工介入率 + 成本节省率

• 平台/Agent 服务:TPD + Task Success + 工具调用效率

• 业务价值:Agent GDP = 用户规模 × 频次 × 单次产值

一句话记:Human 看 DAU,Agent 看 TPD + 任务完成率。

(豆包)

-Will: Build for Human的简化结果指标是DAU, Build for AI/Agent的结果指标是什么?

00
Million_Y
4天前
😧啊这
00
Million_Y
4天前