即刻App年轻人的同好社区
下载
App内打开
溪河
296关注308被关注0夸夸
🌃成长中的全栈产品经理
🦁保持冷静,保持谦逊
置顶
溪河
10月前
定个小目标,半年内成长为心中合格的产品经理:

①熟悉现有大模型方案的能力,知道每种需求的实现成本和实现路径。并能展望技术未来2年的发展。

②熟悉客户,知道什么需求和什么程度的需求满足度能够让客户付费。

③知道如何寻找能够正对于目标场景的数据集,并能够构建量化的效果评估方式。

④熟悉触达这些客户的方式,知道如何运营客户的生态社区。

———
系列分享索引帖
LLM论文分享:m.okjike.com
10
溪河
00:53
monica claude 写了毕业论文的综述
monica claude 搓了讲座 PPT 的配图
monica claude 撸了各类项目的代码

期待后面能变成
指挥 manus 脱手做了各种各样的事
00
溪河
9天前
AI 不能代替的工作类型:需要背锅的
20
溪河
14天前
Claude 押宝 Agent

​3.7 的扩展思考和思维过程可见
​让一切可控

​用户可以打开或关闭“扩展思维模式”,
引导模型更深入地思考更棘手的问题。
开发人员甚至可以设置“思考预算”,
以精确控制 Claude 在问题上花费的时间。

​扩展思维模式不是一个切换到具有单独策略的不同模型的选项。

相反
它允许完全相同的模型给自己更多的时间,
并花费更多的精力来得出答案。

​思维过程可见 好处是
1. ​一如既往的安全可信
2. ​通过对比思考与结论是否相悖
​降低模型幻觉(R1 在这点就做的不是很好)
​3. 贴近人类思考过程(多角度多分支多重检查),有极大的探索学习价值

​缺点是
1. 缺乏个性化表达
与默认输出相比显得更加超然和非个人化
原因是没有对思维过程进行标准的性格特征训练
思维过程中可能包含不正确、误导性或未成熟的想法
2. 忠实度问题(Faithfulness)
无法确定显示的思维过程是否真实反映模型内部的运作
英语语言可能无法完全描述模型的特定行为原因
研究表明模型经常基于未在思维过程中明确讨论的因素做出决策
这使得难以通过监控思维来评估模型的安全性
3. 安全和安保隐患
恶意用户可能利用可见思维过程开发更好的"越狱"策略
模型可能会因为知道思维会被展示而改变思考方式:
产生更难预测的思维方式
主动隐藏某些想法
这些问题在未来更强大的模型版本中会变得更加严重

​但得益于 Action Scaling
允许它迭代调用函数、响应环境变化并继续直到开放式任务完成

🌟 超长输入 适配 环境感知
🌟 ToolUse 适配 环境交互
🌟 思考能力 提升 规划能力
🌟 一切可控不过度

​最好的力证就是宝可梦测试
​无敌

所以是目前最适合的 Agent 底模
也是未来 Agent 底模的起点
00
溪河
17天前
有没有 gdc 现场的伙伴
10
溪河
27天前
R1在智能体构建领域能带来新想法

​在纯提示词的智能体里
​只需要告诉 R1 任务目标
​即可完成之前需要编写复杂提示词的任务
​并且表现更好
​(文章里有对比)

​而在工作流的智能体里
​R1 不适合作为主流程里主节点的模型
​原因目前有

​一个是 R1 不具备 func call 的能力
​无法去做执行

​一个是 R1 为推理模型
​输出主内容耗时过长,如果作为中间节点
​会让用户等待主内容的首字吐出耗时大幅增加

​但是可以这么做
​1. R1 作为流程结束节点

​前序节点收集的信息
​作为 R1 推理的补充知识
​能够得到更好的结果
(参考文章的联网搜索功能实现)

​2. 拆解 R1 推理部分,让小模型去调用函数获取需要的数据

​这个目前比较难实现
​我们能看到 R1 在推理的时候
​会不断分析和反思当前已知数据
​如果在这个过程中,能够自主调用相应的插件
​去获取相关数据做印证
​那就能减少 if else 的人工编排
​实现 agentic workflow

​或者把推理的过程单独拿出来拆解
​让小模型去执行
​最后再整合输出

​------ 分割线 ------

​文中我们也给出了几个 case 和开发者讨论群
​欢迎大家来体验玩耍

又一大厂悄悄发力!DeepSeek 满血版免费用,还能快速搭建智能体!

00
溪河
1月前
这几天看着 deepseek 的刷屏
不禁思考
如果 AI 最终是泡沫
那离开了 AI
我还剩下什么

答:
还有猫猫
10
溪河
2月前
AI Code Agent 向)在产品上,要解决一个问题:
如何调用开发工具。

Debug 是程序员的核心能力
目前当下各家能做到静态 log 调试
无论是被动接受用户输入
亦或是主动读取 terminal 输出

但是需要动态调试的场景
比如断点调试 或者 web 开发里的 F12 Console 报错
目前还是无法主动读取到信息

目前没法实现这个事的底层逻辑也很简单:
无论是文件编辑器(e.g. vs code)
或者是 IDE (e.g. Jetbrains 全家桶)
右键一下,有丰富的工具来辅助开发

而这些工具是面向人类设计的
而非 AI

如何让 AI 去调用这些工具
又或者面向 AI 设计新的 Debug 工具
AI Coding 产品必须啃下的一块硬骨头

注:
我个人理解,AI Coding 可以大致分为两类:
Copilot 向:人主导,AI 复制,比如 GitHub Copilot(可能是最早的 AI Coding?但退环境了),大部分 AI Coding 插件(需要人去复制粘贴信息的)
Agent 向:AI 主导,人监管,比如 devin,windsurf,这类能直接去对文件做增删改查操作,能根据 terminal 输出修改操作,具备一定的规划能力。
23
溪河
2月前
京杭快线,运送顶级牛马

披着朝露出发,在上班前就能落地
中午前就能到甲方公司挨骂
00