即刻App年轻人的同好社区
下载
App内打开
Roxane
635关注1k被关注1夸夸
重度Gemini&Claude用户|在一家初创探索AIToB|前RPA PM&咨询|
游戏行业胫骨|贪心的INTP
置顶
Roxane
7月前
(。・∀・)ノ゙Hi
我是Rosa,一个晚期P人+中期FOMO患者,每月在 AI 上花费超过200💲的AI学习者。
正在努力成为一个真实、自洽、永远对世界有好奇心的人。

目前在一家初创探索企业级AI应用,从业经历横跨私企/外企/初创公司,咨询/产品/项目/解决方案,具有丰富搬砖和踩坑经验。身在toB,心在旷野。

我的博客👉:www.isrosa.com

我为ResearchAI+社区搭建的的信息源清单(欢迎共建!):bvcuaptm1a.feishu.cn

我的即刻很唠叨,通过这几条可以大概了解我爱发什么⬇️:

web.okjike.com 整理了Claude的十篇Agent相关技术分享

web.okjike.com 整理了一些适合非技术背景的 RL学习材料

web.okjike.com 十本影响我 AI 价值观的科幻小说

web.okjike.com 用AI 把 Google 的提示词工程白皮书转成互动式游戏

web.okjike.com 一篇关于AI与拟人化的随机漫谈

web.okjike.com 推文:一篇A16Z在两年前关于ToB GenAI App 的观点

🫰坐标上海,不定期出差,欢迎约coffee chat!
wx联系方式在yellow page
(我回微信的速度跟回邮件一样慢,提前滑跪🧎‍♂️)
57
Roxane
18:44
滴滴现在是不是开始在人工客服频道用ai假装人类了?
今天找客服投诉,全程回复驴唇不对马嘴,感觉就是根据我的问题从话术库里找最符合的文案一键发送的
20
Roxane
13:17
手里有24G内存以上mac mini的朋友,可以试一下本地部署gemma4了,表现比想象还好。
实测本地能跑26b的版本(稍微有点慢),MoE模式,同时支持推理和多模态。

另外两个更小规格模型的亮点:闪电一般的速度,支持原生语音输入,非常适合作为本地Agent的入口
40
Roxane
2天前
00
Roxane
3天前
原来不止我一个人好奇过
西湖一年会掉进去多少人
00
Roxane
3天前
The SUMMER is coming!💔😨
00
Roxane
3天前
今天突然想起来,其实AI会议场景里我有一个痛点一直没有被满足,不知道为什么现在的 AI 会议厂商都没有往这个方向去做:

现在所有的AI会议都是事后才记录,其实在开会过程中对你并没有太大的帮助。
而像我跟客户开会的时候,真的会有很多时刻,客户讲的内容我立刻就想用 AI做些背景调查,分析,甚至是crosscheck。
因为我可能是需要一些背景信息来支撑我响应客户的问题,验证一些信息,甚至让 AI 帮你出出主意看还有什么可以追问的问题。

其实以目前的技术,通过实时转写和大模型,是有能力做到这一点的,但为什么现在大家没有做呢?猜测有两个原因:
1. 通用的会议产品更偏向于一种固定化的文件处理工作流,而这种工作流相对是短且固定的,只需要在会议结束后运行一次。
2. 而实时转写和洞察,则需要在每一个重要节点,基于前面的上下文,立刻调llm进行分析、产出 insight 或者是问题推荐等。这其实需要一个Agent持续加载上下文并(非常多轮地)调用Agent,对资源的消耗非常大。

但总体来说,对我而言,这种实时的会议助理显然比会后再总结更有帮助。

目前我还没看到任何一个会议软件在实时转写、实时翻译以及实时 insight 这三大场景有什么值得一提的功能。(有些软件有实时转写,但做得一坨)
如果有类似产品,欢迎大家安利🌹
21
Roxane
3天前
00
Roxane
3天前
一点吐槽:
拿奥特曼调查报告用AI洗稿假装真人写出来的营销号文章,拿去发发xhs公众号就够了,何必发在即刻呢,即刻的流量变不了现的哥哥
10
Roxane
4天前
Skills通常分为两类:
能力提升类(Capability uplift):这类技能帮助 Claude 完成基础模型无法做到、或无法稳定做到的任务。我们的文档创建技能就是很好的例子。它们封装了特定的技巧和模式,能产生比单纯提示词更好的效果。
偏好封装类(Encoded preference):这类技能用于记录工作流。虽然 Claude 已经能完成其中的每个环节,但技能会按照团队的特定流程进行排序。例如:根据设定标准审查 NDA 的技能,或从不同 MCP 获取数据并起草周报的技能。

这种区分很重要,因为这两类技能的测试目的不同:
随着模型能力的提升,能力提升类技能可能变得不再必要。
评估(Evals)能告诉你这种情况何时发生。
偏好封装类技能更持久,但其价值取决于对实际工作流的还原度。评估可以验证这种还原度。
无论哪种情况,测试都能让一个“看起来有用”的技能变成一个“确定有用”的技能。
(摘自Claude Blog原文)

自定义Skills必读:使用Anthropic的skill-creator进行创建、评估设计和测试|Anthropic | isrosa

22
Roxane
4天前
🍠果然有天才!
感觉我的有线小键盘已经输了
11