即刻App年轻人的同好社区
下载
App内打开
JoeSiven
98关注47被关注0夸夸
🪁 内容创作 | 系统思维|持续学习
📚 在思考和行动之间寻找平衡
🔨 25届求职ing base广深
🛰 JoeSiven
置顶
JoeSiven
6月前
你好,这里是一条置顶内容。
我是siven,一个喜欢和ai一起探索一起玩的学生。👾

🚀 目前,我正在积极寻找一份新工作,base广州和深圳
在求职路上,我无意中发现了自己的能力优势:快速学习、系统思维、AI 协作。为了验证这些能力,我主动探索了两个新领域,并将学习和实践的全过程整理成了一份飞书文档。 虽然缺乏正式的实战经验,但我有信心和热情去迎接挑战。如果你或你的团队正在寻找一个热爱学习、善于思考、能与 AI 高效协作的新伙伴,请一定看看我的 Portfolio!我也希望能将我的思考力和学习力,应用到实战项目中。

👉 能力展示与学习记录:ei4wxo0y5s6.feishu.cn

🤔 我的思考记录
我习惯用 flomo(强推!此处@少楠🌹)和 Obsidian 记录日常思考,即刻也是我的主要输出阵地之一。这些思考不仅是我的个人成长记录,也构成了我的能力基础。
我将过往的一些动态做了简单分类,方便你查阅:
【AI 探索与协作】
我用 Gemini 搭建的“AI as Me”提示词
m.okjike.com
AI 探索路上的4点反思
m.okjike.com
如何通过 AI 协作快速学习
m.okjike.com
输入的质量会影响ai输出的质量
m.okjike.com

【个人成长与思维模型】
(好评推荐) 换一种视角来看福格行为模型
m.okjike.com
如何顺应人性,增强内驱力
m.okjike.com
探索是路径,不是最终目的
m.okjike.com
如何实现自我价值
m.okjike.com
离开舒适区之后,去哪里
m.okjike.com
捕捉潜意识发出的信号
m.okjike.com
为什么我们需要反思
m.okjike.com
倒推来看什么是“擅长”
m.okjike.com

【知识管理与有效输入】
输出和知识管理都是为了更好地决策
m.okjike.com
flomo 的标签怎么用
m.okjike.com
高质量的信息应该具有长期价值
m.okjike.com
如何开始记录
m.okjike.com
先阅读,再收藏
m.okjike.com

【关于求职与就业】
(提问贴)面对“已读不回”,还能做什么
m.okjike.com
为什么现在找工作很难坚持下去
m.okjike.com

【修身,修心】
身心合一,接纳焦虑
m.okjike.com
想象力丰富的焦虑是什么样的
m.okjike.com

希望可以和更多喜欢 AI、热爱创造的朋友一起成长、玩耍! 如果想要联系,或者你身边有合适的机会,欢迎转发评论🤝,谢谢你能看到这里😊
02
JoeSiven
2月前
为什么在 AI 知识内容盛行的当下,我反而选择自己输出内容、自己写,再交给 AI 整理,而不是让 AI 一口气完成全流程、甚至直接帮我发布?

因为我始终觉得,AI 生成的内容再精妙、再吸引人,终究不是我的东西。它没有在我大脑里留下任何痕迹。哪怕它写得再华丽、再实用,我也记不住;真到要用的时候,我也根本想不起来——因为那不属于我。

我自己本来就喜欢记录观点和想法,写下来,再整理。所以,尽管我每天都会用各种 AI 大模型,但我不会让它们替我思考。

尤其是在小红书这样的内容平台,内容始终是最核心的。而这个核心的部分,不该让 AI 替你做必要的思考。内容的产出,是无法被 AI 替代的。无论是表达方式、行文风格,还是字里行间可读出的情绪,都是自己的。AI 再懂你,也写不出那个味道。
00
JoeSiven
3月前
OpenAI最近发布了一篇论文,探讨了GPT模型中幻觉产生的原因以及减少幻觉的方法。

其中一个原因是统计学上的必然现象。起初我不太理解这个概念,但结合论文和Gemini的分析后,我大致明白了。AI训练通常包括两个阶段:首先是预训练,即模型从海量数据中学习语料并统计规律;其次是基于人类反馈的强化学习(RLHF)。

为什么预训练会导致幻觉?关键在于“统计规律”。模型会根据信息出现的频率和组合方式来生成内容。
论文中有一个例子:测试员问AI某个人的生日,但AI的语料库中并没有这个信息。不过,AI通过大量的学习发现一个规律:“生日”一词后面通常跟着一个日期格式,比如某年某月某日。为了回答问题,它自己编了一个答案:3月7日。这就是典型的幻觉。

RLHF部分涉及较多专业术语,我尝试用简单的方式解释。

我们可以类比为答题记分:答对了加分,不回答则不得分,与此同时,答错了不扣分。 想像一下,你遇到一个你不会的题目,是完全不回答,还是会尝试瞎编一点?又或者选择题A、B、C、D四个选项你都看不懂,你会选择不选,还是蒙一个?

在强化训练中就用了类似的一个奖励机制,鼓励AI作出回答,而不是让AI诚恳地表达“这道题我不会”。这两种机制叠加,放大了原本就存在的幻觉问题。这也是为什么用户常常觉得AI在胡编乱造或答非所问。

我之前也写过关于AI幻觉的笔记。事实上,现在的模型幻觉率比之前要好很多了。我们可以通过RAG来确保生成的准确性,或者在训练阶段进行干预(比如论文中就有提到,OpenAI采取修改奖励制度的方法,增强了回答错误的惩罚力度。这就会使AI在回答的时候进行权衡。),又或是像Claude那样,在模型训练之初就设计规则,要求AI诚实面对不会的问题。

方法其实越来越多,但为什么OpenAI等公司仍在研究幻觉问题?因为AI正逐渐应用于医疗、法律、科研、金融等高风险领域。在这些场景中,一个微小的幻觉(如错误的药物剂量或虚构的法律条款)都可能带来严重后果。
00
JoeSiven
4月前
AI工具的使用门槛依然存在,很多AI衍生产品的使用门槛并不低。网络代理、付费限制、价格较高这些都还是其次,最主要的是上手后会遇到各种意想不到的问题。

对于小白来说,无法像教学视频里说的那样轻松解决问题,可能会面对各种报错、运行失败、API配置出问题、网络连接失败、镜像出问题等等,尤其在AI本地部署项目中经常发生。

我自己部署Claude Code和Claude Code Router时,一开始疯狂出现代理配置问题。不管怎么改接口、配置环境变量、修改各种文件,都不能正常运行。直到后面电脑重启,把这两个软件卸载重装,问题又莫名其妙消失了。到现在我也不知道哪里出了问题,又为什么莫名其妙自己好了,百思不得其解。

然而问题还没结束。成功部署不代表能够很好使用。输入简单命令时又报错了,这次是API报错和代理报错。但我的API配置没有任何问题,甚至前面刚发了句"你好"AI可以正常回复,下一句@了一个文件,又崩溃了。反反复复,万般无奈下,我转向云平台,比如v0、Lovable和bolt.new等等。

一开始用的确实很好,比如v0的额度比另外两者稍微多一些。我原本以为这次终于能成功了,直接把已经画好的工作流给它看,让它根据这个来写代码。但是画着画着又开始不对劲,而且工作流图片上的很多功能它也没有帮我实现。当时挫败感很强,因为折腾了很多天,只是一个很简单的需求,为什么折腾那么久都搞不好?

后来我又回到Claude Code,给了工作流中初始的一个步骤——获得输入并优化文案。这一次它运行成功了,并且按照我的要求使用了DeepSeek API接口,还画好了前端。

为什么这次成功了?我没有让CC完成整个工作流,而是让它从最初的一个任务节点——输入、整理、输出这么一个非常简单的节点做出来。然后我慢慢在此基础上增加,慢慢把工作流里的流程给它实现出来。

对我来说这是一个MVP,但对AI来说,这是一个非常复杂、困难的任务。它不能一口气把复杂任务做好。这就是为什么不管我换了多少个AI coding工具,它们都不能很好完成这个任务,甚至多次修改调试后,依然会有很多问题。

而把复杂任务拆解后,再让AI执行,就会容易很多。这也对应了我之前画的关于如何完成复杂任务的逻辑图,道理是相同的——我们人在面对复杂困难任务时,也需要先拆解再执行。
00
JoeSiven
4月前
这次真的是思维固化了,默认多 agent 消耗的 tokens 一定比单 agent 多。

结果我忽略了一个部分就是上下文。

比如有 abc 3 个部分都需要进行agent评估,如果是单 agent 的方案,那么一旦某一个部分需要打回重新生成的话,就会消耗一次 a + b + c 对应量的 tokens,因为abc三个部分会被打包成一个内容作为agent的上下文。

但如果是拆分开来的话,假设 a 出了三次问题,那也只会消耗 3a 这个量对应的 tokens,而不是 3(a + b + c)。尤其是在需要多次循环的工作流里面,这样处理反而更好一些,而且方便调试。
14
JoeSiven
4月前
为什么越来越多人讨厌AI产品的launch video?

这两天,Wispr Flow的CEO分享了一篇文章,讲他们是如何从硬件转向软件,并最终找到PMF的故事。

相较于现在那些很虚的AI产品的launch video,这篇文章里不止一次提到了真实的数据,而且这些真实数据背后都是实际的用户行为。

反观现在很多demo,只甩一个很虚的ARR数据。这个数据还特别容易被操纵,没什么可信度,但特别适合用来唬投资人。他们的套路就是:制作一个华丽的视频 → 吸引第一批用户付费 → 拿到数据包装下一个视频 → 再吸引投资 → 如此循环。

但是,产品到底怎么样?不知道。产品的使用品质如何?留存率怎样?用户真正的需求有没有得到解决?这个工具用起来到底如何?除了用户之外,没人关心。

这也是为什么现在越来越多的人讨厌看那些video、那些demo、那些花哨的宣传。因为它们并不能真正解决用户需求。它们也不是真的从用户需求出发去和用户交流,去分析如何满足需求,更多的是为了融资。

这篇文章还有个观点我觉得特别好:Get your facts from customers, keep your opinions to yourself。

作为创始人,或者说作为AI产品的产品经理和开发者,很多时候会用自己的想象来解释用户行为,而不是直接问用户或观察用户的真实行为。或许需要把自己的一些想法咽下去。说服自己最后还是要跟用户对话,而不是陷进自己的思维里。

文章链接:www.producthunt.com
02
JoeSiven
4月前
从用户的角度来看,Wispr Flow 这个产品在拉新方面做了一个比较好的示范。因为语音输入这种工具,一个很明显的指标就是使用次数会比较频繁。

如果新用户使用次数受到限制的话,第一印象就不会很好。因为我可能没用多久就发现用不了了,就要付费了。

包括另一种情况,如果使用次数很少,也就是说低频,这种就可以通过限制次数但不限时来维持新用户的活跃。最起码,这个产品得有能够让我体验下去的欲望,首先是产品本身,其次是付费和新用户的体验设计。

尤其是在国内,大部分群体还是价格敏感性的消费者。
00