即刻App年轻人的同好社区
下载
App内打开
Mr.Chou
555关注366被关注4夸夸
concept-dealer.club
毫不性感的产品工作者。
不要神佛神像,要人模人样。
置顶
Mr.Chou
2月前
我和@GillianR 用业余时间精心设计了一个用来给宝宝/角色/产品等等起名字的工具,👉 uniquenames.net

核心玩法是「找灵感」(generate,图3)和「做选择」(narrow down,图4、图5)。

它虽然小,但我们很有自信它不是那种粗制滥造的互联网垃圾。

它的起因是,我们最近需要给新产品起名字,艰难的过程让我们意识到,起名这件事既难又无比重要。AI自然是能起些作用,但对话式的AI在起名场景体验很糟糕。我们一直对于“万事不决就引入对话”的产品感到厌倦,uniquenames就是我们关于人与AI交互方式的一个小探索。我们相信这个产品定义了一些有价值的、新的、好的体验。

没有宏大叙事,也不出于改变世界的使命感。这个产品我们做得蛮开心的,玩得蛮快乐的,@GillianR 的妈妈甚至用这个工具找到了一个超爱的网名😃我们给即友们准备了一个专属的code:JIKE2026,赠送不少额度,欢迎即友们随便玩耍,用完了还想玩的,可以联系我和@GillianR ~如果能提些反馈就更好了!

Why so serious?Just have fun!
72
Mr.Chou
2天前
做难事需要氧气,但收集再多的目光也产生不了光合作用。
00
Mr.Chou
4天前
If you do not stand for something, you will fall for anything.
00
Mr.Chou
5天前
“自然语言成为软件的根本接口,或意味着GUI时代的终结。”(Cristóbal Valenzuela)

但用户不跟接口直接打交道呀。对话这种交互,有时是目的,但多数时候只是手段。人需要用语言交流,但也需要明确的结构、视图来理解和把握事物。很多时候对“What's going on/Where we are”的最佳回答形式应该是地图/看板,而不是精心撰写但必须按顺序阅读的文字。人类哪能舍得GUI死去呢?

海辛Hyacinth: 给龙虾搞了一个线上办公室~~ 1. 在不同工作状态时,会去房间不同区域:执行任务时去工作区、闲置时去休息区、报bug了去警报区。 2. 龙虾做了个临时公网链接,手机可访问~ 3. 龙虾会随机说一些自己当时的想法。

00
Mr.Chou
5天前
最近Meta的Summer Yue的邮箱险些被OpenClaw清空的事件,不过又是一个“模型在场景常识的具备和运用上不足”的体现。今时今日的模型和以记忆见长的明星应用,仍然会随机在重要场合送出惊喜。所以,我对于玩具产品的日趋泛滥毫无感觉,倒是对做好做精领域评测的产品的信心越来越足了。

Mr.Chou: 最近一个被强化的认识是,精细的评测标准是各领域大模型产品落地的最关键因素,而这个环节正被过分低估。 今天身边还有朋友测“大模型数strawberry里有几个r”的例子,发现一众大模型,包括长思考加成的Kimi在内,都还是纷纷倒下了。这个经典问题曾经引发热烈讨论,多数共识是tokenization导致的原始字符级信息丢失的原因。但为什么模型不自己主动地展开数呢?——因为没人教它这么做(by Andrej Karpathy)。 好家伙,那真实场景中到底还存在多少“对人来说如此自然,但因为没人教模型这么做,所以它总掉链子”的情况呢? 因而deepseek-r1涌现出的表达“我要怎么做”的能力令人印象深刻。除了在公共benchmark上的亮眼表现之外,深入使用过的人,甚至有时能从r1的思考过程中获得分析性的启发。在这些时刻,它表现出能很自然地运用一些与任务场景相关的“小常识”——完成该任务应该具备的“基本做事方法和思维方式”。在前几天@追风少女晴岚 让Manus“抓京东的数据做分析”的case中,模型在尝试多次爬数据无果的情况下,选择了生成模拟数据来完成任务的策略。可是这个任务描述没明写出来、但最显而易见的常识,不就是「数据的真实性」么? 所以,对于模型在各行各业的落地来说,「场景常识的具备和运用」是一个很容易被忽略的优化重点。除了完善专有的tools、增强任务规划的planning能力、准确设计context和memory这几个「脚手架」之外,模型本身还必须能够以从业者的基本视角去理解任务的内涵和边界,理解场景的内在要求。 但模型的这种能力,很难正向构建出来。Karpathy认为strawberry这类问题的核心在于目前的大模型缺乏「认知自我知识(cognitive self-knowledge)」( 模型自身对其知识和能力的自我认知 )。模型对自己不具备哪些常识,是不自知的,人也无法在模型犯错前提前获知。按照现在的技术路线,不管模型如何发展,这个问题恐怕会长期存在。所以,在每个有价值的任务中,即使是提示词老手,提示词也需要反复迭代,因为在模型具备基本智商的情况下,“人要把话需要说得多明白”,取决于模型在该场景下的常识的深度和细度如何,这只能一点点试出来。模型的知识并不是一块连续的大陆,反倒是有着各种看不见的深坑和塌陷。我们试图在模型上建立的各式各样的知识挖掘机器,要想保持稳定运转,就得在现场勘测时摸清楚坑的位置,并在这些地方做好加固和铺垫。 一个垂直领域内合格的能用的大模型产品,就必须全面摸过并设置了手段以避过这些坑,才能获得领域的入场券。所以,一个领域里的大模型产品及其生态能健康发展的前提,就是有全面覆盖真实场景的深坑的精细测评。但这种测评太专业、精细和繁杂了,很难由一小撮人自顶向下地构建。最好的方式,可能是动员全领域的真实从业者去寻找现有模型在领域应用中被踩到的坑坑洼洼,这些坑往往不是知识性的(现在的公共benchmark的方向),而是情境性的(理解任务本身,做好执行);不是泛泛而谈的(过于大而化之),而是细节丰富的(琐碎但有价值)。如果没有这样的过程,就很难建立起有效的评测标准来捕捉错误,也就无法谈论垂直领域需要怎样的数据补充,模型在任何领域的落地都走不长做不大。

00
Mr.Chou
5天前
应该活出他妈的主体性。强大的主体性让人既可以决定此生怎么活,又可以得到属于强者的认可(或者完全不在乎是否得到认可)。

主体性弱时,二者是根本上冲突的。
10
Mr.Chou
5天前
人们不会因为一次创作就真正认识、记住一个人,而是通过其长期稳定的输出,拼凑出背后那个推动这一切发生的灵魂,并留下实在的印象。

Mr.Chou: 尽量在世界上留下多的、好的、真的痕迹。你无法预期这个物理世界的推荐机制,会在何时把你的痕迹推送到谁的生活窗口中。

10
Mr.Chou
6天前
我仍然觉得,在未来,与过去一样,相比于提升工具运用的熟练程度,积累对问题的深入理解要远远更重要。后者才有taste发生所需的营养。
00
Mr.Chou
7天前
只能欣赏效率之美,是种很难自知的可怕缺陷。
50
Mr.Chou
7天前
prompt调崩溃无数次后,我认为LLM实践中最大的dilemma是:既想充分享受人类在互联网上留下的集体智能的托举,又希望在自己的个性化任务上不受到这些通用语料的污染。
00
Mr.Chou
8天前
- “成功的职业生涯并不只在于找到你热爱的工作,而且是建立起你热爱的生活。”
- “做点事要是不被骂或者不被拒绝,感觉做的事都不够激进有效果。”
- “你最成功的一笔投资带来的回报将超过你其他所有投资的总和。”

再度启程之际,再度温习一遍。
11