即刻App年轻人的同好社区
下载
App内打开
Yibie
817关注4k被关注4夸夸
用好奇心行走江湖
以热爱行侠仗义
置顶
Yibie
2年前
Yibie 的自我策展

我整理之前发过的帖子,这些是值得推荐一看的。也顺道向你暴露我的世界观、性格、兴趣和观点,有机会的话交个朋友😊

✨ AI 与新世界

得到 Prompt 系列(共 18 个) ⭐️已被“提示词图书馆收录”
m.okjike.com

Promopt: 文章精炼大师
web.okjike.com

Promopt: 概念卡片制作专家
web.okjike.com

Promopt: PPT 大纲制作助手 ⭐获得即刻精选推荐
web.okjike.com

Promopt: Kiweb. 文章精华浓缩专家
web.okjike.com

开发 12 Weeks LifeRPG 背后的过程与思考
web.okjike.com

用 AI 帮忙总结笔记(测试了 ChatGPT、Gemini、Kiweb.、豆包)
web.okjike.com

微软 CTO Kevin Scott 接受 every 访谈
web.okjike.com

吴恩达总结 AI 工程师制作 Promopt 的经验
web.okjike.com

OpenAI 2024 年春季发布会源文件, 包括演讲稿和演示用代码
web.okjike.com

视频内容识别是 Gemini Pro 1.5 的杀手锏
web.okjike.com

Perplexity 的官方 Promopt
web.okjike.com

大模型公司对 Token 的计算方法都不一样
web.okjike.com

AI 与创作者经济
web.okjike.com

------------------------------------

🤔我对这个世界有点看法

every 长文: AI 将冲击广告业, 后果很严重
web.okjike.com

Vision Pro 之我见
web.okjike.com

社会生活的趋同让人恐惧
web.okjike.com

「探索式」笔记法 ⭐获得即刻精选推荐
web.okjike.com

子弹日记法
web.okjike.com

商业价值的 3 个重要特征
web.okjike.com

Arc 这家公司的特点
web.okjike.com

新产品形态: Jina AI 将 URL 变为 API
web.okjike.com

------------------------------------

📒囤了一些清单

值得推荐的豆瓣小组
web.okjike.com

包豪斯设计的精华链接
web.okjike.com

Design Engineer 的 Twitter List
web.okjike.com

------------------------------------

📖️那些值得推荐的好书

读完斯多葛主义代表人物塞涅卡的书信集 <短暂的生命>
web.okjike.com

程序员超强大脑笔记
web.okjike.com

读完<巨人的工具>
web.okjike.com

读完<为什么伟大不能被计划>
web.okjike.com

精要主义读书笔记
web.okjike.com

读《了不起的盖茨比》
web.okjike.com

------------------------------------

💭️脑海里闪过的一句话

天才税
web.okjike.com

高度抽象的现代生活损害人类天生的类比能力
web.okjike.com

你能列出充分反映时代精神的 3 家公司吗?
web.okjike.com

解决拖延症的办法是找出之前最想完成但一直没做的事
web.okjike.com

美 = 深刻的简洁
web.okjike.com

尊重常识 = 不犯基本错误
web.okjike.com

与其花 1 小时如昙花一现, 不如花 10 倍时间震惊四座
web.okjike.com

这个世界有种人,以好人为食。
web.okjike.com

最难沟通的,是被灌输了标准答案的人
web.okjike.com

拖延 = 甩锅给未来的自己
web.okjike.com

折腾的定义
web.okjike.com

------------------------------------

🛠喜欢折腾工具

开启 Mac 系统自带白噪音音乐的方法
web.okjike.com

20-20-20 护眼原则
web.okjike.com

用哔哩哔哩替代网易云音乐
web.okjike.com

中国著名羽毛球运动员郑思维学习英语的工具和方法
web.okjike.com

------------------------------------

📁未归类的答案

「参考答案」的策展原则
web.okjike.com
920
Yibie
2天前
Tiago Forte 关于获取知识的 7 条原则:

1. 互动重于消费:投入时间和精力而不是简单收藏

2. 平衡细节与可发现性:过于细节太冗长,过于简略无法找到

3. 有选择的压缩知识:挑重点的来

4. 直觉大于分析:我们本身的思维就不精密

5. 将大部分注意力集中在最有价值的信息上:一本书只记得一句话,也没什么不好的

6. 隐性知识高于显性知识:属于你自己的独特观点和反馈,别人拿不走的

7. 重视问题,轻视答案:发现问题的质量,是解决方案质量的基石

这几条来自 Flomo 101 手册(help.flomoapp.com),其中第 2,5,6,7 条,我经常忽略,陷入笔记囤积症中。
01
Yibie
2天前
有一种美,叫「快」
00
Yibie
3天前
很喜欢这张图
00
Yibie
4天前
关于龙虾,有个很搞笑的事情,身边两个朋友第一次用龙虾,首先是希望扫描系统的漏洞,叫龙虾来做安全防护。

结果龙虾,将他的文件夹读写权限锁死。

这里要提醒大家,不要向龙虾问任何关于安全防护类的问题!

绝对是高危操作!

绝对是高危操作!

绝对是高危操作!
53
Yibie
4天前
现在流行一个借口,自己理解不了,就说是 AI 编造。 //@假寐的野猪: 该评论已删除

Yibie: Karpathy 的 AutoResearch 项目最近挺火的。但说实话,大多数人只看到了"让 AI 自动跑实验"这个表面,没看懂背后的方法论其实可以应用到任何领域。 我花了点时间拆解这个项目,发现它其实提供了一套通用的实验思维框架。不只是搞机器学习的能用,做产品的、做营销的、甚至优化团队会议都能用上。 ## 1. 让专家定标准,让系统去试错 传统做实验的方式是人类自己上:设计实验、执行、分析结果、决定下一步。Karpathy 的方案是倒过来的——人类只负责制定"什么是好"的标准,剩下的让系统自动完成。 这在 AutoResearch 里体现为 program.md(人类写的规则)和 http://train.py(AI 改动的代码)的分离。 但这个思路放到其他领域一样好用: 做广告的可以让设计师定义"好广告 = 点击率 > 5%,且符合品牌调性",然后让系统或实习生批量生成 100 个标题+图片组合去测试。做产品的可以定义"好设计 = 用户完成率 > 80%,步骤不超过 3 个",然后自动调整界面布局做 A/B 测试。 关键是把"判断权"和"执行权"分开。人类擅长定性判断,机器擅长大规模定量试错。 --- ## 2. 时间盒约束:不要最优,要够快 Karpathy 有个洞察挺有意思:不要问"什么是最优解",要问"在 5 分钟内能找到什么好解"。 AutoResearch 每次实验严格跑 5 分钟就停。这不是抠门,而是一种设计选择——约束会逼你找到更聪明的捷径。 不同类型的约束适用于不同场景: - 时间盒(比如 5 分钟、1 小时、1 天):适合需要快速迭代的领域,强制你试错而不是过度优化 - 预算盒(比如 100 元、1000 元):适合商业实验,逼你选择高性价比方案 - 数量盒(比如 10 个版本、100 次尝试):适合创意生成,强制多样性避免局部最优 - 样本盒(比如 100 个用户、1 个区域):适合市场测试,降低失败成本 对比一下两种思路: 传统的做法是"我们花 3 个月做个完美版本再发布"——风险在于做完了可能发现没人要。 AutoResearch 的思路是"我们用 1 周做 10 个粗糙版本,每个测 100 个用户"——快速找到方向,失败成本极低。 --- ## 3. 找到你的"北极星指标" AutoResearch 用 val_bpb(验证集 bits per byte)作为单一指标。这个数字小了就保留改动,大了就回滚。没有讨论,没有纠结。 复杂世界被压缩成单一数字,决策速度指数级提升。 这听起来过于简化,但实际操作中极其有效。关键是找到那个真正重要的指标。 举几个例子: - 写作领域:别纠结"深刻、有趣、易懂"这些模糊标准,直接看完读率 × 分享率 - 招聘领域:别空谈"能力强、文化匹配、有潜力",直接看试用期内绩效评分 - 选址:"人流大、租金低、竞争少"三难全,不如直接用月营收除以月租金 - 营销:别纠结"有创意、有传播、有转化",直接算 ROI 好指标有三个特征:能测量、当天或实时知道结果、单一不需要权衡。 --- ## 4. 实验也需要"后悔药" AutoResearch 用 Git 分支管理实验。尝试 A 失败了就丢弃,尝试 B 成功了就合并到主干,然后基于 B 继续尝试 C。 这听起来是技术细节,其实是一种思维方式:任何尝试都要有"回退"机制。 不会用 Git 的人也能实践这个思路: 写文档的可以用版本历史,或者养成"另存为 v1、v2、v3"的习惯。做设计的可以用 Figma 的版本历史,或者复制画板保留旧版本。定商业策略可以写决策日志,限定可撤销的试点范围。培养个人习惯可以做 30 天试验 + 日记记录,不行就换。 关键是不要因为害怕失败而不敢尝试——反正随时可以回到上一好状态。 --- ## 5. 设计"不用人在场"的系统 program.md 里有一句指令很有意思:"NEVER STOP... The human might be asleep"。 核心理念是把"人必须在场"变成"人可以不在场"。 这需要设计一个完整的自主循环: 首先是触发器——什么情况下开始一轮实验?可以是时间驱动(每天早上 8 点)、事件驱动(新数据来了)、或条件驱动(指标下降了)。 然后是执行器——具体做什么?要有明确的动作清单、出错怎么处理、资源够不够。 接着是判断器——怎么算成功?怎么算失败?最坏情况怎么优雅降级? 最后是记录器——每次尝试都要记,为什么做这个决定也要记,方便事后复盘。 这套机制搭好了,你就可以去睡觉,让系统自己跑。 ## 实战:用这个框架优化团队会议 光说理论没意思,看个实际例子。 假设你们团队每周例会太浪费时间,想优化。很多人不知道怎么下手,或者用"感觉"试错。 用 AutoResearch 框架这么干: 先定义实验空间——哪些东西可以调整?比如会议时长(30/45/60 分钟)、参与人数(全员/代表制/自愿参加)、议程结构(先信息同步后决策讨论,还是只讨论预提交议题)。 然后明确固定约束——什么不能动?比如每周一次周三下午、必须有会议记录、关键决策者必须在场。 接下来找到北极星指标——怎么算"好"?可以用会议满意度评分(1-5 星)和决策效率(议题闭环率)。 设定资源盒——打算投入多少资源试错?比如 4 周试验期、每周试 1 种新形式、固定 8 人团队参与。 最后是决策规则——什么时候保留新形式?比如满意度 ≥ 4.0 且闭环率 ≥ 80%。什么时候放弃?满意度 < 3.0 或有人明确反对。 跑 4 周下来,你会有一个明确的"最佳会议形式",而且是数据支撑的,不是拍脑袋定的。 ## 几个关键的心智转变 这套框架要求你改变一些固有观念: - 从"我要找到最优解"变成"我要在有限时间内找到足够好的解" - 从"人必须参与每一步"变成"人监督,系统执行" - 从"失败是坏事"变成"失败是数据,快速失败是优势" - 从"专家直觉判断"变成"指标驱动决策" - 从"做完美再发布"变成"快速试验,快速学习" ## 一句话总结 AutoResearch 的本质是用"可计算的成功标准 + 严格的资源约束 + 版本化的试错机制",把探索优化过程从"专家的手工艺术"变成"可自动化的大规模实验"。 这套思想不只适用于机器学习。广告创意测试、产品界面优化、投资策略回测、教育内容设计、组织流程改进、个人习惯养成——只要满足三个条件都能用:变量能编码(可以写在配置里)、结果能量化(可以 return 一个数字)、实验能快速验证(5 分钟到 1 小时见分晓)。 *基于 Karpathy 的 AutoResearch 项目分析 (http://github.com/karpathy/autoresearch)*

00
Yibie
4天前
Karpathy 的 AutoResearch 项目最近挺火的。但说实话,大多数人只看到了"让 AI 自动跑实验"这个表面,没看懂背后的方法论其实可以应用到任何领域。

我花了点时间拆解这个项目,发现它其实提供了一套通用的实验思维框架。不只是搞机器学习的能用,做产品的、做营销的、甚至优化团队会议都能用上。

## 1. 让专家定标准,让系统去试错

传统做实验的方式是人类自己上:设计实验、执行、分析结果、决定下一步。Karpathy 的方案是倒过来的——人类只负责制定"什么是好"的标准,剩下的让系统自动完成。

这在 AutoResearch 里体现为 program.md(人类写的规则)和 train.py(AI 改动的代码)的分离。

但这个思路放到其他领域一样好用:

做广告的可以让设计师定义"好广告 = 点击率 > 5%,且符合品牌调性",然后让系统或实习生批量生成 100 个标题+图片组合去测试。做产品的可以定义"好设计 = 用户完成率 > 80%,步骤不超过 3 个",然后自动调整界面布局做 A/B 测试。

关键是把"判断权"和"执行权"分开。人类擅长定性判断,机器擅长大规模定量试错。

---

## 2. 时间盒约束:不要最优,要够快

Karpathy 有个洞察挺有意思:不要问"什么是最优解",要问"在 5 分钟内能找到什么好解"。

AutoResearch 每次实验严格跑 5 分钟就停。这不是抠门,而是一种设计选择——约束会逼你找到更聪明的捷径。

不同类型的约束适用于不同场景:

- 时间盒(比如 5 分钟、1 小时、1 天):适合需要快速迭代的领域,强制你试错而不是过度优化
- 预算盒(比如 100 元、1000 元):适合商业实验,逼你选择高性价比方案
- 数量盒(比如 10 个版本、100 次尝试):适合创意生成,强制多样性避免局部最优
- 样本盒(比如 100 个用户、1 个区域):适合市场测试,降低失败成本

对比一下两种思路:

传统的做法是"我们花 3 个月做个完美版本再发布"——风险在于做完了可能发现没人要。

AutoResearch 的思路是"我们用 1 周做 10 个粗糙版本,每个测 100 个用户"——快速找到方向,失败成本极低。

---

## 3. 找到你的"北极星指标"

AutoResearch 用 val_bpb(验证集 bits per byte)作为单一指标。这个数字小了就保留改动,大了就回滚。没有讨论,没有纠结。

复杂世界被压缩成单一数字,决策速度指数级提升。

这听起来过于简化,但实际操作中极其有效。关键是找到那个真正重要的指标。

举几个例子:

- 写作领域:别纠结"深刻、有趣、易懂"这些模糊标准,直接看完读率 × 分享率
- 招聘领域:别空谈"能力强、文化匹配、有潜力",直接看试用期内绩效评分
- 选址:"人流大、租金低、竞争少"三难全,不如直接用月营收除以月租金
- 营销:别纠结"有创意、有传播、有转化",直接算 ROI

好指标有三个特征:能测量、当天或实时知道结果、单一不需要权衡。

---

## 4. 实验也需要"后悔药"

AutoResearch 用 Git 分支管理实验。尝试 A 失败了就丢弃,尝试 B 成功了就合并到主干,然后基于 B 继续尝试 C。

这听起来是技术细节,其实是一种思维方式:任何尝试都要有"回退"机制。

不会用 Git 的人也能实践这个思路:

写文档的可以用版本历史,或者养成"另存为 v1、v2、v3"的习惯。做设计的可以用 Figma 的版本历史,或者复制画板保留旧版本。定商业策略可以写决策日志,限定可撤销的试点范围。培养个人习惯可以做 30 天试验 + 日记记录,不行就换。

关键是不要因为害怕失败而不敢尝试——反正随时可以回到上一好状态。

---

## 5. 设计"不用人在场"的系统

program.md 里有一句指令很有意思:"NEVER STOP... The human might be asleep"。

核心理念是把"人必须在场"变成"人可以不在场"。

这需要设计一个完整的自主循环:

首先是触发器——什么情况下开始一轮实验?可以是时间驱动(每天早上 8 点)、事件驱动(新数据来了)、或条件驱动(指标下降了)。

然后是执行器——具体做什么?要有明确的动作清单、出错怎么处理、资源够不够。

接着是判断器——怎么算成功?怎么算失败?最坏情况怎么优雅降级?

最后是记录器——每次尝试都要记,为什么做这个决定也要记,方便事后复盘。

这套机制搭好了,你就可以去睡觉,让系统自己跑。

## 实战:用这个框架优化团队会议

光说理论没意思,看个实际例子。

假设你们团队每周例会太浪费时间,想优化。很多人不知道怎么下手,或者用"感觉"试错。

用 AutoResearch 框架这么干:

先定义实验空间——哪些东西可以调整?比如会议时长(30/45/60 分钟)、参与人数(全员/代表制/自愿参加)、议程结构(先信息同步后决策讨论,还是只讨论预提交议题)。

然后明确固定约束——什么不能动?比如每周一次周三下午、必须有会议记录、关键决策者必须在场。

接下来找到北极星指标——怎么算"好"?可以用会议满意度评分(1-5 星)和决策效率(议题闭环率)。

设定资源盒——打算投入多少资源试错?比如 4 周试验期、每周试 1 种新形式、固定 8 人团队参与。

最后是决策规则——什么时候保留新形式?比如满意度 ≥ 4.0 且闭环率 ≥ 80%。什么时候放弃?满意度 < 3.0 或有人明确反对。

跑 4 周下来,你会有一个明确的"最佳会议形式",而且是数据支撑的,不是拍脑袋定的。

## 几个关键的心智转变

这套框架要求你改变一些固有观念:

- 从"我要找到最优解"变成"我要在有限时间内找到足够好的解"
- 从"人必须参与每一步"变成"人监督,系统执行"
- 从"失败是坏事"变成"失败是数据,快速失败是优势"
- 从"专家直觉判断"变成"指标驱动决策"
- 从"做完美再发布"变成"快速试验,快速学习"

## 一句话总结

AutoResearch 的本质是用"可计算的成功标准 + 严格的资源约束 + 版本化的试错机制",把探索优化过程从"专家的手工艺术"变成"可自动化的大规模实验"。

这套思想不只适用于机器学习。广告创意测试、产品界面优化、投资策略回测、教育内容设计、组织流程改进、个人习惯养成——只要满足三个条件都能用:变量能编码(可以写在配置里)、结果能量化(可以 return 一个数字)、实验能快速验证(5 分钟到 1 小时见分晓)。

*基于 Karpathy 的 AutoResearch 项目分析 (github.com)*
720
Yibie
5天前
FileTypeGuard 官网上线,这个开源的小工具,只有一个用途:

别再让应用悄悄接管你的文件打开方式。FileTypeGuard 会持续监控 macOS 文件关联,一旦其他应用静默改掉默认应用,就自动恢复成你的首选设置。

网址: filetypeguard.com

希望对大家使用 macOS 的时候,有一点帮助。
02
Yibie
7天前
这不就是龙虾的 Corn 定时任务了吗?

code.claude.com
20
Yibie
7天前
把玩了这个 claude-design 的插件,流程非常人性化,它不会让你生硬地描述网站的设计,而是会列举出几个例子给你,让你选择(可以多选)。

然后,当它第一轮生成完之后,它会在本地启动一个网页端,让你查看,多个不同设计方向的初稿,比如说 1. Cinmatic 2. Arc playful 等等。至少有 5 个不同设计风格的初稿,你可以横向对比。思考成熟后,回到终端,AI 此时已经列好选项,让你选择偏好哪一种,你可以多选,也可以单选。

总之,claude-design 通过交互式的提问,将需要通过专业词汇描绘清楚的设计意图,平滑成不同的设计例子,通过「所见即所得」的方式,让用户马上对自己的想法产生感知,逐步理清自己的设计意图。

Link - github.com
05
Yibie
8天前
做了一个以「私人书信」为设计隐喻的 Hugo 博客主题:Epistle (尺素)。

它将博客构想为书桌上的一叠私人信札:

首页是桌上摊开的最新一封信

点击「信匣」可展开历年书信归档

每篇文章都有称谓、正文、祝颂语、署名、日期——如传统中文书信

"从前的日色变得慢,车、马、邮件都慢..."

特性:

- 深度集成 赫蹏 (Heti):自动中西文间距、标点挤压、行间注、诗词/古文/多栏排版等全部版式能力均通过
shortcode 开箱即用

- 五款信纸:白纸蓝墨 / 暖笺 / 晴空 / 夜信 / 春笺

- 楷体标题:文章标题使用楷体,营造手写感

- 信笺索引:右侧「信匣」按钮,抽屉式展开归档

- 轻量无依赖:纯原生 CSS/JS,无框架负担

github.com
00