老肖111的个人主页

即刻App年轻人的同好社区

下载

App内打开

老肖111

25关注1被关注0夸夸

老肖111

28天前

志达: 付费看完了 codex 团队的采访，说下我认为的重点: - 团队只有 40人，就 1个 pm， 2个designer，其余全是 eng➕少量 researcher。 - 唯一一个 pm 的 routine就是用 codex 来处理用户反馈，issue，排优先级。一小时自动跑完一次，处理 100+issue，大部分 24 小时内修复。 - feature 都是极小团队（2-3 人），甚至单人完成，从规划到发布，再到迭代。 - 几乎没有定期会议了，全是点对点直接沟通，没任何流程，没啥管理成本。 - codex 协助新人 onboard，从电脑配置到项目和上下文同步 - 99% 代码是 codex 生成，每个工程师至少 4个并行 agent。一个在做 code review，一个在实现功能，一个在跑安全审计，一个在生成代码库摘要。 - 团队总leader 自己搞了个automation，每天多次随机选一个代码文件，让 agent 去找隐藏 bug 并提交修复。另一个 automation 每天自动搜索全网用户对产品的讨论，生成营销情报简报。个人印象最深的地方: - 我觉得大 leader 如果不做向上管理，唯一那个 pm 的活他自己就能干完… - 协作成本急剧降低了，因为不需要协作了…大部分跨职能分工协作的活，agent 给你保证了下限，快速迭代的时候可以接受。 - 老外也搞 pr 排行榜…这很中国，有一个每日贡献报告：每天早9点自动汇总前一天所有合入 Codex app 的 commit。 - 还是不够聚焦，anthropic 一千多号人在编程模型和产品的专注度是超过 OpenAI 的，创业公司跟大平台竞争，大平台针对你这个方向的团队人数是没你多的。

0 00

老肖111

1月前

老编辑: 朋友们，生活工作中一定要多接触张雪这种人。没道理讲，就是想要做一件事，觉得自己能成。远离各种版本的小黑格尔。文化，制度，文明，历史……一套一套的，今天这决定，明天那本质的。实际上就是个装在语言笼子里的猴子，还被切掉了小脑。

0 00

老肖111

4月前

陈今: Gemini将这50个AI行业关键词设计成一张“通关地图”。它分为5个层级，从“什么都不懂”的门外汉，一路进阶到能理解AI行业趋势的“懂行”人士。第一阶段：小白扫盲区（1-10）目标：听得懂新闻，知道大家在聊什么，不再觉得AI神秘。 1. 人工智能 (AI)：机器模拟人的智力。大概念，所有东西的统称。 2. 生成式AI (GenAI)：当前的红人。以前的AI负责“识别”（是不是猫），现在的AI负责“创造”（画一只猫）。 3. 大语言模型 (LLM)：ChatGPT背后的技术统称。读了海量书本的超级“大脑”。 4. ChatGPT：OpenAI开发的最著名的聊天机器人，LLM的代名词（就像用“百度”指代“搜索”）。 5. 副驾驶 (Copilot)：AI现在的最佳定位。它不是替代你的机长，而是帮你打辅助的副手。 6. 提示词 (Prompt)：你对AI说的话。也就是“指令”或“咒语”。 7. 幻觉 (Hallucination)：AI会自信地胡说八道。必知考点：AI说的话不一定对，要查证。 8. 聊天机器人 (Chatbot)：AI的一种产品形态，通过对话框跟你交流。 9. 文生图 (Text-to-Image)：输入文字，AI生成图片（如Midjourney）。 10. 算力 (Compute)：AI的“体力”。通常指显卡（GPU）的数量，算力越强，AI越聪明。第二阶段：上手玩家区（11-20）目标：开始使用AI工具，并掌握一些提高效率的技巧。 11. 多模态 (Multimodal)：AI不再只是瞎子和聋子。它能看图、听声音、看视频。 12. 上下文 (Context)：AI的“短期记忆”。比如“它可以记住前10轮对话”，这就是上下文能力。 13. 角色扮演 (Persona)：核心技巧。告诉AI“你是一位资深编辑”，它写出的文章质量会立刻提升。 14. 追问/迭代 (Iteration)：不要指望一句提示词就完美。根据AI的回答继续提要求，这叫“迭代”。 15. 联网搜索 (Web Browsing)：解决AI“知识过期”的办法。让AI去查最新的网页。 16. 温度 (Temperature)：调节参数。温度高（0.8+）AI更有创意但容易乱说是；温度低（0.2）AI更严谨保守。 17. 结构化输出 (Structured Output)：让AI生成表格、JSON或代码，而不是一大段废话文本。 18. OCR (光学字符识别)：现在AI看图提取文字的能力极强，可以用来整理发票、笔记。 19. 深度伪造 (Deepfake)：风险点。AI换脸、AI变声。看到视频别轻易相信是真的。 20. 知识截止日期 (Knowledge Cutoff)：模型训练完的那一天。不联网的话，AI不知道这天之后发生的事。第三阶段：进阶原理区（21-30）目标：理解AI为什么这样工作，开始接触一点点技术逻辑。 21. 词元 (Token)：AI的“货币”。AI不是按字读，是按Token读。大致 1000 Token ≈ 750 个英文单词 ≈ 500 个汉字。 22. 参数 (Parameters)：衡量模型“脑容量”的指标。比如 7B（70亿）、70B。参数越大通常越聪明，但运行越慢。 23. 预测下一个词 (Next Token Prediction)：本质原理。LLM其实是在玩“文字接龙”游戏，根据上文猜下一个字。 24. 推理 (Inference)：模型训练好后，你用它的过程就叫“推理”。 25. 延迟 (Latency)：你发问到AI开始回答的时间差。越快越好。 26. 基座模型 (Foundation Model)：像“毛坯房”一样的原始模型，还没经过精装修，但潜力巨大。 27. 思维链 (Chain of Thought, CoT)：2024-2025关键词。让AI展示思考过程，能大幅提升数学和逻辑能力（如OpenAI o1）。 28. 零样本/少样本提示 (Zero-shot / Few-shot)：直接问AI（零样本） vs 给AI几个例子再问（少样本）。给例子是高手的习惯。 29. 开源模型 (Open Source Models)：像安卓一样，代码公开，你可以免费下载到自己电脑上跑的模型（如Llama）。 30. 闭源模型 (Closed Source Models)：像iOS一样，代码保密，你只能付费调用的模型（如GPT-4）。第四阶段：行业懂行区（31-40）目标：能和技术人员沟通，理解企业如何部署和优化AI。 31. Transformer：现代AI的基石。谷歌发明的架构，没有它就没有今天的ChatGPT。 32. 预训练 (Pre-training)：AI的“九年义务教育”。阅读海量互联网数据，学习通用知识。 33. 微调 (Fine-tuning)：AI的“职业培训”。喂给它特定行业的数据，让它变成医疗、法律专家。 34. RLHF (人类反馈强化学习)：教养训练。让真人给AI的回答打分，教AI如何说话得体、安全。 35. 嵌入 (Embedding)：把文字变成数字向量。让AI计算“男人”和“国王”在数学上的距离。 36. 向量数据库 (Vector Database)：专门存“嵌入”数据的地方，是给AI做外挂知识库的基础设施。 37. RAG (检索增强生成)：企业应用核心。不重新训练模型，而是让AI像“开卷考试”一样去查阅企业内部文档库来回答问题。 38. API (应用程序接口)：程序员把AI接入自己APP的通道。 39. 端侧模型 / 小模型 (SLM/On-device)：2025趋势。可以在手机、笔记本上离线运行的小型AI，保护隐私。 40. 混合专家模型 (MoE)：一种聪明的架构。就像医院分科室一样，一个大模型里有多个“专家”，遇到数学题叫数学专家，遇到写诗叫文学专家。第五阶段：前沿与未来区（41-50）目标：谈资与视野，关注AI的进化方向和深层影响。 41. 智能体 (Agent)：下一代风口。AI不仅能说话，还能操作工具（写代码、订票、发邮件），能够独立完成任务。 42. 多智能体协作 (Multi-Agent)：好几个AI分工合作。一个负责写代码，一个负责检查bug，一个负责写文档。 43. 具身智能 (Embodied AI)：把AI装进机器人身体里，让它能和物理世界互动（如特斯拉机器人）。 44. 对齐 (Alignment)：确保AI的目标和人类的目标一致，不会为了“消灭癌症”而“消灭人类”。 45. 偏见 (Bias)：AI可能会歧视。因为它学的数据里包含人类的偏见，我们需要修正它。 46. 数字孪生 (Digital Twin)：用你的数据训练一个AI，让它模仿你的语气和知识，做你的“数字分身”。 47. Sora / 视频生成：物理世界模拟器。理解光影、运动规律，生成逼真视频。 48. 上下文窗口战争 (Context Window War)：各家公司比拼谁的模型能一次读入更多的书（从几千字卷到几百万字）。 49. AGI (通用人工智能)：圣杯。在所有经济价值的任务上都超越人类的AI。 50. ASI (超级人工智能)：奇点。智力远超全人类总和的AI，目前的科幻/理论阶段。 Gemini的建议用法：把这50个词做成一个Checklist（清单）。 • 对于入门者：只要看懂前20个，就已经能熟练使用AI工具了。 • 对于管理者/进阶者：理解到第40个（特别是RAG和微调的区别），就能思考如何在业务中落地AI了。

0 00

老肖111

7月前

阑夕ོ: 玩偶姐姐（HongKong Doll）刚在推特发了一篇长文，非常实诚的交代了她这几年来的翻身策略，其中包括自己怎么设套的，我愿称之为下海妹子里头脑最清醒的，没有之一。因为涉及到加密货币的交易，我就不全文贴过来了，有兴趣的可以自己去推上看，我在这里简单总结一下： - 她本来是和男友一起经营OnlyFans，确实挣了一些钱，但因自己的炒币小爱好，在2023年的全都亏完了，总量差不多800万美金，而且OnlyFans的号荒废了； - 如果是一般人遇到这种冲击也就完了，但她内心知道，这个「福利姬炒币破产」的叙事会是自己最后翻盘的资产，所以她开始用这种极具感官刺激的推文来博关注，很快如愿破圈，到处都在贴她的推文截图； - 她完全明白「人设大于真相」的流量逻辑，所以会刻意为了戏剧性而编排自己的故事，虽然和男友分手在前，但她还是把整个时间线营造成炒币破产后又被渣男抛弃的话题属性； - 最牛逼的一点是，她也深知福利姬这个身份的复利价值，所以即便濒临绝境她也要再加一笔钱，从男友那里买下几百部未发布的影片素材，靠这个伪造成依然还在拍片的状态，一边恢复OnlyFans更新，一边重建现金流； - 而回归OnlyFans又给她创造了新的谈资，那就是可以通过频繁晒收入，在吸引眼球的同时，再造一个「人傻钱多」的设定，久而久之真的有人以为她拥有了无限子弹，影响力持续横跨币圈和色圈； - 推特大量接广告，加上OnlyFans的收入，让她开始有能力屯币，虽然有涨有跌，但至少让她拿到了重新入场的门票，最后苟到了今年加密货币的暴涨周期，总共2年时间，终于赚回了当初亏掉的那800万美金； - 她的推特粉丝160万，基于账号属性，在中推里绝对算是顶流了，广告接到手软，靠发素材即使不拍片OnlyFans每年也有100万美金的进账，这就是她当初坚持要花钱挨宰买下那些素材的原因，在普通人眼里那就是一些视频文件，而在她眼里那意味着账号可以继续使用的年限； - 在她看来，自己的人生没有上岸与否的界限，她还会继续坚持炒币，也明确知道风险，知道自己身为一个背景全无的人，不会是那个万中无一的练武奇才，凭本事赚的钱随时可能凭本事再亏出去，所以很感激以前评价她财不配位的人，时刻自省； - 至于这篇文章是不是她的新一轮叙事开端，这个就不得而知了，但她基本上是亮出了明牌，不管你们置信与否，我都还会长期处在流量中心，表达永远是成本最低的杠杆。

0 00

老肖111

10月前

AGENT橘: Manus 团队发布 Blog，解密上下文工程实践这是花了用几千万美元学费，实际各种踩坑，才得到了一些反共识的经验非常宝贵 1. 上下文工程比“从头造轮子”更香 Manus团队一开始就决定：别自己训练大模型，直接用现成的模型，把精力放在“怎么喂模型好吃的上下文”上。这样产品能快速迭代，模型升级了，产品也能跟着飞。 2. KV缓存命中率，省钱又提速的秘密武器 KV缓存就像“记忆力外挂”。只要上下文前缀不变，模型能复用之前的计算，推理又快又省钱。比如，缓存命中时的成本能比没命中便宜10倍！所以，团队拼命想办法让上下文“长得一样”，别乱动。 3. 上下文只加不改，别乱动历史就像写日记，不能回头改昨天的内容。只往后追加新内容，这样缓存才不会失效。哪怕是小小的时间戳变化，也会让缓存白搭。 4. 工具多了别乱删，掩码比删除更聪明 Agent能用的工具越来越多，像超市货架一样。以前想着动态加减工具，结果缓存全失效，模型还晕头转向。后来学聪明了：工具都留着，用“掩码”让模型只看到该用的那几个，其他的暂时“隐身”。 5. 文件系统是超级外挂记忆上下文窗口再大也有极限，怎么办？Manus直接把文件系统当成“外挂大脑”，模型需要啥就去文件里找。这样任务再复杂也不怕，信息随时能查回来。 6. 错误要留下，别急着擦屁股 Agent犯错很正常，别急着把错误删掉。把“走过的弯路”留在上下文里，模型下次看到就能学乖，不会老是踩同一个坑。 7. 少样本提示别太单一，适当加点花样如果上下文里全是一样的例子，模型容易“套路化”，一直重复同样的操作。Manus会故意加点小变化，让模型保持新鲜感，避免陷入“机械式”决策。 Manus 上下文工程实践的原文： https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus

0 00

老肖111

1年前

兔撕鸡大老爷: 最近，抖音弄了个算法公开日，把它家神秘莫测的算法公开了，还公布在了抖家的安全官网上（95152.douyin.com），引发了一堆内行人的学习兴趣。我逐字看完咯，写的很通俗易懂。但普通人仍需要我这样的中译中闲人翻译。抖音算法主要是Wide&Deep模型和双塔召回模型。 Wide&Deep模型是谷歌提出的混合推荐模型，wide是宽度的意思，deep是深度，什么意思呢，前者是挖掘你跟一支视频的直接联系，譬如你在看运动鞋，它就给你推同款。后者是挖掘你跟这支视频的泛联系，你在看鞋，那么你可能会去旅游，想要买运动手表。充分挖掘你人生的宽度与深度。双塔召回模型很有意思，一座是用户塔，一座是内容塔，两个都是深度学习模型，把一些内容特征做了数字转化。譬如你是用户，爱看游戏，做菜，唱歌，熊猫，用户塔便赋予她们数学代号为0，1，2，3。短视频为X，长视频为Y。做菜短视频就变成了（1，X），又做菜又唱歌的短视频是（1，2，X），像搞怪、诗意、科技、玄学都是可以被数字化的内容特征。抖音还有座内容塔嘛，识别到了你家用户塔的数学特征后，会粗筛一批口粮给你，搞笑大厨，薄肌体育生，宫斗短剧，杀死比尔等等，排序到了你的预存储空间里。上下一划，大概率是你想看的。抖音总结推荐算法，就是以数学计算学习人类行为。抖音还公布了推荐优先级，设定了一些行为的“推荐价值”，不再是只看完播率了，在中长视频+短剧生态繁荣后，发展出来了多目标建模，让推荐更加均衡。除了把算法黑盒拆开给大家看，还讲了怎么治理内容。建立有专门的标准管理团队，已对违法违规、色情低俗、公序良俗、危险行为等十余大类、数百种风险设置了独立标准条款，每条标准条款都匹配典型违规案例及对应执行手册。流量越高的内容经过评估的次数越多，标准也越严格。所以我们会看到一些违规内容，很快就被限流或处理掉了。在这块是“机器+人工”的审核，又有一点Wide&Deep的味道，机器主要负责宽度，主动对所有投稿进行评估，筛掉最直观的问题点。人工主要负责深度，确保疑难问题尽可能精准研判，减少错判，毕竟算法不是真的懂内容。这个安全网站还会更新。。。甚至聊到了APP会“窃听”用户谈话吗？它的副标题是：平台“窃听”在技术上不“划算”，在法律上不被允许。里面聊到了跨平台营销推荐，是造成用户被窃听的主要幻觉。例如，用户在A电商平台搜索了一款猫粮。关闭A平台后，打开了B社交平台，发现B平台也在推荐猫粮。这并不是B平台对用户做了监控，是A平台作为B平台的广告主，通过程序化广告利用A平台的数据定向给用户展示了广告，实现跨平台的广告营销。这个举动是符合我国法律法规的一种广告形式。啊...这个算法公开日太有意思了，人的行为啊，才是算法的根本。

0 00

老肖111

1年前

Jackey_: 最近常用一人公司 AI 工具集合：日常使用： http://Grok.com（免费额度）图文视频: http://klingai.com （免费额度) 设计 UI ： http://Relume.io (免费试用） IDE： http://TRAE.ai（3.7 免费用) + http://Cursor.com（免费）命令行： http://warp.dev (免费）浏览器: http://deta.Surf (内测中 3.7 免费用）视频录制：剪映（免费复刻 ScreenStudio 功能) 文生流程图: http://Napkin.ai (免费） Banner 图： http://Canva.com (免费额度) 画架构图： http://Excalidraw.com (免费） SAAS 网站：http://Webflow.com + http://framer.com (免费模板）转自X@EC Elliot

0 00

老肖111

1年前

👍

志达: Gemini 真的利用 Google 的优势构建了独特的产品价值，赞一个。

0 10

老肖111

6年前

本以为今天可以轻松一下，结果直接忙到爆炸，优先级已经不管用了，真希望我的脑子是个多线程，并不只是只能优先处理一个事，回家真的脑壳疼。特别负责的又是自己不喜欢做的业务。太难了

1 10

老肖111

6年前

来到即刻的第一天。

0 30