即刻App
年轻人的同好社区
下载
App内打开
老肖111
25
关注
1
被关注
0
夸夸
老肖111
28天前
志达: 付费看完了 codex 团队的采访, 说下我认为的重点: - 团队只有 40人,就 1个 pm, 2个designer,其余全是 eng➕少量 researcher。 - 唯一一个 pm 的 routine就是用 codex 来处理用户反馈,issue,排优先级。一小时自动跑完一次,处理 100+issue,大部分 24 小时内修复。 - feature 都是极小团队(2-3 人),甚至单人完成,从规划到发布,再到迭代。 - 几乎没有定期会议了,全是点对点直接沟通,没任何流程,没啥管理成本。 - codex 协助新人 onboard,从电脑配置到项目和上下文同步 - 99% 代码是 codex 生成,每个工程师至少 4个并行 agent。一个在做 code review,一个在实现功能,一个在跑安全审计,一个在生成代码库摘要。 - 团队总leader 自己搞了个automation,每天多次随机选一个代码文件,让 agent 去找隐藏 bug 并提交修复。另一个 automation 每天自动搜索全网用户对产品的讨论,生成营销情报简报。 个人印象最深的地方: - 我觉得大 leader 如果不做向上管理,唯一那个 pm 的活他自己就能干完… - 协作成本急剧降低了,因为不需要协作了…大部分跨职能分工协作的活,agent 给你保证了下限,快速迭代的时候可以接受。 - 老外也搞 pr 排行榜…这很中国,有一个每日贡献报告:每天早9点自动汇总前一天所有合入 Codex app 的 commit。 - 还是不够聚焦,anthropic 一千多号人在编程模型和产品的专注度是超过 OpenAI 的,创业公司跟大平台竞争,大平台针对你这个方向的团队人数是没你多的。
0
0
0
老肖111
1月前
老编辑: 朋友们,生活工作中一定要多接触张雪这种人。没道理讲,就是想要做一件事,觉得自己能成。 远离各种版本的小黑格尔。 文化,制度,文明,历史……一套一套的,今天这决定,明天那本质的。实际上就是个装在语言笼子里的猴子,还被切掉了小脑。
0
0
0
老肖111
4月前
陈今: Gemini将这50个AI行业关键词设计成一张“通关地图”。它分为5个层级,从“什么都不懂”的门外汉,一路进阶到能理解AI行业趋势的“懂行”人士。 第一阶段:小白扫盲区(1-10) 目标: 听得懂新闻,知道大家在聊什么,不再觉得AI神秘。 1. 人工智能 (AI):机器模拟人的智力。大概念,所有东西的统称。 2. 生成式AI (GenAI):当前的红人。以前的AI负责“识别”(是不是猫),现在的AI负责“创造”(画一只猫)。 3. 大语言模型 (LLM):ChatGPT背后的技术统称。读了海量书本的超级“大脑”。 4. ChatGPT:OpenAI开发的最著名的聊天机器人,LLM的代名词(就像用“百度”指代“搜索”)。 5. 副驾驶 (Copilot):AI现在的最佳定位。它不是替代你的机长,而是帮你打辅助的副手。 6. 提示词 (Prompt):你对AI说的话。也就是“指令”或“咒语”。 7. 幻觉 (Hallucination):AI会自信地胡说八道。必知考点:AI说的话不一定对,要查证。 8. 聊天机器人 (Chatbot):AI的一种产品形态,通过对话框跟你交流。 9. 文生图 (Text-to-Image):输入文字,AI生成图片(如Midjourney)。 10. 算力 (Compute):AI的“体力”。通常指显卡(GPU)的数量,算力越强,AI越聪明。 第二阶段:上手玩家区(11-20) 目标: 开始使用AI工具,并掌握一些提高效率的技巧。 11. 多模态 (Multimodal):AI不再只是瞎子和聋子。它能看图、听声音、看视频。 12. 上下文 (Context):AI的“短期记忆”。比如“它可以记住前10轮对话”,这就是上下文能力。 13. 角色扮演 (Persona):核心技巧。告诉AI“你是一位资深编辑”,它写出的文章质量会立刻提升。 14. 追问/迭代 (Iteration):不要指望一句提示词就完美。根据AI的回答继续提要求,这叫“迭代”。 15. 联网搜索 (Web Browsing):解决AI“知识过期”的办法。让AI去查最新的网页。 16. 温度 (Temperature):调节参数。温度高(0.8+)AI更有创意但容易乱说是;温度低(0.2)AI更严谨保守。 17. 结构化输出 (Structured Output):让AI生成表格、JSON或代码,而不是一大段废话文本。 18. OCR (光学字符识别):现在AI看图提取文字的能力极强,可以用来整理发票、笔记。 19. 深度伪造 (Deepfake):风险点。AI换脸、AI变声。看到视频别轻易相信是真的。 20. 知识截止日期 (Knowledge Cutoff):模型训练完的那一天。不联网的话,AI不知道这天之后发生的事。 第三阶段:进阶原理区(21-30) 目标: 理解AI为什么这样工作,开始接触一点点技术逻辑。 21. 词元 (Token):AI的“货币”。AI不是按字读,是按Token读。大致 1000 Token ≈ 750 个英文单词 ≈ 500 个汉字。 22. 参数 (Parameters):衡量模型“脑容量”的指标。比如 7B(70亿)、70B。参数越大通常越聪明,但运行越慢。 23. 预测下一个词 (Next Token Prediction):本质原理。LLM其实是在玩“文字接龙”游戏,根据上文猜下一个字。 24. 推理 (Inference):模型训练好后,你用它的过程就叫“推理”。 25. 延迟 (Latency):你发问到AI开始回答的时间差。越快越好。 26. 基座模型 (Foundation Model):像“毛坯房”一样的原始模型,还没经过精装修,但潜力巨大。 27. 思维链 (Chain of Thought, CoT):2024-2025关键词。让AI展示思考过程,能大幅提升数学和逻辑能力(如OpenAI o1)。 28. 零样本/少样本提示 (Zero-shot / Few-shot):直接问AI(零样本) vs 给AI几个例子再问(少样本)。给例子是高手的习惯。 29. 开源模型 (Open Source Models):像安卓一样,代码公开,你可以免费下载到自己电脑上跑的模型(如Llama)。 30. 闭源模型 (Closed Source Models):像iOS一样,代码保密,你只能付费调用的模型(如GPT-4)。 第四阶段:行业懂行区(31-40) 目标: 能和技术人员沟通,理解企业如何部署和优化AI。 31. Transformer:现代AI的基石。谷歌发明的架构,没有它就没有今天的ChatGPT。 32. 预训练 (Pre-training):AI的“九年义务教育”。阅读海量互联网数据,学习通用知识。 33. 微调 (Fine-tuning):AI的“职业培训”。喂给它特定行业的数据,让它变成医疗、法律专家。 34. RLHF (人类反馈强化学习):教养训练。让真人给AI的回答打分,教AI如何说话得体、安全。 35. 嵌入 (Embedding):把文字变成数字向量。让AI计算“男人”和“国王”在数学上的距离。 36. 向量数据库 (Vector Database):专门存“嵌入”数据的地方,是给AI做外挂知识库的基础设施。 37. RAG (检索增强生成):企业应用核心。不重新训练模型,而是让AI像“开卷考试”一样去查阅企业内部文档库来回答问题。 38. API (应用程序接口):程序员把AI接入自己APP的通道。 39. 端侧模型 / 小模型 (SLM/On-device):2025趋势。可以在手机、笔记本上离线运行的小型AI,保护隐私。 40. 混合专家模型 (MoE):一种聪明的架构。就像医院分科室一样,一个大模型里有多个“专家”,遇到数学题叫数学专家,遇到写诗叫文学专家。 第五阶段:前沿与未来区(41-50) 目标: 谈资与视野,关注AI的进化方向和深层影响。 41. 智能体 (Agent):下一代风口。AI不仅能说话,还能操作工具(写代码、订票、发邮件),能够独立完成任务。 42. 多智能体协作 (Multi-Agent):好几个AI分工合作。一个负责写代码,一个负责检查bug,一个负责写文档。 43. 具身智能 (Embodied AI):把AI装进机器人身体里,让它能和物理世界互动(如特斯拉机器人)。 44. 对齐 (Alignment):确保AI的目标和人类的目标一致,不会为了“消灭癌症”而“消灭人类”。 45. 偏见 (Bias):AI可能会歧视。因为它学的数据里包含人类的偏见,我们需要修正它。 46. 数字孪生 (Digital Twin):用你的数据训练一个AI,让它模仿你的语气和知识,做你的“数字分身”。 47. Sora / 视频生成:物理世界模拟器。理解光影、运动规律,生成逼真视频。 48. 上下文窗口战争 (Context Window War):各家公司比拼谁的模型能一次读入更多的书(从几千字卷到几百万字)。 49. AGI (通用人工智能):圣杯。在所有经济价值的任务上都超越人类的AI。 50. ASI (超级人工智能):奇点。智力远超全人类总和的AI,目前的科幻/理论阶段。 Gemini的建议用法: 把这50个词做成一个Checklist(清单)。 • 对于入门者: 只要看懂前20个,就已经能熟练使用AI工具了。 • 对于管理者/进阶者: 理解到第40个(特别是RAG和微调的区别),就能思考如何在业务中落地AI了。
0
0
0
老肖111
7月前
阑夕ོ: 玩偶姐姐(HongKong Doll)刚在推特发了一篇长文,非常实诚的交代了她这几年来的翻身策略,其中包括自己怎么设套的,我愿称之为下海妹子里头脑最清醒的,没有之一。 因为涉及到加密货币的交易,我就不全文贴过来了,有兴趣的可以自己去推上看,我在这里简单总结一下: - 她本来是和男友一起经营OnlyFans,确实挣了一些钱,但因自己的炒币小爱好,在2023年的全都亏完了,总量差不多800万美金,而且OnlyFans的号荒废了; - 如果是一般人遇到这种冲击也就完了,但她内心知道,这个「福利姬炒币破产」的叙事会是自己最后翻盘的资产,所以她开始用这种极具感官刺激的推文来博关注,很快如愿破圈,到处都在贴她的推文截图; - 她完全明白「人设大于真相」的流量逻辑,所以会刻意为了戏剧性而编排自己的故事,虽然和男友分手在前,但她还是把整个时间线营造成炒币破产后又被渣男抛弃的话题属性; - 最牛逼的一点是,她也深知福利姬这个身份的复利价值,所以即便濒临绝境她也要再加一笔钱,从男友那里买下几百部未发布的影片素材,靠这个伪造成依然还在拍片的状态,一边恢复OnlyFans更新,一边重建现金流; - 而回归OnlyFans又给她创造了新的谈资,那就是可以通过频繁晒收入,在吸引眼球的同时,再造一个「人傻钱多」的设定,久而久之真的有人以为她拥有了无限子弹,影响力持续横跨币圈和色圈; - 推特大量接广告,加上OnlyFans的收入,让她开始有能力屯币,虽然有涨有跌,但至少让她拿到了重新入场的门票,最后苟到了今年加密货币的暴涨周期,总共2年时间,终于赚回了当初亏掉的那800万美金; - 她的推特粉丝160万,基于账号属性,在中推里绝对算是顶流了,广告接到手软,靠发素材即使不拍片OnlyFans每年也有100万美金的进账,这就是她当初坚持要花钱挨宰买下那些素材的原因,在普通人眼里那就是一些视频文件,而在她眼里那意味着账号可以继续使用的年限; - 在她看来,自己的人生没有上岸与否的界限,她还会继续坚持炒币,也明确知道风险,知道自己身为一个背景全无的人,不会是那个万中无一的练武奇才,凭本事赚的钱随时可能凭本事再亏出去,所以很感激以前评价她财不配位的人,时刻自省; - 至于这篇文章是不是她的新一轮叙事开端,这个就不得而知了,但她基本上是亮出了明牌,不管你们置信与否,我都还会长期处在流量中心,表达永远是成本最低的杠杆。
0
0
0
老肖111
10月前
AGENT橘: Manus 团队发布 Blog,解密上下文工程实践 这是花了用几千万美元学费,实际各种踩坑,才得到了一些反共识的经验 非常宝贵 1. 上下文工程比“从头造轮子”更香 Manus团队一开始就决定:别自己训练大模型,直接用现成的模型,把精力放在“怎么喂模型好吃的上下文”上。这样产品能快速迭代,模型升级了,产品也能跟着飞。 2. KV缓存命中率,省钱又提速的秘密武器 KV缓存就像“记忆力外挂”。只要上下文前缀不变,模型能复用之前的计算,推理又快又省钱。比如,缓存命中时的成本能比没命中便宜10倍!所以,团队拼命想办法让上下文“长得一样”,别乱动。 3. 上下文只加不改,别乱动历史 就像写日记,不能回头改昨天的内容。只往后追加新内容,这样缓存才不会失效。哪怕是小小的时间戳变化,也会让缓存白搭。 4. 工具多了别乱删,掩码比删除更聪明 Agent能用的工具越来越多,像超市货架一样。以前想着动态加减工具,结果缓存全失效,模型还晕头转向。后来学聪明了:工具都留着,用“掩码”让模型只看到该用的那几个,其他的暂时“隐身”。 5. 文件系统是超级外挂记忆 上下文窗口再大也有极限,怎么办?Manus直接把文件系统当成“外挂大脑”,模型需要啥就去文件里找。这样任务再复杂也不怕,信息随时能查回来。 6. 错误要留下,别急着擦屁股 Agent犯错很正常,别急着把错误删掉。把“走过的弯路”留在上下文里,模型下次看到就能学乖,不会老是踩同一个坑。 7. 少样本提示别太单一,适当加点花样 如果上下文里全是一样的例子,模型容易“套路化”,一直重复同样的操作。Manus会故意加点小变化,让模型保持新鲜感,避免陷入“机械式”决策。 Manus 上下文工程实践的原文: https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus
0
0
0
老肖111
1年前
兔撕鸡大老爷: 最近,抖音弄了个算法公开日,把它家神秘莫测的算法公开了,还公布在了抖家的安全官网上(95152.douyin.com),引发了一堆内行人的学习兴趣。 我逐字看完咯,写的很通俗易懂。 但普通人仍需要我这样的中译中闲人翻译。 抖音算法主要是Wide&Deep模型和双塔召回模型。 Wide&Deep模型是谷歌提出的混合推荐模型,wide是宽度的意思,deep是深度,什么意思呢,前者是挖掘你跟一支视频的直接联系,譬如你在看运动鞋,它就给你推同款。后者是挖掘你跟这支视频的泛联系,你在看鞋,那么你可能会去旅游,想要买运动手表。 充分挖掘你人生的宽度与深度。 双塔召回模型很有意思,一座是用户塔,一座是内容塔,两个都是深度学习模型,把一些内容特征做了数字转化。 譬如你是用户,爱看游戏,做菜,唱歌,熊猫,用户塔便赋予她们数学代号为0,1,2,3。短视频为X,长视频为Y。 做菜短视频就变成了(1,X),又做菜又唱歌的短视频是(1,2,X),像搞怪、诗意、科技、玄学都是可以被数字化的内容特征。 抖音还有座内容塔嘛,识别到了你家用户塔的数学特征后,会粗筛一批口粮给你,搞笑大厨,薄肌体育生,宫斗短剧,杀死比尔等等,排序到了你的预存储空间里。 上下一划,大概率是你想看的。 抖音总结推荐算法,就是以数学计算学习人类行为。 抖音还公布了推荐优先级,设定了一些行为的“推荐价值”,不再是只看完播率了,在中长视频+短剧生态繁荣后,发展出来了多目标建模,让推荐更加均衡。 除了把算法黑盒拆开给大家看,还讲了怎么治理内容。 建立有专门的标准管理团队,已对违法违规、色情低俗、公序良俗、危险行为等十余大类、数百种风险设置了独立标准条款,每条标准条款都匹配典型违规案例及对应执行手册。 流量越高的内容经过评估的次数越多,标准也越严格。所以我们会看到一些违规内容,很快就被限流或处理掉了。 在这块是“机器+人工”的审核,又有一点Wide&Deep的味道,机器主要负责宽度,主动对所有投稿进行评估,筛掉最直观的问题点。人工主要负责深度,确保疑难问题尽可能精准研判,减少错判,毕竟算法不是真的懂内容。 这个安全网站还会更新。。。 甚至聊到了APP会“窃听”用户谈话吗? 它的副标题是:平台“窃听”在技术上不“划算”,在法律上不被允许。 里面聊到了跨平台营销推荐,是造成用户被窃听的主要幻觉。 例如,用户在A电商平台搜索了一款猫粮。关闭A平台后,打开了B社交平台,发现B平台也在推荐猫粮。这并不是B平台对用户做了监控,是A平台作为B平台的广告主,通过程序化广告利用A平台的数据定向给用户展示了广告,实现跨平台的广告营销。 这个举动是符合我国法律法规的一种广告形式。 啊...这个算法公开日太有意思了,人的行为啊,才是算法的根本。
0
0
0
老肖111
1年前
Jackey_: 最近常用一人公司 AI 工具集合: 日常使用: http://Grok.com(免费额度) 图文视频: http://klingai.com (免费额度) 设计 UI : http://Relume.io (免费试用) IDE: http://TRAE.ai(3.7 免费用) + http://Cursor.com(免费) 命令行: http://warp.dev (免费) 浏览器: http://deta.Surf (内测中 3.7 免费用) 视频录制: 剪映(免费复刻 ScreenStudio 功能) 文生流程图: http://Napkin.ai (免费) Banner 图: http://Canva.com (免费额度) 画架构图: http://Excalidraw.com (免费) SAAS 网站:http://Webflow.com + http://framer.com (免费模板) 转自X@EC Elliot
0
0
0
老肖111
1年前
👍
志达: Gemini 真的利用 Google 的优势构建了独特的产品价值,赞一个。
0
1
0
老肖111
6年前
本以为今天可以轻松一下,结果直接忙到爆炸,优先级已经不管用了,真希望我的脑子是个多线程,并不只是只能优先处理一个事,回家真的脑壳疼。特别负责的又是自己不喜欢做的业务。太难了
1
1
0
老肖111
6年前
来到即刻的第一天。
0
3
0