tongnn的个人主页 - 即刻App

即刻App年轻人的同好社区

下载

tongnn

350关注34被关注0夸夸

Base合肥的AI产品经理
读杂书，爱交友

tongnn

2天前

橘子汽水配柠檬水: 如果一个人不能精准的描述自己的需求，那么你最好不要给他建议。模糊的需求往往伴随着模糊的预期，对方可能并不清楚自己究竟期待什么结果。一旦失败了，他反而会责怪于你。所以，沉默有时比善意的建言更负责任。这不是冷漠，而是对双方关系的清醒维护。

0 00

tongnn

11天前

阑夕ོ: 我对赛车了解很浅，但对人的兴趣很高，去年在程前那里看「从县城修车工到年入7亿的车企老板」，印象很深，这几天张雪在WSBK的夺冠消息刷屏，有种合订本的感觉。这是一个纯血的中国剧本，不值一文的年轻人靠着勤奋聪明，打破所有的质疑和预期证明自己名利双收，很像短剧，然而胜在真实，这次的版本是，艺术固然源于生活，生活却会高于艺术。不过我要说的也不是跟风赢吹输婊，而是中国制造业的「好处」可能还在被低估。这么说可能有点奇怪，中国制造业的强大已经有太多材料佐证了，为什么还会认为它被低估了？最开始，制造业是承接就业人口的手段，是养活上亿劳动力的饭碗，以2012年的峰值来算，占到了22%以上的全国岗位，这也是张雪赤手空拳开始去重庆创业的年份。然后你会发现，制造业是有产业带效应的，张雪一个地地道道的湖南人，为什么要去重庆造车，连我这个根本不懂摩托车的人都能理解，重庆出了很多摩托车品牌，比如力帆——感谢那些年看的甲A联赛——配套最齐全，当然适合造车啊。产业带是集聚效应的成果，当一条产业的上下游工厂都开在「小时达」的接触半径后，所有的成本，包括显性的物流成本和隐性的沟通成本，都会大幅下降，这个时候再用秦晖老师的「低人权优势」去下判断，就解释不通了。这也是生态的一种，就像黄仁勋放话说竞争对手的芯片哪怕免费出售也撼动不了英伟达的市场优势，姑且不去较真这句大话，他的意思其实是背靠CUDA用了20年经营出来的开发生态，重复造轮子的离开成本其实远远高过芯片本身的溢价成本。于是就有再然后的，中国在贸易战里越打越顺的既成事实。贸易战这个事情，颠覆了很多所谓的常识，这很正常，智慧的增长就是需要不断修正自己的认知，比如最经典的「买方市场论」，得罪甲方死路一条。理论上当然没有任何问题，美国有世界上最强的消费市场，以及同等分量的议价权，供应商不听话，换一个就是，就是这么任性，对吧。但实际上呢，脱钩喊了这么久，越来越雷声大雨点小，去年还把中国的贸易顺差干到了史无前例的万亿美金级别，不会真以为是穷得响叮当的南方国家填上了美国的市场吧，还不是转口贸易立大功。如果说转口贸易是中国企业在钻空子，那么问题来了，如果美国本土没有消费需求，这转口也不可能成立啊，反过来也是一样，新加坡前几年最高时进口了英伟达超过28%的芯片出口，怎么，是新加坡人特别爱拿芯片泡酒喝吗？好用的东西，就是不愁卖，都是千年的狐狸，谁也别玩聊斋。贸易没有输赢，它的本质是各取所需，印度、越南、印尼都尝试过要当中国的备份，但是仔细去看，除了承接中国产业链本就向外转移的那部分之外，能够自食其力的，很少。到头来就是现在这么一个纳什均衡的状态，「任何单个参与者都无法通过仅改变自己的策略来获得更高的收益」，美国做不到，中国也做不到，大家继续按照比较优势的规律行动。再往下讲，就是制造业对于工程师的培养能力，中国——或者说整个东亚——历史上是没有工程师文化的，这边更讲究以师徒相授的关系为底座的工匠文化，如果你们还记得的话，「工匠精神」还在中文互联网火过一阵子，幸好后来没被带偏。工程师文化是舶来的，它也没有通过进入教育体系来从头塑造，完全基于繁荣的制造业和商业自下而上的开枝散叶，在这个语境里的工程师，也和老旧宣讲材料里的那些「张工」「李工」完全不一样了，是个人禀赋、致富回报、市场机会的叠加塑造。张雪就是凭借他的手艺去重庆的，手艺怎么来的，早年自己修车，修熟了去车队当机械师，最后真当成了车手，用一线实践来指导产品研发，就这么一件事干了十年，到了26岁创业的时候，就会发现资源开始自动的围过来。讲道理，如果把张雪这个名字抹掉，这个故事特别像我们从小看的日本或者美国传记文学，道奇兄弟不就是这么成功的吗，自小用废铁造自行车，逆向工程汽车轴承，从给福特供应零部件起家，翅膀硬了就做了自己的品牌。以及帕卡德、戴尔、博斯⋯⋯事实证明，拥有强大的制造业传统，就是能够孕育出工程师的梯队，因为再离谱的设想都能在可控的成本里验证试错，而不是变成一摞摞的达芬奇手稿。现在，我们要熟悉张雪这样的中国人名越来越多的出现在史册上了。张雪说他到重庆后，第一个去的就是一个类似华强北的地方，按照自己的需求，2万块钱就攒出了一台车，用这台车换到了启动资金，公司做大之后，他要自己来做发动机，把精度从5丝压到3丝，也是能找到供应商实现这个要求。苹果的CEO库克在电视采访里说过这么一段意思，苹果选择中国代工早就不是人力成本低这个原因了，在美国如果要开一个模具会议，能找来的工程师连一间办公室都坐不满，但在中国可以坐满好几个足球场。你可以说他来中国出差是在舔市场，但不能质疑他作为一个供应链大佬的身份被选为CEO的资质和判断。众所周知，制造业能为就业兜底，同时这种兜底，又能构建一套丰富的工程师梯队，从熟练技术工人，到中级技术专家，再到高级研发人才，更重要的是，这套体系有着充分的流动性，它和其他很多传统行业不一样，对生产资料的依赖很低。张雪的身份就经历了多次的无缝切换，当他在湖南修车的时候，是底层小工，当他在车企打工时，是技术专家，当他自己创业，就是在用高级研发的本事去组队，他自己都说了，「大家开始习惯了，跟张雪一起去把事情干出来。」最后，可能在很多人看来是微不足道的，但我觉得非常有意义的是，制造业的昌盛可以真的为所欲为，包括培养出一大批追随本心实现所谓「资产阶级趣味」的活人。赛车运动就是其中之一，还有国产跑鞋这些年在马拉松赛事里的渗透，以及Hi-Fi是怎么从发烧友市场变成挑战大牌的，甚至连俞浩都属于这个范畴，他是中国最早的四旋翼无人机开发者，因为对马达技术感兴趣，「转行」干了扫地机器人⋯⋯ 「资产阶级趣味」的本质，是从心，也是自由，自由这个事吧，需要松弛和风险，在紧张的社会里是一种奢侈，但在一个乐观向上的环境里，它又是一个必需品。某种意义上，张雪峰和张雪都代表了中国的多个棱面：张雪峰为普通家庭降低选择的容错，用肉身撑起那条拿文凭换未来的轨道，如实告知你们承担不起自由这玩意儿。而连高中都没上过的张雪又证明了，自由纵使不是免费的，但它却会为那些真正相信自己有才能的人打开大门，「我比别人努力十倍，成功凭什么不是我的？」可以结果参差不齐，唯要机会公正平等，健康的制度就是要实现这个原则。「有没有一种可能，张雪如果不是家庭条件那么差，父母没能力管他，现在也揣着某个二流大学的文凭在送外卖？」是有这个可能。但我觉得看过他的那些视频的人，都不会这么认为，眼里有光是装不出来的，也很难因为外力而自动熄灭。

1 00

tongnn

15天前

我们也是一样

芦思苇: 干了一件所有打工人离职的时候想干的事。离开之前“骂”老板😊 原帖发于美团内网“话题”社区，@了一下王兴，不知道能不能看到哈哈。为了避免被阳光职场，没有直接截图。

1 00

tongnn

1月前

钟镇杰-以人为本的软件PM: 看了一千多个skill，记录一些那些属于凝聚了人类深深的know-how的skill.md，装上这些，你的openclaw才刚开始有用！ Coding出生产级的美丽的web UI，涉及字体、色彩、主题、动画、空间布局、视觉细节等 https://skills.sh/anthropics/skills/frontend-design npx skills add https://github.com/anthropics/skills --skill frontend-design coding出标准的web前端页面的设计规范，无障碍、焦点、表格、动画、排行、图片、导航等 https://skills.sh/vercel-labs/agent-skills/web-design-guidelines https://raw.githubusercontent.com/vercel-labs/web-interface-guidelines/main/command.md npx skills add https://github.com/vercel-labs/agent-skills --skill web-design-guidelines 全面的网页和移动应用设计指南，包含以上二者提及的知识 https://skills.sh/nextlevelbuilder/ui-ux-pro-max-skill/ui-ux-pro-max npx skills add https://github.com/nextlevelbuilder/ui-ux-pro-max-skill --skill ui-ux-pro-max 像人一样操作浏览器，如填写表单提交外链，如页面点击发微博等，如前后端接口联调，如下载页面中的图片/视频，可以搭配Chrome Extension使用 https://skills.sh/vercel-labs/agent-browser/agent-browser npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser https://docs.openclaw.ai/tools/chrome-extension 创建skill的skill，用于总结你的工作流、你的业务认知，后续重复使用，比如你怎么写PRD，比如KA甲方要求的设计风格有哪些、应该怎么生图，最重要的是让AI能真正帮你干活 https://skills.sh/anthropics/skills/skill-creator npx skills add https://github.com/anthropics/skills --skill skill-creator Agent自行查找skill，这是Agent能力拓展的一种方法，找到人类总结好的经验知识，完成能力进化 https://skills.sh/vercel-labs/skills/find-skills SEO优化相关系统性地SEO知识，从构建页面开始完成SEO优化 https://skills.sh/coreyhaines31/marketingskills/ai-seo npx skills add https://github.com/coreyhaines31/marketingskills --skill ai-seo 大规模构建页面，程序化SEO https://skills.sh/coreyhaines31/marketingskills/programmatic-seo npx skills add https://github.com/coreyhaines31/marketingskills --skill programmatic-seo GEO页面优化 https://skills.sh/resciencelab/opc-skills/seo-geo npx skills add https://github.com/resciencelab/opc-skills --skill seo-geo 页面SEO 审查 https://skills.sh/coreyhaines31/marketingskills/seo-audit npx skills add https://github.com/coreyhaines31/marketingskills --skill seo-audit SaaS营销理念，简述了产品冷启到规模增长的通用方法 https://skills.sh/coreyhaines31/marketingskills/marketing-ideas npx skills add https://github.com/coreyhaines31/marketingskills --skill marketing-ideas 冷启产品发布策略 https://skills.sh/coreyhaines31/marketingskills/launch-strategy npx skills add https://github.com/coreyhaines31/marketingskills --skill launch-strategy 定价策略 https://skills.sh/coreyhaines31/marketingskills/pricing-strategy npx skills add https://github.com/coreyhaines31/marketingskills --skill pricing-strategy 营销内容策划 https://skills.sh/coreyhaines31/marketingskills/content-strategy npx skills add https://github.com/coreyhaines31/marketingskills --skill content-strategy 社媒运营的技巧和可执行的计划，包括LinkedIn、Twitter/X、Instagram、TikTok、Facebook https://skills.sh/coreyhaines31/marketingskills/social-content npx skills add https://github.com/coreyhaines31/marketingskills --skill social-content 推特的运营技巧和长期运营放手，让AI Agent来管理、发布、评论等，非常适合做一个创始人IP账号 https://skills.sh/jimliu/baoyu-skills/baoyu-post-to-x npx skills add https://github.com/jimliu/baoyu-skills --skill baoyu-post-to-x 付费广告 https://skills.sh/coreyhaines31/marketingskills/paid-ads npx skills add https://github.com/coreyhaines31/marketingskills --skill paid-ads 视频广告制作指南 https://skills.sh/inference-sh-8/skills/ai-marketing-videos npx skills add https://github.com/inference-sh-8/skills --skill ai-marketing-videos 市场规模分析方法 https://skills.sh/wshobson/agents/market-sizing-analysis npx skills add https://github.com/wshobson/agents --skill market-sizing-analysis 创业指标计算标准，ARR、CAC、LTV等 https://skills.sh/wshobson/agents/startup-metrics-framework npx skills add https://github.com/wshobson/agents --skill startup-metrics-framework 深度研究 https://skills.sh/199-biotechnologies/claude-deep-research-skill/deep-research npx skills add https://github.com/199-biotechnologies/claude-deep-research-skill --skill deep-research 专业沟通，发邮件、会议纪要、书面沟通等原则有效专业沟通提供了框架和指导 https://skills.sh/softaworks/agent-toolkit/professional-communication npx skills add https://github.com/softaworks/agent-toolkit --skill professional-communication 简历生成 https://skills.sh/composiohq/awesome-claude-skills/tailored-resume-generator npx skills add https://github.com/composiohq/awesome-claude-skills --skill tailored-resume-generator

0 00

tongnn

4月前

被治愈到

Kosan.: 有人提了个严肃问题——我们为什么要劝阻自杀的人，自杀的人就是错的吗？对错只是人设置的标准呀。我说：这个在佛法里面解释过。结论是救人一命，胜造七级浮屠。但我没想清楚到底怎推导。于是让GPT给我推导，它的逻辑完全让我信服我就觉得应该是这样。以下是截图。

0 00

tongnn

4月前

Aurorabing-打碎重组中: 用Nano Banana/豆包，简历照片或者用在领英等国外求职APP的照片可以这样处理，换一换背景、调调肩宽感觉高级多了。（非原创）提示词：整体风格参考 Sony A7111+85mmf/1.4的棚拍肖像，竖构图、浅景深：主体清晰，背景柔化虚化。采用柔和的三点布光，具有自然阴影，并在头发与肩部加入细微轮廓光。保留自然的皮肤质感、毛孔与细节，避免“磨皮”塑料感。眼睛中有明亮自然的 catchlight。最终呈现为高端、适用于Linkedln 的专业级棚拍头像。

0 00

tongnn

5月前

蹲

蜉蝣亦白: 我是个很喜欢去图书馆的人记得那天我依旧在看庄子的大宗师。刚读了开头前几句我感觉读了几句眼睛有点累，抬起头来突然见到一个审美非常戳我的美女。我感觉她非常有气质。心都颤了一下这长相气质完全长到我的心尖上。心里这个时候想，得快点拿到他微信，不然以后没机会了。我从袋子找出一张当时带了觉得最漂亮的纸。写下这些字背后附上微信然后赶紧把小纸条递过去。我内心很煎熬。不知道他会不会➕我，我想写就是心动的感觉非常非常地喜欢一个人，一眼就特别特别喜欢。有后续再更

0 00

tongnn

1年前

阑夕ོ: DeepSeek火出圈的这十几天，其实也是噪音最多的一段时间，说实话大部分的讨论成品都有种加班硬赶KPI的味道，是人是鬼都在掰扯，有留存价值的屈指可数，倒是有两期播客让我听后受益匪浅，非常推荐。一个是张小珺请来加州伯克利大学AI实验室博士潘家怡对DeepSeek论文的逐句讲解，接近3个小时的高密度输出，非常能杀脑细胞，但杀完之后分泌出来的内啡肽，也含量爆炸。另一个是Ben Thompson关于DeepSeek的3集播客合集，加起来1个多小时，这哥们是News Letter的开创者，也是全球最懂技术的分析师之一，常年旅居台北，对中国/亚洲的近距离洞察比美国同行要高很多。先说张小珺的那期，嘉宾潘家怡当时是在读完DeepSeek的论文之后，最快开发出了小规模复现R1-Zero模型的项目，在GitHub上已经接近1万Stars。这种薪火相传式的知识接力，其实是技术领域理想主义的投射，就像月之暗面的研究员Flood Sung也说，Kimi的推理模型k1.5最初就是基于OpenAI放出来的两个视频得到了启发，更早一点，当Google发布「Attention Is All You Need」之后，OpenAI立刻就意识到了Transformer的未来，智慧的流动性才是一切进步的先决条件。所以大家才对Anthropic创始人Dario Amodei那番「科学没有国界，但科学家有祖国」的封锁表态大为失望，他在否定竞争的同时，也在挑战基本常识。继续回到播客内容上，我还是试着划些重点出来给你们看，推荐有时间的还是听完原版： - OpenAI o1在惊艳登场的同时做了非常深厚的隐藏工作，不希望被其他厂商破解原理，但从局势上有点像是在给行业提了一个谜语，赌的是在座各位没那么快解出来，DeepSeek-R1是第一个找出答案的，而且找答案的过程相当漂亮； - 开源能够比闭源提供更多的确定性，这对人力的增长和成果的产出都是很有帮助的，R1相当于把整个技术路线都明示了出来，所以它在激发科研投入上的的贡献要胜过藏招的o1； - 尽管AI产业的烧钱规模越来越大，但事实上就是我们已经有接近2年时间没有获得下一代模型了，主流模型还在对齐GPT-4，这在一个主张「日新月异」的市场里是很罕见的，即便不去追究Scaling Laws有没有撞墙，OpenAI o1本身也是一次新的技术线尝试，用语言模型的方式让AI学会思考； - o1在基准测试里重新实现了智力水平的线形提升，这很牛逼，发的技术报告里没有披露太多细节，但关键的地方都讲到了，比如强化学习的价值，预训练和监督微调相当于是给模型提供正确答案用来模仿，久而久之模型就学会依葫芦画瓢了，但强化学习是让模型自己去完成任务，你只告诉它结果是对还是不对，如果对就多这么干，如果不对就少这么干； - OpenAI发现强化学习可以让模型产生接近人类思考的效果，也就是CoT（思维链），它会在解题步骤出错时回到上一步尝试想些新办法，这些都不是人类研究员教出来的，而是模型自己为了完成任务被逼，哦不，是涌现出来的能力，后来当DeepSeek-R1也复现出了类似的「顿悟时刻」，o1的核心堡垒也就被实锤攻破了； - 推理模型本质上是一个经济计算的产物，如果强行堆砌算力，可能到了GPT-6仍然可以硬怼出类似o1的效果，但那就不是大力出奇迹了，而是奇迹出奇迹，可以但没必要，模型能力可以理解为训练算力x推理算力，前者已经太贵了，后者还很便宜，但乘数效应是差不多相等的，所以现在行业都开始扎走搞性价比更优的推理路线； - 上个月末o3-mini的发布和DeepSeek-R1可能关系不大，但o3-mini的定价降到了o1-mini的1/3，肯定是受到了很大的影响，OpenAI内部认为ChatGPT的商业模式是有护城河的，但卖API没有，可替代性太强了，国内最近也有关于ChatBot是不是一门好生意的争议，甚至DeepSeek很明显都没有太想明白怎么承接这波泼天流量，做消费级市场和做前沿研究可能是有天然冲突的； - 在技术专家看来，DeepSeek-R1-Zero要比R1更加漂亮，因为人工干预的成分更低，纯粹是模型自己摸索出了在推理几千步里寻找到最优解的流程，对先验知识的依赖没那么高，但因为没有做对齐处理，R1-Zero基本上没法交付给用户使用，比如它会各种语言夹杂着输出，所以实际上DeepSeek在大众市场得到认同的R1，还是用了蒸馏、微调甚至预先植入思维链这些旧手段； - 这里涉及到一个能力和表现并不同步的问题，能力最好的模型未必是表现最好的，反之亦然，R1表现出色很大程度上还是因为人工使劲的方向到位，在训练语料上R1没有独占的，大家的语料库里都会包含古典诗词那些，不存在R1懂得更多，真正的原因可能在于数据标注这块，据说DeepSeek找了北大中文系的学生来做标注，这会显著提高文采表达的奖励函数，一般行业里不会太喜欢用文科生，包括梁文锋自己有时也会做标注的说法不只是说明他的热情，而是标注工程早就到了需要专业做题家去辅导AI的地步，OpenAI也是付100-200美金的时薪去请博士生为o1做标注； - 数据、算力、算法是大模型行业的三个飞轮，这一波的主要突破来自算法，DeepSeek-R1发现了一个误区，就是传统算法里对于价值函数的重视可能是陷阱，价值函数倾向于对推理过程的每一步去做判断，由此事无巨细的把模型向正确的道路上引导，比如模型在解答1+1等于几的时候，当它产生1+1=3的幻觉了，就开始惩罚它，有点像电击疗法，不许它犯错； - 这种算法理论上没毛病，但也非常完美主义，不是每道题目都是1+1这样简单的，尤其是在长思维链里动辄推理几千个Token序列的情况下，要对每一步都进行监督，投入产出比会变得非常低，所以DeepSeek做出了一个违背祖训的决定，不再用价值函数去满足研究时的强迫症，只对答案进行打分，让模型自己去解决怎么用正确的步骤得到答案，即便它存在1+1=3的解题思路，也不去过度纠正，它反而会在推理过程里意识到不对劲，发现这么算下去得不出正确答案，然后做出自我纠正； - 算法是DeepSeek之于整个行业的最大创新，包括要怎么分辨模型是在模仿还是推理，我记得o1出来后有很多人声称通过提示词让通用模型也能输出思维链，但那些模型都没有推理能力，实际上就是模仿，它还是按照常规模式给出了答案，但是因为要满足用户要求，又回过头基于答案给出思路，这就是模仿，是先射箭后画靶的无意义动作，而DeepSeek在对抗模型破解奖励方面也做了很多努力，主要就是针对模型变得鸡贼的问题，它逐渐猜到怎么思考会得到奖励，却没有真的理解为什么要这么思考； - 这几年来行业里一直在期待模型诞生涌现行为，以前会觉得知识量足够多了，模型就能自然演化出智慧，但o1之后发现推理好像才是最关键的那块跳板，DeepSeek就在论文里强调了R1-Zero有哪些行为是自主涌现而非人为命令的，像是当它意识到生成更多的Token才能思考得更加完善、并最终提高自己的性能时，它就开始主动的把思维链越变越长，这在人类世界是本能——长考当然比快棋更有策略——但让模型自个得出这样的经验，非常让人惊喜； - DeepSeek-R1的训练成本可能在10万-100万美金之间，比起V3的600万美金更少，加上开源之后DeepSeek还演示了用R1去蒸馏其他模型的结果，以及蒸馏之后还能继续强化学习，可以说开源社区对于DeepSeek的拥戴不是没有理由的，它把通往AGI的门票从奢侈品变成了快消品，让更多的人可以进来尝试了； - Kimi k1.5是和DeepSeek-R1同时发布的，但因为没有开源，加上国际上积累不足，所以虽然也贡献了类似的算法创新，影响力却相当有限，再就是Kimi因为受到2C业务的影响，会比较突出用短思维链实现接近长思维链的方法，所以它会奖励k1.5用更短的推理，这个初衷虽然是迎合用户——不想让人在提问后等太久——但好像有些事与愿违的回报，DeepSeek-R1的很多出圈素材都是思维链里的亮点被用户发现并传播，对于头一次接触推理模型的人来说，他们似乎并不介意模型的冗长效率； - 数据标注是全行业都在藏的一个点，但这也只是一项过渡方案，像是R1-Zero那种自学习的路线图才是理想，目前来看OpenAI的护城河还是很深，上个月它的Web流量达到了有史以来的最高值，DeepSeek的火爆客观上会为全行业拉新，但Meta会比较难受，LLaMa 3实际没有架构层的创新，也完全没有预料到DeepSeek对开源市场的冲击，Meta的人才储备非常强大，但组织架构没有把这些资源转化成技术成果。再说Ben Thompson的播客，他在很多地方交叉验证了潘家怡的判断，比如R1-Zero在RLHF里去掉了HF（人类反馈）的技术亮点，但更多的论述则是放在了地缘竞争和大厂往事，叙事的观赏性非常流畅： - 硅谷过度重视AI安全的动机之一在于可以借此把封闭行为合理化，早在GPT-2的协议里就以避免大语言模型被利用拿去生成「欺骗性、带偏见」的内容，但「欺骗性、带偏见」远未达到人类灭绝级别的风险，这本质上是文化战争的延续，而且基于一个「仓廪实而知礼节」的假设上，即美国的科技公司在技术上拥有绝对的优势，所以我们才有资格分心去讨论AI有没有种族歧视； - 就像OpenAI决定隐藏o1思维链时说得义正辞严——原始思维链可能存在没有对齐的现象，用户看到后可能会感觉到被冒犯，所以我们决定一刀切，就不给用户展示了——但DeepSeek-R1一举证伪了上面的迷之自信，是的，在AI行业，硅谷并没有那么稳固的领先地位，是的，暴露的思维链可以成为用户体验的一部分，让人看了之后更加信任模型的思考能力； - Reddit的前CEO认为把DeepSeek描述为斯普特尼克时刻——苏联先于美国发射第一颗人造卫星——是一个强行赋予的政治化解读，他更确定DeepSeek位于2004年的Google时刻，在那一年，Google在招股书里向全世界展示了分布式算法是如何把计算机网络连接在一起，并实现了价格和性能的最优解，这和当时所有的科技公司都不一样，它们只是购买越来越贵的主机，并甘愿身处成本曲线最昂贵的前端； - DeepSeek开源R1模型并透明的解释了它是怎么做到这一点的，这是一个巨大的善意，若是按照继续煽动地缘政治的路数，中国公司本来应该对自己的成果保密的，Google时刻也确实为Sun这样的专业服务器制造商划定了终点线，推动竞争移动到商品层； - OpenAI的研究员roon认为DeepSeek为了克服H800芯片所作出的降级优化——工程师用不了英伟达的CUDA，只能选择更低端的PTX——是错误的示范，因为这意味着他们浪费在这上面的时间无法弥补，而美国的工程师可以毫无顾虑的申请H100，削弱硬件无法带来真正的创新； - 如果2004年的Google听取了roon的建议，不去「浪费」宝贵的研究人员构建更经济性的数据中心，那么也许美国的互联网公司今天都在租用阿里巴巴的云服务器，在财富涌入的这二十年里，硅谷已经失去了优化基础设施的原动力，大厂小厂也都习惯了资本密集型的生产模式，乐于提交预算表格去换取投资，甚至把英伟达的芯片干成了抵押物，至于如何在有限的资源里尽可能多的交付价值，没人在乎； - AI公司当然会支持杰文斯悖论，也就是更便宜的计算创造更大量的使用，但过去几年里的实际行为却是出心口不一的，因为每家公司都在表现出研究大于成本的偏好，直到DeepSeek把杰文斯悖论真正带到了大家的眼皮底下； - 英伟达的公司变得更有价值，和英伟达的股价变得更有风险，这是可以同时存在时发展，如果DeepSeek能在高度受限的芯片上达到如此成就，那么想象一下，如果当他们获得全功率的算力资源后，技术进步会有多大，这对整个行业都是激励性的启示，但英伟达的股价建立在它是唯一供给方这个假设上，这可能会被证伪； - 中国和美国的科技公司在AI商品的价值判断上出现了显性分歧，中国这边认为差异化在于实现更优越的成本结构，这和它在其他产业的成果是一脉相承的，美国这边相信差异化来自产品本身以及基于这种差异化创造的更高利润率，但美国需要反思通过否定创新——比如限制中国公司取得AI研究所需的芯片——来赢得竞争的心态； - Claude在旧金山的口碑再怎么好，也很难改变它在销售API这种模式上的天然弱点，那就是太容易被替换掉了，而ChatGPT让OpenAI作为一家消费科技公司拥有更大的抗风险能力，不过从长远来看，DeepSeek会让卖AI的和用AI的都有受益，我们应该感谢这份丰厚的礼物。嗯，差不多就是这些，张小珺的播客在小宇宙上可以搜到，Ben Thompson的播客是订阅制的，15美金/月，希望这篇作业可以帮你们更好的理解DeepSeek出圈之后对AI行业产生的真实意义。

1 00

tongnn

1年前

比特-AI编程做产品: 清华大学deep seek的教程都搞全了

0 00

tongnn

1年前

有没有什么靠谱的流量卡推荐家人们🥹🥹🥹
给老妈用的

2 20