即刻App年轻人的同好社区
下载
App内打开
李轻执
202关注26被关注1夸夸
AI Coding
李轻执
3天前
当你的产品需要用户填入 API-KEY 的时候,你已经主动放弃了大众市场。

转推:DinoDeer
00
李轻执
14天前
20251203: anthropic blog: 人工智能如何改变 Anthropic 的工作

Survey data(调查数据)

最常用场景:调试代码与理解代码库
Claude使用率达60%,生产力提升50%(较去年翻倍)
27%的AI辅助工作此前无法完成(如项目扩容、探索性工作)
仅0-20%工作可完全委托,需主动监督验证

Qualitative interviews(定性访谈)

形成AI委托直觉,明确可委托任务类型
技能范围拓宽,部分深层技能面临退化
对编码工艺的态度分化(侧重结果vs怀念手动编码)
职场社交动态改变,同事协作与 mentorship 减少
职业向AI系统管理转型,长期职业轨迹存疑

Claude Code usage trends(Claude Code使用趋势)

自主处理更复杂任务,人工干预频次降低
8.6%任务为“小问题修复”,累计提升效率
全员向“全栈”发展,各团队用AI补充核心专业知识

How AI Is Transforming Work at Anthropic

01
李轻执
1月前
20251113 融资:Cursor在D轮融资中筹集了23亿美元。该公司投后估值达到293亿美元。这一估值几乎是一月份估值的 12 倍。

来源:华尔街日报

https://www.wsj.com/tech/ai/the-ai-coding-startup-favored-by-tech-ceos-is-now-worth-29-3-billion-14c72c02

00
李轻执
1月前
20251112:OpenAI发布GPT - 5.1(含Instant和Thinking版本),优先向付费用户推送。该版本优化了智能、对话感及指令遵循与推理效率,新增6种预设语气并试点风格细化调节功能;本周内同步上线API,其Auto功能可自动匹配模型。此外,付费用户可保留GPT - 5三个月,此次更新聚焦模型能力提升与个性化适配。

GPT-5.1: A smarter, more conversational ChatGPT

00
李轻执
2月前
AI是best when your own natural talents are in the lead(当你的天赋在主导时,AI才能发挥最大作用)。
工具始终是工具,你的专业判断和创造力才是核心。

西里森森: Perplexity官方发布的内部AI工作指南 今天读到Perplexity官方发布的一本内部工作指南,分享了Perplexity内部团队如何借助AI提效。 作为一家AI原生公司的内部实践分享,这份材料值得仔细研读一下,比市面上很多泛泛而谈的AI应用文章要实用很多。 我简单总结几条我从中学到的一些核心方法论👇 Perplexity在指南里把AI的作用分成了三个递进的层次: 1️⃣ 第一层是用AI来屏蔽干扰。 大部分人想到的都是用AI来创造内容或者做分析,但其实工作最大的问题就是注意力被不断打断,邮件、会议、各种琐碎事务占据了工作中的大量时间。 所以,Perplexity团队的做法是先用AI把这些消耗注意力的事情处理掉,给自己腾出整块的专注时间。 2️⃣ 第二层是用AI来扩展个人能力。 当你有了专注的时间后,AI可以帮你做很多原本需要团队协作才能完成的事情,比如做深度研究、整理大量信息、制作各种材料。 这些工作如果靠人力可能需要好几个人配合,但有了AI工具,一个人也能达到类似的产出规模。 3️⃣ 第三层才是用AI来产出具体结果。 这里的结果不是指简单的文档或者报告,而是那些能真正推动业务进展的东西,比如达成交易、制定策略、驱动收入增长。 前两层都是在为这一层做准备。 所以,使用AI不只是简单的工具使用问题,而是要重新设计整个工作流程。 当然,我最关心的还是具体怎么操作。 基于Perplexity官方指南整理的场景和提示词模板,我整理出来了几个可以用他们推出的AI浏览器comet高频场景的工作流: 📍工作流 1:智能邮件管理流程 使用场景:每天邮件太多,回复占用大量时间,容易遗漏重要邮件,需要系统化处理。 第一步:批量筛选待处理邮件 找出过去3天所有未回复且需要我回应的邮件,并按紧急程度分类 第二步:起草回复内容 针对以下邮件起草简短、专业的回复: [粘贴邮件内容] 要求: - 保持礼貌但简洁 - 直接回答对方的核心问题 - 如需后续行动,明确说明下一步 第三步:识别需要深入处理的邮件 分析我的收件箱,找出那些涉及重要决策、需要详细研究或协调多方的邮件。 为每封邮件提供: 1. 核心议题 2. 需要的准备工作 3. 建议的处理优先级 📍工作流 2:竞品分析研究 使用场景:需要快速了解竞品动态,对比产品功能和定价策略,为决策提供依据。 第一步:收集竞品基础信息 研究 [竞品公司名称],包括: - 最近的融资情况和财务表现 - 核心产品功能和定价策略 - 目标客户群体 - 近期的战略举措(新产品、市场扩张等) - 客户评价和市场反馈 第二步:多维度对比分析(如果有多个竞品网页打开) 对比 @标签1、@标签2 和 @标签3 的产品信息,创建一个对比表格: 列出以下维度: - 核心功能对比 - 定价模式和价格区间 - 目标客户群 - 主要优势 - 明显短板 - 市场定位 最后总结:我们相比这些竞品的差异化优势在哪里 第三步:寻找突破机会 基于以上竞品分析,识别: 1. 市场上尚未被满足的客户需求 2. 竞品的共同弱点 3. 我们可以切入的差异化角度 4. 3个具体的产品或市场策略建议 📍工作流 3:销售线索开发全流程 📝使用场景:需要开发新客户,从寻找潜在客户到个性化接触的完整流程。 第一步:批量寻找目标客户 找出25家符合以下条件的公司: - 行业:[目标行业,如B2B SaaS] - 规模:[如刚完成A轮融资] - 信号:最近在招聘销售人员 为每家公司提供: - 公司名称 - 融资金额和时间 - 主要产品/服务 - 决策人联系方式 第二步:深度研究目标客户(选择优先级最高的几家) 详细研究 [目标公司名称]: 1. 业务模式和主要收入来源 2. 当前面临的主要挑战(从招聘信息、新闻、社交媒体分析) 3. 决策团队背景(CEO、销售VP等关键角色) 4. 他们可能需要我们产品/服务的原因 5. 最佳的接触时机和切入点 第三步:生成个性化开发信 为 [目标公司] 的 [决策人姓名/职位] 撰写一封开发邮件: 要求: - 第一段:提及他们公司最近的具体动态(如融资、产品发布、招聘) - 第二段:点出他们当前阶段可能面临的挑战 - 第三段:简要说明我们如何帮助类似公司解决这类问题(附一个相关案例) - 第四段:提出一个低压力的行动号召(如15分钟电话交流) 语气要专业但不过于正式,控制在150字以内 第四步:准备跟进材料 如果 [目标公司] 表示有兴趣,准备一份定制化的方案文档: 包含: - 针对他们具体挑战的问题分析 - 我们的解决方案(针对性说明如何解决他们的问题) - 实施计划和时间线 - 预期成果和衡量指标 - 类似客户的成功案例 - 定价方案(如适用) 现在很多人用AI还是搜索引擎的思维,输入几个关键词就期待得到答案。 但AI更像你的助手,你需要跟它对话,告诉它你的目标是什么,你想要什么样的输出,甚至可以说说你的工作背景,这样AI才能给出更贴合你需求的结果。 ✍️示例: 不要问:"怎么提高销售业绩?" 要问:"我们是一家做B2B SaaS的公司,目前主要客户是中小企业,想要开拓大客户市场,帮我分析一下需要注意哪些方面,以及制定一个行动计划。" 只有提供具体的业务背景,AI才知道从哪个角度给建议。 其次,AI最大的价值不是帮你做一件事,而是帮你把一连串相关的事情串起来完成,指南里很多例子都是这样设计的。 比如做市场调研,可以拆解成这样的流程: "第一步,研究某某公司最近的财务表现、战略动向、领导层变化;第二步,分析他们面临的竞争挑战和运营重点;第三步,找出我们可能帮到他们的地方和关键决策人的联系方式。" 这种多步骤的提示,其实就是把你的思考过程说给AI听,它会按照这个逻辑一步步推进,最后给你一个完整的输出。 指南里还提到Perplexity有个功能叫Spaces,就是把某个主题相关的所有研究、笔记、资料都整理在一起。 我们平时用AI做的很多工作,其实是有延续性的。 比如你在研究某个行业,今天查了一些资料,明天又有新的问题,如果每次都是从零开始跟AI对话,它就不知道你之前已经了解了什么。 但如果你把相关内容都归集到一个地方,AI就能基于这些上下文给出更精准的回答。 Perplexity这份内部工作指南之所以有价值,在于它展示了一种系统性的思考方式:如何用AI重新设计工作流程,如何把琐碎的任务交给AI处理从而专注于更有价值的工作,如何通过更好的提示获得更好的输出。 就像指南里说的,AI是best when your own natural talents are in the lead(当你的天赋在主导时,AI才能发挥最大作用)。 工具始终是工具,你的专业判断和创造力才是核心。

00
李轻执
2月前
20251023: openai 推出 company knowledge 公司知识:agent形态多轮搜索的企业内知识库

* 只给 Business、Enterprise、Edu 版开放
* 用了 特调的 GPT-5,专精于多源检索
* 答案会标注来源,可以点开看原文
* 有公司级别的权限,你看不到的别人也看不到

来源:

* openai.com
* mp.weixin.qq.com
02
李轻执
3月前
gpt-5补充:gpt-5-codex🤣

阑夕ོ: IDC有个报告是我从去年就开始注意的:中国大模型公有云服务市场分析,这是对国内AI产业「商品化」最客观也是最真实的数据反馈。它直接反映了大模型的应用规模,而不是把IaaS、PaaS打包一起统计,可以说是Tokens经济最核心的指标。 比如去年中国整个公有云的Tokens调用量几乎是从无到有的飙升到了114.2万亿次,已经呈现出了爆发趋势,前天IDC又更新了今年上半年的报告,Tokens的调用总量达到536.7万亿次,半年的时间干了去年全年接近5倍的活儿。 这张环比数据表(图1)的信息量很大,可以看到2个异军突起的增长拐点,分别在2024年7月和2025年2月,这两个时间发生了什么事? 2024年7月,豆包掀起大模型降价风潮的影响出现,因为把旗舰模型的计费标准从「几分钱」降低到「几厘钱」,几乎是以一己之力凭空创造出了大模型公有云这个市场; 2025年2月,DeepSeek-R1全球爆火,不但打响了大模型领域的成本革命,也把AI云的负载压力从预训练切换到了推理,从此开源模型百花齐放,进一步促进了模型商品化的渗透率。 整个连锁反应的结果,就是MaaS(模型即服务)这种商业模式的拔地而起,以及最早布局MaaS的火山引擎,现在拿到了49.2%的市场份额,相当于全行业的半壁江山。注意,这个统计并不包括豆包、抖音等字节内部产品,完全是外部企业客户的调用量。 当然,MaaS只是AI云的赛道之一,基于统计口径的不同,阿里云、百度云也都能在IaaS、PaaS等赛道拿到另外的第一名,但就含金量而言,MaaS是最能证明大模型行业发展情况的晴雨表。 因为MaaS的调用量大,也够直接,模型好不好用、该怎么改的评测集,都是只有通过调用才能得到的信息,卖GPU是拿不到这类数据的,所以火山引擎从一开始就是把MaaS作为AI云的核心目标,这对兄弟部门的豆包也有帮助: 「大的使用量,才能打磨出好模型,并且大幅降低模型推理的单位成本。」 MaaS是一个边缘创新的典型产物,因为营收和利润的起点都很低,传统云厂商都不太看得上,还是卖算力最赚钱,像是甲骨文这种千亿美金级别的锁单带动股价飙涨,才是聚光灯下的主流叙事。 但是对于开发者来说,原生化的AI云才是刚需,去买算力部署模型,门槛天然就高,比如我们都知道,DeepSeek已经是大模型里的价格屠夫了,但要训练一套完整的DeepSeek MoE模型,至少需要320张GPU,这就不是普通开发者能说上就上的。 所以MaaS这种群众路线的服务才越来越受欢迎,它相当于一家模型商店,把市面上的模型都封装到了云上,开发者不必关心技术细节,只需按量付费,直接调用模型的核心能力——文本生成、图像识别、语音转换等——为己所用。 有个对MaaS模式的体验形容特别恰当:拎包入住,丰俭由人。 Quest Mobile在2025中国移动互联网半年大报告里也提到过一个点,在国内的AI应用侧,插件产品的规模要明显高于原生产品(图2),什么意思呢,就是大家期待的杀手级App,可能并没有那么快出现,与此同时,AI又已经变得无处不在了,以新功能的形式。 在这个渗透过程里,MaaS市场就是最大的幕后功臣,一个社交产品的开发者,如果想要新增一个AI头像的绘制功能,完全可以不用重复造轮子,专门训练一个图片模型出来,而是可以像去超市购物那样,在MaaS市场里挑一个价格和性能最适合的,然后用接口的方式加到自己的产品里,即开即用。 美国BI平台Databricks的负责人今年也说过来自业务侧的反馈:「大多数企业并不想成为AI专家,他们只是需要开箱化的AI解决方案,而且微调和管理开源模型的复杂性对他们而言依然是一个难以跨越的门槛。」 所以像是OpenAI和Anthropic在面对免费平替的开源模型时还是非常能打,而拥有企业级服务经验的Salesforce和Oracle也在老树新芽般的高速增长,模型的原始智能水平固然重要,但更值钱的地方在于它驱动产品的质量和可用性。 某种意义上,MaaS才是真正的大模型竞技场,像是火山引擎之所以占有率独一档,就是因为它能汇聚市面上最新、最领先的模型,还是用超市的比喻来理解,就是供应链的竞争力制胜,比如Google的新图片模型nano-banana刷屏之后,唯一能跟上硬刚的,就是字节的Seedream 4.0,刚刚登顶LMArena,而在火山引擎,这些顶级模型都在摆货架上「予取予求」。 而且即便有微调和训推需求,火山引擎的Infra效率也是行业领先的,像是DeepSeek-V3.1这种开源模型在火山引擎上的表现指标也非常漂亮,这些都会最终体现到开发者的体验端,形成用量越多、进步越快的正循环。 前几天看到有条推文,说OpenAI曾经明确表示GPT-4o、o1、o3、o3-mini这样说命名对用户来说太不友好了,要用GPT-5来做统一和简化,现在来看,这话OpenAI只做到了一半,确实只有GPT-5一个模型了,然而我们看到迎面走来的方阵分别是:GPT-5、GPT-5 auto、GPT-5 thinking、GPT-5 pro、GPT-5-mini、GPT-5-nano⋯⋯ 滑稽.jpg 本质上,模型商品化的主要瓶颈,还是Tokens不够用,于是不得不人为设置各种档位,在让大模型变成自来水那样按需取用的生活资源这件事情上,MaaS平台的用武之地和长期价值,一定会与日俱增。 你们也可以参与预测一下,半年后IDC公布2025年全年中国大模型公有云的Tokens调用量时,会出现一个什么量级的数字?

00
李轻执
3月前
李轻执
3月前
《重构:改善既有的代码设计》作者发布了一篇文章:Some thoughts on LLMs and Software Development

What I suggest, is that people experiment with them. At the least, read about what others are doing, but pay attention to the details of their workflows. Preferably experiment yourself, and do share your experiences.

I’m also asked: “is AI a bubble”? To which my answer is “OF COURSE IT’S A BUBBLE”. All major technological advances have come with economic bubbles, from canals and railroads to the internet. We know with near 100% certainty that this bubble will pop, causing lots of investments to fizzle to nothing. However what we don’t know is when it will pop, and thus how big the bubble will have grown, generating some real value in the process, before that happens. It could pop next month, or not for a couple of years.

We also know that when the bubble pops, many firms will go bust, but not all. When the dot-com bubble burst, it killed pets.com, it killed Webvan… but it did not kill Amazon.

Some thoughts on LLMs and Software Development

00
李轻执
3月前
本周趋势:在编码分类中,Grok Code目前在OpenRouter上的使用量已超过其他所有模型的总和

openrouter.ai

x.com
00