Nothing_8的个人主页

即刻App年轻人的同好社区

下载

App内打开

Nothing_8

83关注259被关注1夸夸

Nothing_8

2天前

大香蕉降智的原因找到了，原来算力都堆在这了

labs.google

2 00

Nothing_8

3天前

我近期：
去了三个单位调了七台机器
完成了大师兄，二师兄，三师兄的阶段性课题，等反馈
完成了毕业论文第一章的阶段性课题，等反馈
一个横向的阶段性交差

我真有点无敌了

6 00

Nothing_8

13天前

很喜欢gpt5.2这种一口气清理完的通畅感

5 00

Nothing_8

14天前

目前AI确实有“awesome”时刻，但是其也有着非常明显的能力上限

目前主流的模型就是御三家：opus、gpt-5.2、gemini-3

opus的优势是通人性，弊端是上下文达到一定体量时犯糊涂，忘事。
gpt-5.2的优势是自动压缩不会破坏上下文表达出来的语义信息，弊端是需要有明晰的任务要求或者是非常明晰的任务文档。
gemini-3的优势是较为明显的审美优势，劣势是pro少到可怜的50k有效上下文，flash的话能力没有较高的统治地位表现。

目前AI Coding适合做的东西：
1. 语料足的东西：文字内容
2. 上下文长度友好的任务：opus处理文字没问题，你要是让opus读2张4k图，你看他脑子还正不正常
3. 有特别明晰的任务指引的东西：几乎手把手教，且要保证无歧义
4. 能凑活的东西，能动就是100分
5. 纯文字辅助工作

AI Coding目前很难搞的东西：
1. 审美：目前opus和gpt-5.2的识图是达到了“看图识字会写作文”和“照猫画虎”的情况，你要让他创造艺术基本不可能。gemini-3生态的nano banana的话确实是让模型在审美上有了飞跃，但他目前的评价是"趋近人类期望"而不是替代。
就像你在路边看到的照相馆宣传图，一看哎呦挺好看，你进去拍完拉垮的不行。一问店长，店长说不是有差距，而是"你描述的不好"。我觉得相比"佳能XX，倾斜角度，蓝天白云，开心，白色背景，伟大的作品"的提示词反思，直接给店长一拳应该是最正确且高效率的做法。

2. 创新的东西：如果你让AI CLI去从0开始都给你做完了，那只有两个原因，第一个是你这个太简单，第二个是你这个别人做烂了。
为啥商城从0到1可以出，因为太简单因为做烂了，淘淘商城都可以写到近代开发JAVA编年史当作石碑纪念了；
为什么现在从0开始做游戏不是小车WASD就是贪吃蛇，因为太简单因为做烂了，做简历demo的人手一个贪吃蛇，r3f应用demo遍地开花；
如果你把你思想甩到破圈的交流论坛，如果有人能从被窝里爬起来，给你表演1h被窝黑客松的话，那可能确实是比较危险了，但如果没有的话就说明你思想没问题，放轻松。
3. 较为复杂，且想一口成：刚才说了opus有上下文长了就呆傻的症状，gpt-5.2有专注到斗鸡眼的症状。
想一想吧朋友们，如果你说现在有个外包，做个石头剪刀布可能没问题。你要是让他做魔兽世界？那可有意思了。
opus："哦对了第三章了我记得吉安娜的妹妹应该是安度因"。
gpt-5.2：“哦你说移动系统啊，做完了，什么？移动到石头里面不是很正常吗”
opus的话你就得每次都得走一步重新/new，走一步提醒一下
gpt-5.2的话你就得每次都得说"不对不对，移动不是这样的，移动不能穿墙的"

如果真想做的话：
1. 拆分小小模块，制作一小部分，尽可能保持背景信息独立（我就让她说人物A和人物B的交互）
2. 看看vibe在任务对应领域能力是否ok：如果是SDK不懂就让他去读文档（context7 MCP）如果是某标准规范他不懂就让他调用浏览器去读网页（Chrome devtools MCP）
3. 做好备份：特别是opus，一招毁坏一座城的概率还是很大的。
4. 管理好上下文：如果是opus，前半部分上下文阈值可以干高要求工作，后面最好少干重活，勤保存状态/new，不要用自带的自动压缩，很垃圾，让他总结过程文档，/new后再读取继续干。
5. 有详细的规划，如果不详细可以和cc交流，让他调用askUserQuestion给你提供旮旯game选项（不是），或者是直接和他交流，如果你担心歪，就说'请说出你的理解'，交流没问题如果上下文满了总结交流文档开新会话执行，如果没满直接开干。
6. 慎用他人方案，要测试其是否真正适合自己，openspec+bmad一甩，我觉人应该比AI先犯迷糊。

AI Coding的火我认为不是其能给你创新，而是给你提供一个'智能补全'，它能基于经验给你提供目前市面上可能的解决方案或实现，但是实现毕竟是实现，它不是一个“精品”，"精品"还是要依靠人的。
就这么说，AI能完全实现《忍者明》的方式只有一个："偷走全部源码"+“学会工具使用方式”+“借助Engram问的时候直接逐字逐句摘抄”。
你说让他一口气实现你的思路+你的交互+调试工具+个人智慧+美术绘制。怎么可能呢。他目前能干一个环节就很不错了。
AI Coding就是"码二代"，吃满了家里老资历的代码经验，确实有东西，但是你说让他去替代目前前沿技术创新和思想创新的人，那我觉得还是太不尊重了。

全即刻能vibe出XX系统的人漫山遍野，但是全即可能做出《忍者明》的只有一位（应该没团队的吧？我母鸡啊，如果有的话再加几位）。

还有目前我觉得skill目前替代可行性最高的人群，并不是码农、开发者，而是以“再不学你就out”这种AI泔水自媒体。
目前已经开发出可以实现类似方法的工作流了，但是公司原因暂不方便公开，这些b自媒体再散播焦虑+卖课，正经东西都不发的人你们等着吧，再让我杰克老师@杰克有茶焦虑我就把你们都取缔了！（遇敌时投降）

---
【插一句】为啥现在skill混成了command的样子，就是因为他无法做到像人类真正好好运用自己的"skill"，还是得靠自己触发。Claude.md是可以从身份上去进行灵活运用，但是能用几个？Claude.md能不能覆盖到？这就很难了，现在skill火我个人觉得就是command生不逢时，之前command太好用也没人提，A社提出skill概念但是自己模型玩不转又回撤到command地位。

10 61

Nothing_8

16天前

每次出差感觉都是：
路上想睡睡不着，开会提神提不了。

1 00

Nothing_8

18天前

如果想做Agent生态开发的朋友，别碰ACP，真的是答辩中的答辩。
你要去兼容它的协议，还要去兼容它不支持的功能，还要去兼容它支持但不稳定的功能。

你想要更新slash，你不仅要单独处理acp的系统配置slash，还要处理acp的feature slash，还要处理acp没有兼容的cli slash。

issue问就是不在最高优先级，问就是等等，我真的是给你一个大摆锤！
为什么我2026年了又陷入“科技公司一定可以完善美好生态，要让大家体会科技改变生活”这种老套陷阱啊！

不折磨自己了，今天写重构文档，明天就全部交给cx大哥哥了

3 30

Nothing_8

21天前

每次为朋友解答时感觉都有点复读机，所以记录一下，每天写一点，后面就直接转发了。
（AI只负责错误检查+图片生成，文字全手打）
----------------------

我对主流Coding模型的观感-GPT与CodeX

GPT就像你身边那种闷头干活的大神。你说系统上有个问题，GPT能马上开始"正襟危坐"，"一根烟一杯酒，一段代码看一天"，闷着头给你干。但是你找他聊一下对项目的规划与展望，他就有点“对不上频道”了，在身份预设中更强调"技术人员"。

所以在需求明确的问题下交给GPT更好一点，但是在项目的规划与交流上比较弱。

目前我推荐的模型主要为5.2、5.2-codex：
- 5.2：均衡，在世界问题（通用场景下的问题）性能OK，且有明显的科研伦理味道，缺点是运行速度比较慢。
- 5.2-codex：相比5.2"机器味"更浓，运行速度更快，但是有点交差完事的感觉，"多给你干一点都是我的过错"。

思考等级部分我倾向要么xhigh要么medium，xhigh倾向完美解决问题，medium倾向小任务或轻量Agent。

我是全程保持gpt-5.2 xhigh，这里说一下我为什么全程保持xhigh，因为目前的资料表述，思考等级中xhigh表现最好但相比high提升较小。那如果我去追求质量的话我会选择最好表现的思考等级，而资料提到的"微乎其微"的性能提升其实只是数据集的纸面数据，而无法完全覆盖到所有场景中。我可以为更好的质量付出额外的时间成本，但我不愿意用节省的时间成本去换不可预估的性能损失。

目前使用GPT模型的AI Coding工具主要为OPENAI官方工具CodeX
CodeX + GPT 5.2的优劣非常明显：
1. 劣势：速度非常慢，5.2 xhigh跑一次做好10min起步，日常1h的心理准备。
2. 劣势：几乎"全程黑盒"，CodeX的显示只有正在工作和工作完成回复。
3. 优势：无敌的"上下文压缩"，压缩上下文后不丢失主线任务，所以交给他长任务比较放心。

我常用的场景如下：
1. 需求明确，且强技术性的任务
2. 需要长时间工作的任务
3. 需要长上下文的任务（比如浏览器自动化调试）

3 00

Nothing_8

1月前

docker目前官方脚本暂时无法安装，软件源指定的container.io版本为2.2.1，官方最新版本为2.2.0

吃我一拳.jpg

4 00

Nothing_8

1月前

再也不参加即友的活动了，有一种粉丝见Vtuber，Vtuber还要假装营业的样子。
还我的真诚啊魂淡！

4 20

Nothing_8

2月前

这家之前在即刻长期宣传过，用的朋友小心一点

知名扩展程序WeTab和Infinity V+等被发现恶意劫持用户收集用户方方面面的私密信息

1 00

知名扩展程序WeTab和Infinity V+等被发现恶意劫持用户 收集用户方方面面的私密信息

知名扩展程序WeTab和Infinity V+等被发现恶意劫持用户收集用户方方面面的私密信息