最近一个月频繁在更新公众号、小红书和小宇宙,但反思了一下自己可能也做不到那些 AI 自媒体那样:比如 Gemini3 我就实在找不到什么想写的角度...除了标题党、千篇一律的代码测评、翻译一下官方文档里的内容以外,确实也很少看到有趣的内容。今天跟 Gemini3 发生的几个交集是:
1.在自家产品 demo 里尝试从 2.5 换成 3 不太成功——不是 3 的问题,是我们做的“壳”太脆了,反而也证明了 3 的 agentic 能力确实比 2.5 强。
2.我自己试了几个常用的 case,因为都比较简单所以没有感觉到跟 2.5 的明显差异。
3.看到纯银测试 Gemini 3 感到惊艳的例子:让它看两张产品截图分析产品改版目的,能达到开发者本人和产品专家的理解水平(GPT 只能说囫囵话)——这个例子本身挺好的,但其实还是一个测试心理比较重而不是实际应用的例子。
4.看犬校有同学用 3 测代码场景,3 写了条命令把他本地文件都删光了(windows 电脑)🙂
5.最近没什么原型和代码场景,自己有点懒得测。
没什么结论,总之铺天盖地的消息可能能进一步激发大众对 AI 产品的试用兴趣,这本身是个好事。但对于从业者来说,可能是反过来需要一点平常心。现在的模型能力真的已经能做很多事了,但哪一把才是自己的🔑呢?