即刻App年轻人的同好社区
下载
App内打开
行小招
95关注240被关注0夸夸
探索AI在企业的落地应用场景
记录关于大模型的一切闪念、想法、洞察
Nasdaq上市公司|增长技术负责人
前阿里/同程艺龙
置顶
行小招
2月前
prompt 的撰写技巧只是“术”的层面,不能说不重要,但是更底层的东西“道”,“道”是你的认知层级,思维方式,和看穿本质的能力。“问的问题”本身是最重要的,你问出什么问题,远比你怎么问更致命。因为提问本身就暴露了你思考的天花。

相当于武功里面的,招式 vs 内功,张无忌学的太极拳为啥招式都忘记了,打出来,还那么厉害?

举个例子:
1. “帮我写一篇中国咖啡外卖市场的调研报告。”
2.“我想写一篇关于中国咖啡外卖市场的调研报告。请帮我分析一下市场规模、主要玩家(瑞幸、星巴克、Manner)的商业模式和优劣势,并预测一下未来的发展趋势。”
3. 见图
00
行小招
3天前
GPT-5.3-Codex 的确是一个非常棒的模型,供不应求啊。所以 OpenAI 又开启了它的大招——降智。

它会毫不声色地把用户(虽然表面上用的是 GPT-5.3-Codex)其实返回的是 GPT-5.2。你来看一看你是不是中招了,用这个命令就可以看。

RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
00
行小招
4天前
@云舒的AI实践笔记 受云舒启发,我自己也统计了下自己的 token 消耗情况,我倒没有什么自动化的任务跑,主要都是自己拿着 Agent 写代码练习,或者做日常任务用的。

最近 30 天统计,两台电脑加起来一共消耗了12亿 token多点,工作场景明显还是多很多,

看样子还是想点自动化的任务啊,要不然 claude 和 codex 的订阅白白浪费了,根本用不完🤔
20
行小招
4天前
像语音输入法这种工具,最重要的是稳定,因为它们都是联网的。

最近 Typeless 比较火爆,我觉得服务器的压力应该比较大,导致服务非常不稳定。我试过之后发现不是我个人网络的问题,因为我用豆包输入法和微信输入法就非常好,但 Typeless 感觉就比较慢,所以我怀疑是他们服务器的问题。

对于这种属于“根基”类的工具产品,好坏的标准首先就是稳定。如果不稳定,其实体验就会差很多,即便功能再好使也没用。
00
行小招
4天前
如果追求完成任务的话,不要用 ChatGPT 客户端,而应该去用 CodeX 这个客户端。

这个 CodeX App Claude App Mac 电脑上,其实能力上正在追赶,目前大约是 OK 的。在 CodeX 里面:
1. 如果写代码,还是用 GPT 5.3 CodeX 这个模型
2. 如果是做通用的日常工作,就用 GPT 5.2 这个模型

这约等于是对 Claude 整个 App 里面(比如 CoWork 等功能)的追赶。虽然它目前还替代不了 Claude,因为功能不如 CoWork 那么丰富,但至少 CodeX App 已经能够完整操作你的本地文件了,这个能力已经到位。

而且它在做一些通用化的 skills 也是有的,同时也推荐了很多 MCP。所以对于日常办公的一些常用操作,比如处理 PDF、Excel 这种东西,其实也还是不错的,挺 OK 的。
00
行小招
6天前
ChatGPT Claude 两款产品的目标场景是完全不一样的:ChatGPT 更偏向于陪伴,带来情绪价值;而 Claude 更偏向于做事,具体解决实际问题。

所以你能看到,整个 Claude 目前在实际工作中的各项任务中非常能打,包括:
1. 办公任务
2. Coding 任务
3. 数据分析任务

在这些领域,Claude 现在是一骑绝尘,非常强悍。OpenAI 也认识到了这一点,发布的 codex 应用(至少在编程领域)随着 gpt-5.3-codex 模型的发布,编程能力确实强悍,确实起来了。

但是 OpenAI 想要全面追上或者赶超,还有很大的距离要走,能不能赶上还是个问题。因为在竞争的商业模式下,两者同时在跑,谁跑得快,或者谁有更好的行业知识和战略定位,这都不好说。

反正就我个人而言,3 个月前我还是 ChatGPT 200 美金的付费深度用户。现在已经变成了 200 美金的 Claude 会员。OpenAI 变成了 20 刀,这个差距确实很大。
00
行小招
6天前
语音输入法的定位是不一样的。像微信输入法这种虽然很强,但它毕竟只是输入法。输入法就意味着,你说的任何带语气的字,它都会通过 ASR 原封不动地导出来。

但是像 Typeless 这种工具,它其实是在你原始表达的基础上做了加工:
1. 删掉不正式、没用的废话
2. 进行格式化处理

格式化后的内容会变得更正式、更规整。如果把这些内容发给大模型,效果可能会更好,因为它去掉了一些噪声,尤其是长时间的语音噪声。
00
行小招
8天前
复杂的任务,不应该只依赖一个模型!

最近摸索出来了一个工作流,先让 Claude Code 中的 Opus 4.6 干一遍,产出完整方案,然后把成果扔给 Codex 中的 GPT-5.3-xhigh,让它扮演最严格的 Reviewer,挑漏洞、补边界、优化方案,结果完成度和质量比单模型高出一大截。

这种做法本质上,就是软件工程里 "写代码的人不该自己审代码" 的铁律,搬到了 AI 协作上。

模型也有盲区,而另一个顶级模型恰好是最好的协作者。
01
行小招
8天前
降智又来了,gpt-5.3-Codex这款模型质量实在是高,访问量也大,OpenAI 不得不重启“降智”大法,

关键是你还不知道你被“降智”了!

我老早之前就跟团队的人讲过,一定要养号,现在更加重要,OpenAI、Claude、Google 这三家尽可能的使用高质量的家宽来访问,而且尽可能固化下来,不要和其他人共用。

不仅仅是 OpenAI,Claude 尽人皆知,像 Google 最近的风控措施也越来越严格了。
40
行小招
9天前
chatgpt 上的 gpt-5.2 thinking 已经接近不可用的程度了,速度贼拉慢,而且搜索的效果感觉不如 Claude 上的 opus4.6 extended ,这是 agentic search ,效果上感觉好很多。
30
行小招
9天前
模型的进化速度快到令人窒息,gpt-5.3-Codex(Codex中)在后端工程领域超越了 Opus 4.6(Claude Code中),完成大逆转!

这是一次认知颗粒度的质变,Codex 5.3 终于攻破了 AI 辅助研发最难啃的骨头:基于 PRD + 现存业务微服务系统,独立设计出真正可落地的技术方案。

以前模型做技术方案,都是悬浮的空中楼阁,看着完善,不贴近实际,没法用。

Codex 5.3 不一样,需求细节的理解深度、业务逻辑的严谨性、对原有代码风格的遵循、最小 MVP 下的方案取舍,可以说是读得懂 PRD 里的业务隐喻,理得清屎山代码的逻辑纠葛。

给出技术方案虽然不完美,还需人工调整,但整体上可用了,Codex5.3 跨越了这个门槛,攻下了工程师日常工作中的又一个山头。
00