张楚琪-沉迷AI版的个人主页

即刻App年轻人的同好社区

下载

App内打开

张楚琪-沉迷AI版

13关注1k被关注1夸夸

想办法让 AI 多干点活儿

置顶

张楚琪-沉迷AI版

2月前

用 AI 练雅思的这半年。

去年 8 月，我在即刻写下了第一条关于雅思的帖子（m.okjike.com），当时想到了一个好玩的计划：看我能不能用 AI (主要是生成式 AI) 辅助学习，把雅思考到 6.5 以上。即让生成式 AI 扮演我的学习助手，帮我克服英文阅读畏难情绪、检查语法错误、优化表达、写作评测、口语练习等等。

前几天刚考完，这算是对我自己的一个回应吧。

当然，这个成绩在雅思里是非常普通的水平。有一点比较好玩，由于要用 AI 辅助学习，于是我就要学习如何更好地使用 AI。在这个过程中我读了几十篇提示词相关的论文，如果算上 AI 其他相关方面的论文，可能读了有上百篇。

我始终觉得，提示词是了解基于 LLM 的生成式 AI 能力的一个很好的角度。同时，读论文的过程也是练习英文阅读的过程，一举两得。从我的阅读得分可以看到，这些论文确实没有白读。

在开始备考前，我的英文大致是依靠翻译工具勉强能阅读一些英文文档的水平。我当时用雅思真题测过，听说读写大致如下：
- 听力，英音听不懂
- 口语，基本是「Well, um…….I think….」的水平
- 阅读，带着畏难情绪读，没法在一个小时之内完成 3 篇文章的阅读理解
- 写作，雅思两篇作文，我需要花 2 个小时才能勉强凑齐字数。但考试必须一个小时之内写完两篇作文

整个过程走下来，我与 AI 的对话方式发生了很大的变化，英文练习上也有不少收获。

与 AI 对话，或者说写提示词方面，我现在已经很少会一上来就列详细的要求。会以简明而扼要的方式提出目标，然后根据 AI 的回应判断其对问题的了解程度，从而思考我需要设置哪些约束条件来界定范围，以及需要提供哪些额外的上下文来帮助 AI 更有效地进行推理。

我也越来越认识到「分而治之」策略的重要性。早期，我常常希望 AI 一次性提供我所需的全部信息。举个例子，对于一个雅思作文评测的任务 (m.okjike.com)，我期望 AI 能够在一次回复中既按照雅思标准评分，又检查语法错误，并给出改进建议。

虽然这种要求从人的角度看似合理，但对于当前的生成式 AI 而言，这往往只能得到一个「总感觉差点意思」的答案。有时候，当我们认为自己对某个问题已经想得非常清楚时，向 AI 提出后发现得到的回复完全不符合预期，这时候就应该考虑如何将任务细分，让 AI 逐步分多次处理。

英语学习方面，读英文基本上没有什么畏难情绪了。因为我知道我随时可以让 AI 给我讲解。关于克服阅读畏难情绪，之前也写过想法（m.okjike.com）。练习得越多，感受越深。

吴恩达教授在《Generative AI for Everyone》里提过一个观点：AI has the potential to give every individual the ability to hire intelligence at low cost.

确实如此啊。如果没有生成式 AI，总是碰到读不懂的英文，谁能随时给我从各种不同的角度解释呢？谁陪我练口语而我不用担心尴尬呢？谁在深夜里依然随叫随到给我批改作文、给我优化建议呢？

如果你对生成式 AI 感兴趣，《Generative AI for Everyone》课程确实是很好的学习指南。我对这个课程写过详细的笔记：
第一部分：m.okjike.com

第二部分：m.okjike.com

第三部分：m.okjike.com

让 AI 多干点活儿！

24 519

张楚琪-沉迷AI版

10:57

(The Batch 翻译) 主题：模型上下文窗口长度不断被扩展，多样本学习 (many-shot learning) 提示策略值得一试

Medprompt 论文：
arxiv.org

我的 Medprompt 阅读笔记：
m.okjike.com

P.S. 文章来源是吴恩达 (Andrew Ng) 教授主理的一个 AI 周报，分享他对于 AI 的思考和洞察。

上一期：m.okjike.com

本期原文：www.deeplearning.ai

1 00

张楚琪-沉迷AI版

2天前

生成式 AI 在雅思口语练习中的应用。

听说读写里，「说」真的是最难突破的。即使掌握了一定程度的阅读英文的能力，真到了要用英语口头表达自己的想法或者与人闲聊时，总感觉「就是开不了口让 TA 知道」。

短时间内大幅提升口语能力显然不太现实，但从考试的角度来说，只要是考试，就有它的流程和形式，如果针对这种流程和形式来练习，显然更容易达成预期目标。就像用特定的数据集来训练模型，那训练后的模型在这些数据集上的表现可能就会更好一些。

雅思口语里的数据集就是当季口语题库。这个从网上不难找到。剩下的就是如何练以及生成式 AI 在这个流程里如何辅助我们学习。

我给自己设定的口语目标分数是 6 分，按照雅思的评分标准，6 分可以大致看作是一个及格水平。

仔细阅读了雅思的评分标准以及一些前雅思考官的口语指南以后，我给自己提炼了针对这个目标水平练习应该注意的原则：
- 不要过于在意语法错误，流利度的权重更高
- 不要痴迷于专八、雅思高级词汇这些，如果不能流畅自然地运用这些词汇，还不如不用
- 表达观点的时候，要做适当的展开。比如说到什么什么很 convenient，需要简单地展开为什么感觉很 convenient

目标有了，练习原则有了，接下来就是拆分目标，结合生成式 AI 构建一个练习流程。我的方案比较质朴，核心是三步。

第一步：Part 1 和 Part 2&3 各找 50 个以上的话题，针对每个话题，思考如果用中文来表达我会如何表达。然后用生成式 AI 把这些中文表达用地道的英文口语重新复述（不是翻译）。这一步基本上 GPT-3.5 水平的 AI 都能做到。

目的是基于自己真实的想法和经验，积累相关场景下的英文表达。然后就是每天大声朗读这些英文答案。读的目的不是为了背诵答案，而是训练自己习惯说英文，可以说是训练肌肉记忆一样。

第二步：经过第一步的练习（大约 1-2 个月），嘴应该就被撬开了，可以开口说一些了。然后就是分开练习 Part 1、Part 2&3。

Part 1 的主要话题都是一些生活日常，工作、爱好等等，Part 2 则是描述一些经历、人物等，Part 3 是基于 Part 2 问一些相对抽象的问题。所以 Part 1 和 Part 2&3 没什么强关联性，可以分开练习。

我的练习方式是直接拿实际的话题来练，这包括第一步准备过的几十个话题，也包括新话题。使用的是 ChatGPT-4 的语音模式。提示词设计分两步，模拟提问和完善答案。
模拟提问参考提示词如下：
docs.qq.com

先发送给 ChatGPT 之后，再开启语音模式。然后就是一个个地回答问题。问题回答完以后，我通常会退出语音模式，接着发送一句：Show me how to answer these questions better based on my answers. 让 ChatGPT 基于我的答案内容来优化一下。这个过程中，我的感受是 ChatGPT-4 可以很好地优化答案，GPT-3.5 则要差点意思，优化出来的答案比较冗长和空洞。

Part 1 比较熟悉了之后，如法炮制练习 Part 2&3。参考提示词如下：
docs.qq.com

这个过程里，回答完问题以后，在完善答案的时候建议 Part 2 和 Part 3 分开做优化，能得到更好的结果。

优化 Part 2 参考提示词：Show me how to answer the above part 2 topic better based on my answer.

优化 Part 3 参考提示词：Show me how to answer the above part 3 questions better based on my answers.

第三步：全流程模拟。有很多雅思相关的网站都提供类似的模拟流程，找一个自己用起来称手的就行。核心是熟悉整个流程。还别说，刚开始全流程模拟的时候，还真有点紧张呢。

我以前也写过一个用生成式 AI 来做全流程模拟的提示词，用来感受一下流程还可以，实际的话题什么的参考性不够强：m.okjike.com

另外，如果你可以用 GPTs，@胡贝侨写的这个雅思口语 GPT 很赞，可以用 ChatGPT-4 来做完整的口语模拟。

直达链接：chat.openai.com

该 GPT 开源思路 (提示词、话题库等)：github.com

7 14

张楚琪-沉迷AI版

7天前

(The Batch 翻译) 主题：警惕反对开源的错误论点

P.S. 文章来源是吴恩达 (Andrew Ng) 教授主理的一个 AI 周报，分享他对于 AI 的思考和洞察。

上一期：m.okjike.com

本期原文：www.deeplearning.ai

2 01

张楚琪-沉迷AI版

10天前

随着模型能力的进步，具体的提示词技巧确实变得没那么重要了。

从我自己的使用方式来看，prompt 写得越来越简单。比如英文语法检查，就是简单的一句话：m.okjike.com

很简单但很有效。如果一个任务比较复杂，我会更多地考虑拆分成子任务或子步骤。也就是更加关注工作流。

由于好久没刷论文了，这几天把近两个月的论文都刷了一下，发现了一个有趣的点：居然没发现一篇关于提示词技巧的论文。倒是关于这两方面的论文显而易见的多起来了：工作流 (agentic workflow)、合成数据 (synthetic data)。

比如 Google 的这篇论文 (arxiv.org) 提出了 Med-Gemini，让模型借助网络搜索能力，最后在医学数据集上基本上胜过了微软之前提出的 Medprompt。Medprompt 的思路见：m.okjike.com

ChatGLM 提出了 ChatGLM-Math (arxiv.org)，借助 Self-Critique 工作流的思路来提升模型在数学推理方面的能力。

Google 的这篇论文 (arxiv.org) 提出了关于合成数据的一些最佳实践。

从这个趋势来看，大家都不怎么发具体的提示词相关的技巧论文了，某种程度上说明这块可能确实没什么好挖的了，或者说价值没那么大了。随着模型基础能力的提升，简单地把任务描述清楚 + 为任务设计合理的工作流可能才是更有价值的地方了。

9 42

张楚琪-沉迷AI版

12天前

生成式 AI 在雅思写作练习中的应用。

在练习雅思写作的过程中，我是完全借助生成式 AI 来提供反馈的。经过这半年的练习，我的感受是生成式 AI 确实是自学者的福音。虽然不能替代专业的老师，但足够让我们实现从 0 到 1，拿到合格的结果。

换句话说，目前的生成式 AI 可能没法给我们提供 90 分以上的反馈，但给出 70-80 分的反馈建议是没问题的。

先不考虑 AI，我们可以先列出来针对雅思写作练习这个任务，我们的需求是什么？不难想到，主要有 4 点：
1. 基于雅思官方作文评分标准对作文给出整体反馈；
2. 语法分析；
3. 表达优化；
4. 基于我们的作文改写。

需求明确了，剩下的就是如何指导 AI 来做事了，也就是 prompting。

早期玩得没那么熟，因此总想着一股脑一次性给 AI 描述清楚所有需求，然后希望 AI 按照我的要求一条条来做，于是就写出了这样的提示词：m.okjike.com

现在读起来着实有些脸红。这里面犯的最大的错误是希望 AI 一次性完成多个任务。比如又做语法错误检查又评分，同时还要给我提供改进建议。结果就是总是得到一个不咸不淡的反馈。

后来读了些论文，加上自己的实践，才慢慢意识到拆分任务的重要性。虽然这个原则OpenAI 和 Claude 早就在官方文档里写了，但知道和理解之间还是有着一点距离。

当我们真的用 AI 去解决实际问题的时候，如何让 AI 的输出相对稳定是很重要的。而要让输出相对稳定，除了描述要清晰明确，更重要的就是单次推理过程不要太过复杂。比如要求 AI 做语法检查就只做语法检查，不要希望 AI 同时还给出表达是否地道的分析。

按照这个思路，把上面的 4 点需求都作为独立的任务，分别写提示词就可以了。这其实很简单，我有时候也好奇，为什么我一开始没有这么想。我想大概是对生成式 AI 的能力边界了解得不够。

以下是针对雅思写作练习的几个提示词，非常质朴，我用下来还比较稳定。

小作文评估 (Task 1)：docs.qq.com

大作文评估 (Task 2)：docs.qq.com

语法分析：m.okjike.com

表达分析：docs.qq.com

小作文 (Task 1) 改写：docs.qq.com

大作文 (Task 2) 改写：docs.qq.com

在这个思路里，把雅思的上下文背景信息换成其他英文写作目标，我想应该也是适用的。

3 13

张楚琪-沉迷AI版

16天前

(The Batch 翻译) 主题：智能体工作流 (agentic workflow) 为生成高质量的合成数据打开了新思路

P.S. 文章来源是吴恩达 (Andrew Ng) 教授主理的一个 AI 周报，分享他对于 AI 的思考和洞察。

上一期：m.okjike.com

本期原文：www.deeplearning.ai

2 02

张楚琪-沉迷AI版

18天前

使用生成式 AI 做英文语法检查踩的那些坑。

无论是练习雅思写作还是平时写一些简单的英文，写完第一件事总是先检查语法错误。不知道为什么，英文语法在我看来真的不容易掌握。为此，我还特意学习了 English with Ronnie 频道的语法课程（www.youtube.com），Ronnie 讲解得很生动也很有趣。但是这语法知识是真的进不了脑子。学完写起来还是错误一堆。

有个关于英文语法的笑话是这样的：
You dance, I dance, but he dances.
A million people dance, but he dances.
WTF? Does he dance more than us?

你看，英文语法就是这么神奇。

后来我索性直接采用朴实无华的方法：多写，闷着头就写，写完再校正错误。我相信写的量到一定程度了，校正的错误多了，语法准确率就会上来了。

Make mistakes and learn.

一开始我认为检查语法这样的任务对于现在的生成式 AI 来说应该是很简单的。由于 GPT-4 有消息条数限制，我需要用作其他用途，所以都是使用 GPT-3.5、Geimini 等其他 AI 来做语法检查的。这就是我踩坑的开始。

每当我一篇几百词的段落发过去之后，这些 AI 会像模像样地帮我挑出几个语法错误，然后称赞我写得好。谁又不喜欢听好话呢？渐渐地，我在一声声的夸奖中迷失了自己。这雅思写作不得拿个 7 分？

直到有一天，我打开我的 Grammarly 找一篇以前写过的段落，然后顺手把刚用 GPT-3.5 检查过的段落放到了 Grammarly 中。靠，我才发现 GPT-3.5 竟然有这么多语法错误没有检查出来。继续对照了几十篇段落之后，我终于意识到语法检查这个任务对于这些 AI 来说并不是那么简单的。

怎么没早点对结果做二次校验呢？怪我把语法检查这个任务想得太简单了，尤其是针对篇幅较长的段落。有点不甘心，于是又用 GPT-4 来和 Grammarly 做对照，最后发现 GPT-4 倒是可以胜任这个任务。

配合逐句分析的思路，有时候分析结果比 Grammarly 更好一些。比如有些句子虽然没有明显的语法错误，但是 GPT-4 会提示某个短语在英文中不常用，或提示某个单词在这个语境里不太合适。

最后实践下来，使用生成式 AI 做英文语法检查，比较有效的方式如下：
1. 要使用 GPT-4 或同等模型能力的 AI
2. 让 AI 采用逐句分析策略 (sentence-by-sentence)
3. 用英文提示词

通用参考提示词：Check the grammar accuracy of the following text sentence-by-sentence: {{your text}}

核心是 sentence-by-sentence, 类似「Let's think step-by-step.」

GPT-4 回复结果参考附图。

5 00

张楚琪-沉迷AI版

22天前

生成式 AI 在 A 类雅思阅读中的应用。

从我做剑雅 18-12 的真题以及阅读 AI 相关的论文和文章的感受来看，生成式 AI 在这个场景里主要的作用有两点：辅助克服心理恐惧、解释长难句。

我并没有用 AI 帮助我了解雅思阅读的基本规则，比如评分标准、题型等。这些基本信息显然通过像 NEEA 的备考指南 (www.chinaielts.org) 和 FAQ 来了解会更高效。

也没有用 AI 来制定雅思阅读练习计划。一个通用的计划意义不大。做几套剑雅真题熟悉所有题型之后，就会知道自己的薄弱环节在哪里。然后据此为自己设定训练计划。

针对雅思阅读考试，训练计划可以概括为 2 点：提升做题准确性和做题速度。

准确性的基础其实就是对文章内容的理解程度。和其他阅读理解一样，弄懂一篇文章就是理解每一句的含义、句与句之间的关系、段与段之间的关系。这个环节也是生成式 AI 能发挥极大价值的地方。

刚开始练习的时候，很多都读不懂，难免感到有些沮丧、失落、茫然无措。如果你知道有人能随时随地给你答疑，并且你试过几次之后发现真的可以搞懂，正反馈循环就建立起来了。慢慢地，你心里就会产生一种感觉：读不懂就读不懂，我来问问我的「老师们」就能搞懂了。

各生成式 AI 就是这些老师们，你只管问就行。也没有什么神奇的提示词 (prompt)，我自己感觉有效的方式就是把整个一段文字发给 AI，然后直接提问其中某个单词/句子如何理解。

发整段文字的好处是给 AI 提供单词/句子的上下文。就像我们在现实生活中向其他人提问一样，给更多的背景信息更加有助于别人理解问题，从而提供更好的答案。

另外，就像每个老师有一套自己的讲解风格一样，不同的 AI 解释的风格也有些不一样。如果一个老师的讲解没让你理解，就换一个问。

这样练几十篇文章，做题准确性就会有明显的提升。当准确性练到你的目标的时候 (比如正确率 30/40 对应 7 分)，就可以开始着重练习提升做题速度了。

对于做题速度来说，需要配合一些做题技巧。这个环节，我没有发现生成式 AI 可以为我提效或解决疑惑的地方。

雅思阅读三篇文章，根据我有限的经验，我没法在一个小时之内从头至尾地阅读完 3 篇文章。我的策略是略读 + 题目关键词/题意定位。

略读用来把握文章的结构。雅思的文章有着非常清晰的结构。比如主题是关于某个现象，那么通常结构就会是引言介绍、现象当前产生的影响（数据/研究等）、各机构/人员对该现象持什么观点、提出了什么解决方案，应采取什么措施、对未来的展望。

我的略读流程：
1. 读文章 title 和首段来了解主题是什么
2. 读每一段的首句，有些段落会读首句 + 尾句

通过这个略读流程，可以在脑海里构建起文章的结构，并把各段落大致对应到结构中。必要时，可以对段落做一些高亮和备注。

具体到做题，首先看有没有明显的关键词可以直接定位文章段落，比如时间、人物、机构、数字等。如果没有，则根据题意考虑对应的应该是文章结构中哪个环节。案例？某人的观点？当前的影响？未来预测？

同样，按照这个方式练几十篇文章，做题速度也就上来了。惭愧的是，我的阅读量积累得还不够，所以前阵子考试的时候，我是掐着点才做完所有题。三篇文章花的时间差不多是 15 + 18 + 26 分钟。

无他，继续多读吧。

P.S. 如果选择的是机考，对应阅读里的找原词填空题，我发现实际上是可以复制文章中的单词然后粘贴 (Ctrl + C/V) 到填空里的，尤其对于不熟悉的单词，我会选择复制粘贴，因为怕打错字。

4 01

张楚琪-沉迷AI版

22天前

(The Batch 翻译) 主题：为什么需要更多算力来做推理？

P.S. 文章来源是吴恩达 (Andrew Ng) 教授主理的一个 AI 周报，分享他对于 AI 的思考和洞察。

上一期：m.okjike.com

本期原文：www.deeplearning.ai

1 00

张楚琪-沉迷AI版

28天前

基于上下文信息提供英文单词和句子解释的浏览器插件。

读英文文章的时候，我经常会遇到一个问题：单词都认识，句子结构也明白，但还是不太能理解整个句子所表达的含义。

一方面是因为很多单词是一词多义的，另一方面就是上下文语境不同，单词所表达的隐含意思是有差异的。

对于该问题，我之前常用的方式是把整个一段文字发给 AI，然后提问其中的某个词/短语/句子在这段文字里是什么意思。通常，经过 AI 的解释，我就能明白。

比如我之前看 Jimmy 的 stand-up 的时候，有些句子我听懂大概意思了，但我不明白为什么观众都在笑。我就会把字幕导出来，然后复制我不懂的那一段发给 AI 提问。例子如图一。

也就是说，对于读英文文章而言，如果有工具能在解释单词/短语/句子的时候，除了提供基础的翻译，还能自动根据上下文信息推理出进一步的解释，那么读英文文章就会更顺畅。

最近惊喜地发现，我一直在用的欧路词典插件新增了这个功能，很惊喜。效果见图二、图三。

比如图二里的 grounding，在翻译里会翻译成接地，想一想也能大致理解意思，但显然根据上下文推理出来的「情境理解」更容易让人明白 grounding 所表达的意思。

对于单词解释的场景也一样，如图三，根据上下文推理出来的解释会让阅读更顺畅。

顺带一提，这个插件也支持中英对照的「沉浸式翻译」。

欧路词典插件官方链接：www.eudic.net

8 22