即刻App年轻人的同好社区
下载
App内打开
张楚琪-沉迷AI版
13关注1k被关注1夸夸
想办法让 AI 多干点活儿
置顶
张楚琪-沉迷AI版
2月前
用 AI 练雅思的这半年。

去年 8 月,我在即刻写下了第一条关于雅思的帖子(m.okjike.com),当时想到了一个好玩的计划:看我能不能用 AI (主要是生成式 AI) 辅助学习,把雅思考到 6.5 以上。即让生成式 AI 扮演我的学习助手,帮我克服英文阅读畏难情绪、检查语法错误、优化表达、写作评测、口语练习等等。

前几天刚考完,这算是对我自己的一个回应吧。

当然,这个成绩在雅思里是非常普通的水平。有一点比较好玩,由于要用 AI 辅助学习,于是我就要学习如何更好地使用 AI。在这个过程中我读了几十篇提示词相关的论文,如果算上 AI 其他相关方面的论文,可能读了有上百篇。

我始终觉得,提示词是了解基于 LLM 的生成式 AI 能力的一个很好的角度。同时,读论文的过程也是练习英文阅读的过程,一举两得。从我的阅读得分可以看到,这些论文确实没有白读。

在开始备考前,我的英文大致是依靠翻译工具勉强能阅读一些英文文档的水平。我当时用雅思真题测过,听说读写大致如下:
- 听力,英音听不懂
- 口语,基本是 「Well, um…….I think….」的水平
- 阅读,带着畏难情绪读,没法在一个小时之内完成 3 篇文章的阅读理解
- 写作,雅思两篇作文,我需要花 2 个小时才能勉强凑齐字数。但考试必须一个小时之内写完两篇作文

整个过程走下来,我与 AI 的对话方式发生了很大的变化,英文练习上也有不少收获。

与 AI 对话,或者说写提示词方面,我现在已经很少会一上来就列详细的要求。会以简明而扼要的方式提出目标,然后根据 AI 的回应判断其对问题的了解程度,从而思考我需要设置哪些约束条件来界定范围,以及需要提供哪些额外的上下文来帮助 AI 更有效地进行推理。

我也越来越认识到「分而治之」策略的重要性。早期,我常常希望 AI 一次性提供我所需的全部信息。举个例子,对于一个雅思作文评测的任务 (m.okjike.com),我期望 AI 能够在一次回复中既按照雅思标准评分,又检查语法错误,并给出改进建议。

虽然这种要求从人的角度看似合理,但对于当前的生成式 AI 而言,这往往只能得到一个「总感觉差点意思」的答案。有时候,当我们认为自己对某个问题已经想得非常清楚时,向 AI 提出后发现得到的回复完全不符合预期,这时候就应该考虑如何将任务细分,让 AI 逐步分多次处理。

英语学习方面,读英文基本上没有什么畏难情绪了。因为我知道我随时可以让 AI 给我讲解。关于克服阅读畏难情绪,之前也写过想法(m.okjike.com)。练习得越多,感受越深。

吴恩达教授在《Generative AI for Everyone》里提过一个观点:AI has the potential to give every individual the ability to hire intelligence at low cost.

确实如此啊。如果没有生成式 AI,总是碰到读不懂的英文,谁能随时给我从各种不同的角度解释呢?谁陪我练口语而我不用担心尴尬呢?谁在深夜里依然随叫随到给我批改作文、给我优化建议呢?

如果你对生成式 AI 感兴趣,《Generative AI for Everyone》课程确实是很好的学习指南。我对这个课程写过详细的笔记:
第一部分:m.okjike.com

第二部分:m.okjike.com

第三部分:m.okjike.com

让 AI 多干点活儿!
519
张楚琪-沉迷AI版
10:57
(The Batch 翻译) 主题:模型上下文窗口长度不断被扩展,多样本学习 (many-shot learning) 提示策略值得一试

Medprompt 论文:
arxiv.org

我的 Medprompt 阅读笔记:
m.okjike.com

P.S. 文章来源是吴恩达 (Andrew Ng) 教授主理的一个 AI 周报,分享他对于 AI 的思考和洞察。

上一期:m.okjike.com

本期原文:www.deeplearning.ai
00
张楚琪-沉迷AI版
2天前
生成式 AI 在雅思口语练习中的应用。

听说读写里,「说」真的是最难突破的。即使掌握了一定程度的阅读英文的能力,真到了要用英语口头表达自己的想法或者与人闲聊时,总感觉「就是开不了口让 TA 知道」。

短时间内大幅提升口语能力显然不太现实,但从考试的角度来说,只要是考试,就有它的流程和形式,如果针对这种流程和形式来练习,显然更容易达成预期目标。就像用特定的数据集来训练模型,那训练后的模型在这些数据集上的表现可能就会更好一些。

雅思口语里的数据集就是当季口语题库。这个从网上不难找到。剩下的就是如何练以及生成式 AI 在这个流程里如何辅助我们学习。

我给自己设定的口语目标分数是 6 分,按照雅思的评分标准,6 分可以大致看作是一个及格水平。

仔细阅读了雅思的评分标准以及一些前雅思考官的口语指南以后,我给自己提炼了针对这个目标水平练习应该注意的原则:
- 不要过于在意语法错误,流利度的权重更高
- 不要痴迷于专八、雅思高级词汇这些,如果不能流畅自然地运用这些词汇,还不如不用
- 表达观点的时候,要做适当的展开。比如说到什么什么很 convenient,需要简单地展开为什么感觉很 convenient

目标有了,练习原则有了,接下来就是拆分目标,结合生成式 AI 构建一个练习流程。我的方案比较质朴,核心是三步。

第一步:Part 1 和 Part 2&3 各找 50 个以上的话题,针对每个话题,思考如果用中文来表达我会如何表达。然后用生成式 AI 把这些中文表达用地道的英文口语重新复述(不是翻译)。这一步基本上 GPT-3.5 水平的 AI 都能做到。

目的是基于自己真实的想法和经验,积累相关场景下的英文表达。然后就是每天大声朗读这些英文答案。读的目的不是为了背诵答案,而是训练自己习惯说英文,可以说是训练肌肉记忆一样。

第二步:经过第一步的练习(大约 1-2 个月),嘴应该就被撬开了,可以开口说一些了。然后就是分开练习 Part 1、Part 2&3。

Part 1 的主要话题都是一些生活日常,工作、爱好等等,Part 2 则是描述一些经历、人物等,Part 3 是基于 Part 2 问一些相对抽象的问题。所以 Part 1 和 Part 2&3 没什么强关联性,可以分开练习。

我的练习方式是直接拿实际的话题来练,这包括第一步准备过的几十个话题,也包括新话题。使用的是 ChatGPT-4 的语音模式。提示词设计分两步,模拟提问和完善答案。
模拟提问参考提示词如下:
docs.qq.com

先发送给 ChatGPT 之后,再开启语音模式。然后就是一个个地回答问题。问题回答完以后,我通常会退出语音模式,接着发送一句:Show me how to answer these questions better based on my answers. 让 ChatGPT 基于我的答案内容来优化一下。这个过程中,我的感受是 ChatGPT-4 可以很好地优化答案,GPT-3.5 则要差点意思,优化出来的答案比较冗长和空洞。

Part 1 比较熟悉了之后,如法炮制练习 Part 2&3。参考提示词如下:
docs.qq.com

这个过程里,回答完问题以后,在完善答案的时候建议 Part 2 和 Part 3 分开做优化,能得到更好的结果。

优化 Part 2 参考提示词:Show me how to answer the above part 2 topic better based on my answer.

优化 Part 3 参考提示词:Show me how to answer the above part 3 questions better based on my answers.

第三步:全流程模拟。有很多雅思相关的网站都提供类似的模拟流程,找一个自己用起来称手的就行。核心是熟悉整个流程。还别说,刚开始全流程模拟的时候,还真有点紧张呢。

我以前也写过一个用生成式 AI 来做全流程模拟的提示词,用来感受一下流程还可以,实际的话题什么的参考性不够强:m.okjike.com

另外,如果你可以用 GPTs,@胡贝侨 写的这个雅思口语 GPT 很赞,可以用 ChatGPT-4 来做完整的口语模拟。

直达链接:chat.openai.com

该 GPT 开源思路 (提示词、话题库等):github.com
14
张楚琪-沉迷AI版
7天前
(The Batch 翻译) 主题:警惕反对开源的错误论点

P.S. 文章来源是吴恩达 (Andrew Ng) 教授主理的一个 AI 周报,分享他对于 AI 的思考和洞察。

上一期:m.okjike.com

本期原文:www.deeplearning.ai
01
张楚琪-沉迷AI版
10天前
随着模型能力的进步,具体的提示词技巧确实变得没那么重要了。

从我自己的使用方式来看,prompt 写得越来越简单。比如英文语法检查,就是简单的一句话:m.okjike.com

很简单但很有效。如果一个任务比较复杂,我会更多地考虑拆分成子任务或子步骤。也就是更加关注工作流。

由于好久没刷论文了,这几天把近两个月的论文都刷了一下,发现了一个有趣的点:居然没发现一篇关于提示词技巧的论文。倒是关于这两方面的论文显而易见的多起来了:工作流 (agentic workflow)、合成数据 (synthetic data)。

比如 Google 的这篇论文 (arxiv.org) 提出了 Med-Gemini,让模型借助网络搜索能力,最后在医学数据集上基本上胜过了微软之前提出的 Medprompt。Medprompt 的思路见:m.okjike.com

ChatGLM 提出了 ChatGLM-Math (arxiv.org),借助 Self-Critique 工作流的思路来提升模型在数学推理方面的能力。

Google 的这篇论文 (arxiv.org) 提出了关于合成数据的一些最佳实践。

从这个趋势来看,大家都不怎么发具体的提示词相关的技巧论文了,某种程度上说明这块可能确实没什么好挖的了,或者说价值没那么大了。随着模型基础能力的提升,简单地把任务描述清楚 + 为任务设计合理的工作流可能才是更有价值的地方了。
42
张楚琪-沉迷AI版
12天前
生成式 AI 在雅思写作练习中的应用。

在练习雅思写作的过程中,我是完全借助生成式 AI 来提供反馈的。经过这半年的练习,我的感受是生成式 AI 确实是自学者的福音。虽然不能替代专业的老师,但足够让我们实现从 0 到 1,拿到合格的结果。

换句话说,目前的生成式 AI 可能没法给我们提供 90 分以上的反馈,但给出 70-80 分的反馈建议是没问题的。

先不考虑 AI,我们可以先列出来针对雅思写作练习这个任务,我们的需求是什么?不难想到,主要有 4 点:
1. 基于雅思官方作文评分标准对作文给出整体反馈;
2. 语法分析;
3. 表达优化;
4. 基于我们的作文改写。

需求明确了,剩下的就是如何指导 AI 来做事了,也就是 prompting。

早期玩得没那么熟,因此总想着一股脑一次性给 AI 描述清楚所有需求,然后希望 AI 按照我的要求一条条来做,于是就写出了这样的提示词:m.okjike.com

现在读起来着实有些脸红。这里面犯的最大的错误是希望 AI 一次性完成多个任务。比如又做语法错误检查又评分,同时还要给我提供改进建议。结果就是总是得到一个不咸不淡的反馈。

后来读了些论文,加上自己的实践,才慢慢意识到拆分任务的重要性。虽然这个原则OpenAI 和 Claude 早就在官方文档里写了,但知道和理解之间还是有着一点距离。

当我们真的用 AI 去解决实际问题的时候,如何让 AI 的输出相对稳定是很重要的。而要让输出相对稳定,除了描述要清晰明确,更重要的就是单次推理过程不要太过复杂。比如要求 AI 做语法检查就只做语法检查,不要希望 AI 同时还给出表达是否地道的分析。

按照这个思路,把上面的 4 点需求都作为独立的任务,分别写提示词就可以了。这其实很简单,我有时候也好奇,为什么我一开始没有这么想。我想大概是对生成式 AI 的能力边界了解得不够。

以下是针对雅思写作练习的几个提示词,非常质朴,我用下来还比较稳定。

小作文评估 (Task 1):docs.qq.com

大作文评估 (Task 2):docs.qq.com

语法分析:m.okjike.com

表达分析:docs.qq.com

小作文 (Task 1) 改写:docs.qq.com

大作文 (Task 2) 改写:docs.qq.com

在这个思路里,把雅思的上下文背景信息换成其他英文写作目标,我想应该也是适用的。
13
张楚琪-沉迷AI版
16天前
(The Batch 翻译) 主题:智能体工作流 (agentic workflow) 为生成高质量的合成数据打开了新思路

P.S. 文章来源是吴恩达 (Andrew Ng) 教授主理的一个 AI 周报,分享他对于 AI 的思考和洞察。

上一期:m.okjike.com

本期原文:www.deeplearning.ai
02
张楚琪-沉迷AI版
18天前
使用生成式 AI 做英文语法检查踩的那些坑。

无论是练习雅思写作还是平时写一些简单的英文,写完第一件事总是先检查语法错误。不知道为什么,英文语法在我看来真的不容易掌握。为此,我还特意学习了 English with Ronnie 频道的语法课程(www.youtube.com),Ronnie 讲解得很生动也很有趣。但是这语法知识是真的进不了脑子。学完写起来还是错误一堆。

有个关于英文语法的笑话是这样的:
You dance, I dance, but he dances.
A million people dance, but he dances.
WTF? Does he dance more than us?

你看,英文语法就是这么神奇。

后来我索性直接采用朴实无华的方法:多写,闷着头就写,写完再校正错误。我相信写的量到一定程度了,校正的错误多了,语法准确率就会上来了。

Make mistakes and learn.

一开始我认为检查语法这样的任务对于现在的生成式 AI 来说应该是很简单的。由于 GPT-4 有消息条数限制,我需要用作其他用途,所以都是使用 GPT-3.5、Geimini 等其他 AI 来做语法检查的。这就是我踩坑的开始。

每当我一篇几百词的段落发过去之后,这些 AI 会像模像样地帮我挑出几个语法错误,然后称赞我写得好。谁又不喜欢听好话呢?渐渐地,我在一声声的夸奖中迷失了自己。这雅思写作不得拿个 7 分?

直到有一天,我打开我的 Grammarly 找一篇以前写过的段落,然后顺手把刚用 GPT-3.5 检查过的段落放到了 Grammarly 中。靠,我才发现 GPT-3.5 竟然有这么多语法错误没有检查出来。继续对照了几十篇段落之后,我终于意识到语法检查这个任务对于这些 AI 来说并不是那么简单的。

怎么没早点对结果做二次校验呢?怪我把语法检查这个任务想得太简单了,尤其是针对篇幅较长的段落。有点不甘心,于是又用 GPT-4 来和 Grammarly 做对照,最后发现 GPT-4 倒是可以胜任这个任务。

配合逐句分析的思路,有时候分析结果比 Grammarly 更好一些。比如有些句子虽然没有明显的语法错误,但是 GPT-4 会提示某个短语在英文中不常用,或提示某个单词在这个语境里不太合适。

最后实践下来,使用生成式 AI 做英文语法检查,比较有效的方式如下:
1. 要使用 GPT-4 或同等模型能力的 AI
2. 让 AI 采用逐句分析策略 (sentence-by-sentence)
3. 用英文提示词

通用参考提示词:Check the grammar accuracy of the following text sentence-by-sentence: {{your text}}

核心是 sentence-by-sentence, 类似「Let's think step-by-step.」

GPT-4 回复结果参考附图。
00
张楚琪-沉迷AI版
22天前
生成式 AI 在 A 类雅思阅读中的应用。

从我做剑雅 18-12 的真题以及阅读 AI 相关的论文和文章的感受来看,生成式 AI 在这个场景里主要的作用有两点:辅助克服心理恐惧、解释长难句。

我并没有用 AI 帮助我了解雅思阅读的基本规则,比如评分标准、题型等。这些基本信息显然通过像 NEEA 的备考指南 (www.chinaielts.org) 和 FAQ 来了解会更高效。

也没有用 AI 来制定雅思阅读练习计划。一个通用的计划意义不大。做几套剑雅真题熟悉所有题型之后,就会知道自己的薄弱环节在哪里。然后据此为自己设定训练计划。

针对雅思阅读考试,训练计划可以概括为 2 点:提升做题准确性和做题速度。

准确性的基础其实就是对文章内容的理解程度。和其他阅读理解一样,弄懂一篇文章就是理解每一句的含义、句与句之间的关系、段与段之间的关系。这个环节也是生成式 AI 能发挥极大价值的地方。

刚开始练习的时候,很多都读不懂,难免感到有些沮丧、失落、茫然无措。如果你知道有人能随时随地给你答疑,并且你试过几次之后发现真的可以搞懂,正反馈循环就建立起来了。慢慢地,你心里就会产生一种感觉:读不懂就读不懂,我来问问我的「老师们」就能搞懂了。

各生成式 AI 就是这些老师们,你只管问就行。也没有什么神奇的提示词 (prompt),我自己感觉有效的方式就是把整个一段文字发给 AI,然后直接提问其中某个单词/句子如何理解。

发整段文字的好处是给 AI 提供单词/句子的上下文。就像我们在现实生活中向其他人提问一样,给更多的背景信息更加有助于别人理解问题,从而提供更好的答案。

另外,就像每个老师有一套自己的讲解风格一样,不同的 AI 解释的风格也有些不一样。如果一个老师的讲解没让你理解,就换一个问。

这样练几十篇文章,做题准确性就会有明显的提升。当准确性练到你的目标的时候 (比如正确率 30/40 对应 7 分),就可以开始着重练习提升做题速度了。

对于做题速度来说,需要配合一些做题技巧。这个环节,我没有发现生成式 AI 可以为我提效或解决疑惑的地方。

雅思阅读三篇文章,根据我有限的经验,我没法在一个小时之内从头至尾地阅读完 3 篇文章。我的策略是略读 + 题目关键词/题意定位。

略读用来把握文章的结构。雅思的文章有着非常清晰的结构。比如主题是关于某个现象,那么通常结构就会是引言介绍、现象当前产生的影响(数据/研究等)、各机构/人员对该现象持什么观点、提出了什么解决方案,应采取什么措施、对未来的展望。

我的略读流程:
1. 读文章 title 和首段来了解主题是什么
2. 读每一段的首句,有些段落会读首句 + 尾句

通过这个略读流程,可以在脑海里构建起文章的结构,并把各段落大致对应到结构中。必要时,可以对段落做一些高亮和备注。

具体到做题,首先看有没有明显的关键词可以直接定位文章段落,比如时间、人物、机构、数字等。如果没有,则根据题意考虑对应的应该是文章结构中哪个环节。案例?某人的观点?当前的影响?未来预测?

同样,按照这个方式练几十篇文章,做题速度也就上来了。惭愧的是,我的阅读量积累得还不够,所以前阵子考试的时候,我是掐着点才做完所有题。三篇文章花的时间差不多是 15 + 18 + 26 分钟。

无他,继续多读吧。

P.S. 如果选择的是机考,对应阅读里的找原词填空题,我发现实际上是可以复制文章中的单词然后粘贴 (Ctrl + C/V) 到填空里的,尤其对于不熟悉的单词,我会选择复制粘贴,因为怕打错字。
01
张楚琪-沉迷AI版
22天前
(The Batch 翻译) 主题:为什么需要更多算力来做推理?

P.S. 文章来源是吴恩达 (Andrew Ng) 教授主理的一个 AI 周报,分享他对于 AI 的思考和洞察。

上一期:m.okjike.com

本期原文:www.deeplearning.ai
00
张楚琪-沉迷AI版
28天前
基于上下文信息提供英文单词和句子解释的浏览器插件。

读英文文章的时候,我经常会遇到一个问题:单词都认识,句子结构也明白,但还是不太能理解整个句子所表达的含义。

一方面是因为很多单词是一词多义的,另一方面就是上下文语境不同,单词所表达的隐含意思是有差异的。

对于该问题,我之前常用的方式是把整个一段文字发给 AI,然后提问其中的某个词/短语/句子在这段文字里是什么意思。通常,经过 AI 的解释,我就能明白。

比如我之前看 Jimmy 的 stand-up 的时候,有些句子我听懂大概意思了,但我不明白为什么观众都在笑。我就会把字幕导出来,然后复制我不懂的那一段发给 AI 提问。例子如图一。

也就是说,对于读英文文章而言,如果有工具能在解释单词/短语/句子的时候,除了提供基础的翻译,还能自动根据上下文信息推理出进一步的解释,那么读英文文章就会更顺畅。

最近惊喜地发现,我一直在用的欧路词典插件新增了这个功能,很惊喜。效果见图二、图三。

比如图二里的 grounding,在翻译里会翻译成接地,想一想也能大致理解意思,但显然根据上下文推理出来的「情境理解」更容易让人明白 grounding 所表达的意思。

对于单词解释的场景也一样,如图三,根据上下文推理出来的解释会让阅读更顺畅。

顺带一提,这个插件也支持中英对照的「沉浸式翻译」。

欧路词典插件官方链接:www.eudic.net
22