人人都能用的生成式 AI(Generative AI for Everyone)课程第一周学习笔记。
TL;DR 第一周的视频课程加起来大概是一个小时多一点。我按照课程的每个章节分别记了笔记。
------------
生成式 AI 的工作原理是什么样的?
------------
类似 ChatGPT 的生成式 AI 能输出极为生动、逼真的文本,这得益于大型语言模型(LLMs)。这些模型是通过海量的文本数据训练出来的。
下面这个简单的例子可以说明它的工作原理:假设你给模型输入了一句 "我最爱的食物是一个贝果搭配..."。模型已经处理过成千上万类似的句子,它知道 "贝果搭配" 之后通常接的是 "奶油芝士",于是它极可能会预测下一个词是 "奶油芝士"。
借助庞大的文本数据集训练,AI 掌握了文本中的一些规律,知道哪些词常常会紧跟在什么词后面。
所以生成式 AI 在输出的时候,它就是在所有过往接触过的文本例子中,或者说它掌握的语言的规律中,预测出可能性最高的下一个词。所以它能够在任何主题上跟你侃大山。
要注意的是,有时它可能会幻想出一些事实(Hallucination),或者给出错误信息。这点是要牢记的。
------------
可以把生成式 AI 当作一个头脑风暴助手
------------
试想一下,有一个智能助手能帮你分析复杂问题,并想出一些创新的解决方案。这该有多好。我们知道,头脑风暴,主要讲究一个风暴嘛,先不论对错。
举例来说,如你拿不准主意如何修改一段文字以使其表达得更加清晰,你便可以问问生成式 AI。
又或者,如你想随手写一个有趣的小故事来逗小孩,你只需给生成式 AI 输入一些关键词,它就可以为你创作一个全新的故事。
因此,下次你想要激发想法或是想换个角度看问题,不妨尝试与生成式 AI 交流一番。可能会有惊喜等着你。
------------
生成式 AI 有什么用处?
------------
生成式 AI 就象电或者互联网一样,可以把它看作是一种通用的基础设施,能协助我们完成各种不同的任务。就如我们利用电力来驱动各类提升生活品质的设备和器械一样,生成式 AI 能生成文本,理解语言,进行对话。
比方说,在你写作时,它可以帮助你产生创意,通过搜索信息来回答你的问题,或者像一个贴心的助手那样进行自然对话。
------------
用生成式 AI 辅助写作
------------
你可以直接告诉生成式 AI,要它写一个什么报告或者文章。一开始它写出来的东西,可能很套话,是比较通用的模板。
那么,接下来就可以调整你的提示词,比如提供你要它的写的主题的背景和上下文,以及你的用途,希望它用什么样的语言风格来写。
根据 AI 的输出结果来迭代你的提示词。类似“帮我写一篇微信公众号爆款文章”这样的提示词,自然很难得到预期的结果。
我们自己得知道我们要什么,然后告诉它。
哪怕最后发现它实在不能完美胜任某个写作任务,我相信基于它的回复去优化去调整,或者借鉴一些素材还是没问题的。
------------
把生成式 AI 当作阅读助手
------------
想象一下,你写了一篇文章,尤其是英文,想确保它没有拼写、语法或句子结构上的错误。发给生成式 AI,让它来检查。有时候只需要简单地说 Please proofread the following text: "Your texts.",它就能帮你很好地润色一版。
针对不同的场景,你还可以要求它按照某种语气来重写。
另一个用处是对长文做总结。把长文发给 AI,让它总结。这样,你可以在不花费太多时间阅读的情况下了解文章的要点。
又或者是做一些语义分析。比如分析评论的感情色彩是正面还负面,分析客户的反馈应该归类到什么主题以及建议分发给哪个部门来处理等等。
------------
把生成式 AI 当作聊天机器人
------------
最常见的就是可以把它训练为特定领域的客服,可以回答一些常规的、简单的问题。减轻客服人员压力。只有在遇到它不能回复的问题的时候,再转人工。这里面要关注的就是安全性和准确性的问题。
一般来说某些环节需要人工参与,来验证 AI 的回复,确认之后再输出给客户。
------------
生成式 AI 能做什么和不能做什么?
------------
它虽然很厉害,可以根据输入生成类似真人回复的文本。可以把它们想象成是刚刚毕业的大学生,具有一般性基础知识,但没有在特定领域接受过专门培训。
它们可以根据从大量文本数据中学到的知识提供信息并回答问题,但是它们也有局限性。
牢记它们可能会胡编乱造,我们称之为“幻觉”。同时,要注意它们在输入和输出长度上有限制。它们在处理结构化数据(如表格或数据库)方面存在困难,而在处理非结构化信息(如文本)方面表现更好。
------------
写提示词的原则
------------
1. 提供详细和具体的信息:提供足够的背景和上下文信息有助于语言模型更好地理解任务。详细描述所需的任务可能会让 AI 的输出更符合你的预期;
2. 引导模型思考其回答:给予逐步指导可以帮助语言模型按照特定的过程生成期望的输出。通过将任务分解为较小的步骤,引导模型朝着期望的结果来回复;
3. 实验和迭代:提示是一个迭代的过程。重要的是尝试不同的提示,一开始你可以只写一个最基本最简单的提示,如果结果不令人满意,然后根据初始结果进行调整和改进。可能需要多次迭代才能实现期望的结果。
对于一些重要的结果,一定想办法做交叉验证。比如用其他权威的信息源来验证 AI 的输出结果。
一个小技巧,思考一个刚毕业的大学生,能不能按照我们写的提示词的指导来完成任务?如果答案是可以,那么 AI 也大概率能理解我们的提示词。
------------
文本生成图片的原理。
------------
文字生成图片的 AI 模型是通过使用大量的图像来训练一种特殊的算法,称为扩散模型 (Diffusion Model)。训练过程主要是逐渐向图像添加噪点,使其最后看起来像是随机像素点一样,然后再用算法一步步去除噪点把图像还原。
相当于告诉 AI 这张图是如何组成的。
要从文本生成图像,AI 会从一个完全随机的全是噪点的图片开始。然后,将这个图片连同我们的提示词或描述一起提供给训练过的 AI 模型。
模型通过它训练时学会的规律,通过一步步去除噪点使最后生成的图片符合我们的描述。
例如,如果我们想生成一个绿色香蕉的图片,AI 会从全是噪点的图片和提示词“绿色香蕉”开始,先创建一个粗略的绿色水果的表现,并通过每次迭代改进图像,直到获得一个清晰的绿色香蕉的图片。
课程链接:
www.coursera.orgAndrew 老师太逗了。