即刻App年轻人的同好社区
下载
App内打开
天秤星语
6关注0被关注0夸夸
天秤星语
7月前
收藏学习一下

知骤: 安利李宏毅老师的Agent课程:https://www.youtube.com/watch?v=M2Yg1kwPpts 可以作为快速入门Agent的课程来看,课程内容不算硬核,非技术同学也可放心食用。 如果觉得时间不够,也可以快速浏览下我做的笔记: Agent:人类只给目标,ai自己想办法达成 - Goal:reward,人为给定 - Observation:当前状态 - Action:根据当前状态采取行动,改变环境从而产生新的Observation 类比RL框架:learn to maximize reward,需要对每一个任务训练一个模型 LLM-based agent - Goal:prompt - observation:环境转化成语言(或图片),拼接到prompt中 - action:一段文字描述,并转成指令 优势: - llm-based输出action更加灵活,可以使用各种工具 - typical agent需要定义reward,有大量magic number;llm-based agent不需要reward ai agent发展历程: - 浏览器图像输入,CNN处理,输出按钮点击 - World of Bits: An Open-Domain Platform for Web-Based Agents (ICML, 2017) https://proceedings.mlr.press/v70/shi17a/shi17a.pdf - 古早语言模型 - Mind2Web:https://arxiv.org/abs/2306.06070 - WebArena:https://arxiv.org/abs/2307.13854 - 用AI训练模型 - AIDE: The Machine Learning Engineer Agent https://arxiv.org/abs/2502.13138 - AutoKaggle: A Multi-Agent Framework for Autonomous Data Science Competitions https://arxiv.org/abs/2410.20424 - AI co-scientist - https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/ - llm agent - 2023年:autogpt - 2023年:斯坦福小镇(群体智能)、Minecraft的ai npc - openai operator/claude compute use:让ai使用电脑,举例: - goal:订披萨 - observation:浏览器状态 - action:点什么键等 交互方式: - 回合制 - 即时:模型执行过程中,外界环境改变,这时模型需要能够快速反馈更改执行策略。比如语音对话场景。 - 实时语音模型survey:https://arxiv.org/abs/2503.04721v1 llm agent(没有任何模型被训练)关键能力: 1、memory read模块做与当前情景相似search,search出相关的memory(见P1) 与RAG一样,唯一区别是RAG存在memory中的内容是别人的经历/全网信息 - benchmark:StreamBench,https://arxiv.org/abs/2406.08747 - knowhow:正面例子比负面例子有用得多 完整架构: read write:只记录重要的事情(可以也是一个ai agent) reflection:对过去记忆整理(可以也是一个ai agent),也可以建立一个知识图谱 - GraphRAG:https://arxiv.org/abs/2404.16130 - HippoRAG:https://arxiv.org/abs/2405.14831 (见P2) 更多论文: - MemGPT:https://arxiv.org/abs/2310.08560 - Agent Workflow Memory:https://arxiv.org/abs/2409.07429 - A-MEM: Agentic Memory for LLM Agents:https://arxiv.org/abs/2502.12110 2、tool 常见工具: - 搜索引擎 - python代码 - 其他软件服务 - 其他ai模型 怎么使用工具? - function call 调用现成函数:见P3 - MCP 调用其他ai模型: 详见P4 询问llm这段音频说了啥。system prompt中需要包括左边这一系列可调用语音模型的介绍。 llm会生成调用各个语音模型的python代码,执行即可得到最终答案 工具很多怎么办? 和memory一样做search,工具选择模块! 见P5 - https://arxiv.org/abs/2310.03128 - https://arxiv.org/abs/2502.11271 AI自己打造工具:见P9 - TroVE: https://arxiv.org/pdf/2401.12869 - LATM: https://arxiv.org/abs/2305.17126 - CREATOR: https://arxiv.org/abs/2305.14318 - CRAFT: https://arxiv.org/abs/2 工具是否会犯错? - 工具知识与模型本身知识差别越大,模型就越不容易相信 - 模型对自身知识的信心越高,就越不容易被动摇 https://arxiv.org/abs/2404.10198v1 - 模型更容易相信ai生成内容(较于人为内容)https://arxiv.org/abs/2401.11911 - 模型更容易相信更新发布的内容 https://aclanthology.org/2024.bl - 文章来源不会影响 - 文章排版方式会有影响 3、planning 根据observation做规划 https://arxiv.org/abs/2305.04091 根据observation实时更改规划 见P6、P7 llm做规划能力: - https://arxiv.org/abs/2201.07207 - benchmark:PlanBench https://arxiv.org/abs/2206.10498 https://arxiv.org/abs/2305.15771 - benchmark:TravelPlanner https://arxiv.org/abs/2402.01622 - 让llm能使用现成的solver工具,正确率大大提升 https://arxiv.org/abs/2404.11891 强化ai agent的规划能力 - 与实际环境互动,bfs/dfs暴力搜索。见P8 - 暴搜+做剪枝 https://arxiv.org/abs/2407.01476 - 有些动作覆水难收:虚拟环境内演练,需要有world model来模拟真实环境可能的反馈 https://arxiv.org/abs/2411.06559 - 过度深度思考的危害:https://arxiv.org/abs/2502.08235

00
天秤星语
2年前
大佬nb!

歸藏: 很多朋友最近老问我一些我之前写过的东西在哪里,所以整理了一下写个置顶贴,内容会定期更新: 1️⃣ 我运营的 AIGC 周刊每周一更新,主要内容是上周 AI 领域的重点动态解析以及相关的产品和文章: https://op7418.zhubai.love/ 2⃣️ 我的Midjourney作品汇总和对应的提示词: https://walling.app/kDaEnjcPrTTkWyNieSaG/e6adb8e8978fe79a84aie5a381e7bab8 3⃣️ 我开发的一些产品 帮你将 Midjourney 的图片和提示词快速收集到你的 Notion 数据库中: https://mp.weixin.qq.com/s?__biz=MzU0MDk3NTUxMA%3D%3D&mid=2247483980&idx=1&sn=b94634a77f376ab236ac69e363c78dad&chksm=fb304ab5cc47c3a3a6e7a063fef38c6380ab4847f01bbbdafe1fbba05e1bfca1e9d519a7d501&token=818327269&lang=zh_CN#rd 帮你自动分段翻译 Midjoureny 官网的提示词: https://mp.weixin.qq.com/s?__biz=MzU0MDk3NTUxMA==&mid=2247483890&idx=1&sn=637a55296b1d06dc9ac1d2ac0b1ea36c&chksm=fb30490bcc47c01da27121cd83e2cf2ce1768208d908c638869517f60dda037651615e6dda43#rd 利用 ChatGPT 自动监控对应领域的信息并处理和发送到Discord 频道: https://op7418.zhubai.love/posts/2251721691841511424 4⃣️ 我写的一些教程 AI 歌手系列课程教你使用和训练自己的 AI 歌手模型: https://mp.weixin.qq.com/s?__biz=MzU0MDk3NTUxMA==&mid=2247484118&idx=1&sn=c6d885bb0fa18664cc9741c02d1419e7&chksm=fb304a2fcc47c3399bb188d66c88aa2512dd4bc6f6dea339bcf844865b5453807733d845c51a#rd https://mp.weixin.qq.com/s?__biz=MzU0MDk3NTUxMA==&mid=2247484139&idx=1&sn=e83b92658043e7284b27cc7ae139d65d&chksm=fb304a12cc47c304a774e26a27f2156684a93b2628a7dc87b875a2b08b51e2780d939bdb9e22#rd Stable Diffusion 保姆级入门教程包括 Web UI 的部署和 LoRA 模型的使用: https://op7418.zhubai.love/posts/2238998671356555264 https://op7418.zhubai.love/posts/2239983151969951744 Stable Diffusion 模型大神工作流解析: https://mp.weixin.qq.com/s?__biz=MzU0MDk3NTUxMA==&mid=2247484202&idx=1&sn=de466e69e6d77c8615bab48e180af43f&chksm=fb304bd3cc47c2c5aaecb68fa8121e0bfe55062102aa552d68e045269c3e19b6545a1fad779b#rd https://web.okjike.com/originalPost/6453c35b174fdd04a7ad6d3f 教你十几分钟不用代码创建自己的AI应用 https://mp.weixin.qq.com/s?__biz=MzU0MDk3NTUxMA%3D%3D&mid=2247484218&idx=1&sn=48b05cef956e2d28f457f3dfc84d252d&chksm=fb304bc3cc47c2d5cbf3e3141bb1f2a6f01b9e4648746c01867340698aca8a3a84ecb3b89321&token=818327269&lang=zh_CN#rd

00
天秤星语
2年前
感谢分享

DaweiMa: 分享一些我常用的提升开发效率的工具: #AI工具 GitHub Copilot:能极大的提高效率,不仅能在编辑器中根据代码上下文自动编写代码,还能以ChatGPT对话的方式回答问题。有了它,极大的降低了对StackOverflow的依赖。 ChatGPT:虽然GitHub Copilot以及能在写代码方面平替ChatGPT,但ChatGPT的GPT4 V的识图功能、DALL E3的绘图功能、移动端的语音对话功能都是GitHub Copilot无法替代的。用ChatGPT绘图或练英语还是很方便的。 https://v0.dev/:Vercel出品的AI画UI的神器,试了下,的确能大幅度降低画UI的工作量,相比ChatGPT直接生成代码,V0能以可视化的方式修改界面,这是ChatGPT无法做到的。 #开发工具 VSCode:因为免费轻量级,哪怕是安装了很多插件,速度也比IDEA快。当然如果开发Java的话,IDEA还是更胜一筹。 DBeaver:数据库连接工具,主打免费可连接多种数据库。 pgAdmin4:管理PG数据库的工具,比DBeaver在PG的管理上更强一点。 云平台 GitHub:虽然你对GitHub估计很熟悉了,但也推荐看这篇文章:善用GitHub(https://www.bmpi.dev/self/use-github-better/)。 Cloudflare:Serverless最好的平台,能提供如常用的存储R2、KV数据库、CDN、Pages、Worker、MQ、甚至运行AI模型,我开发的个人产品(https://www.i365.tech/)大多都用它运行的。 Vercel:很适合部署运行Next.js的前端项目,Cloudflare Pages运行Next.js还需要额外的一些配置。 Fly.io:非常好的容器化平台,它能弥补Cloudflare只能运行Serverless的不足,能以Docker的方式运行各种重型API服务。 AWS/Azure/GCP:作为一个巨无霸的云平台,他们可以补充上面云平台所缺失的东西,比如AWS SES就是一个非常好的发邮件服务。 Newrelic:非常好的监控平台,尤其是它能作为免费的日志搜索平台,我把我产品的系统日志都上传到这个平台,然后对日志进行监控。一般的日志平台都是ES架构,价格并不便宜,单Newrelic却能免费。 Optimizely:一个不错的feature toggle平台,可以很方便的做产品的A/B测试。 #分析工具 Umami:GA的开源平替,我网站流量都是用它监控的,速度快,数据还是自己的。 Plausible:更高级的GA开源平替,比Umami提供更多功能,但托管所需服务比较多,前者能免费跑在Vercel平台上。 Mixpanel:更更高级的GA商业平替,能做很复杂的用户行为分析与溯源,比GA高级多了。 支付平台 Lemonsqueezy:出海必备的支付平台,用国内身份就可以开通,然后开启出海之旅,赚美刀。 Stripe:相比前者,虽然费率便宜一些,但国内身份没发开通,需要做一些比较复杂的操作才能开通,比如开通一个美国或香港公司就可以开。 #绘图工具 Excalidraw:非常好用的白板画图工具,适合个人使用。 PlantUML:一个支持文本绘制类UML图的工具,可以在Real World Plantuml找到很多用它实现的图。 Mermaid:通过文本生成各种UML图,最大的亮点是GitHub官方Markdown支持它,能渲染出多种图形如时序图与架构图等。 asciiflow:能简单的免费在线绘制ASCII风格图的网站,C语言大佬最爱的RFC风格绘图工具。 Sketch/OmniGraffle/Lucidchart/Draw.io/Google Drawings/Visio:这类工具相比大家或多或少用过,都是一些桌面端或浏览器常用的画图工具。 #综合工具 Logseq:OKR + GTD + Note => Logseq(https://www.bmpi.dev/self/okr-gtd-note-logseq/),看完这篇文章,你会知道我为何而推荐这个工具,能做笔记、能规划任务或做OKR啥的。 Beancount:完美记账工具,配合Git能做到数据安全可控,可以看这篇我写的文章:使用Beancount管理家庭财务(https://www.bmpi.dev/self/beancount-my-accounting-tool-v2/),谁再给你推荐记账工具,请把这篇文章扔给他们看。 #浏览器插件 AdblockPlus:这款插件可以自动屏蔽网站里的绝大多数广告,无需额外复杂的配置,安装好即可。 沉浸式翻译:搭配OpenAI的API Key可以做到非常完美的多语言网页翻译,读外文资料无障碍。 Internet Archive:网页时光机,很多网页因为时间很久的缘故可能无法访问(404),这个插件可以帮助我们找回这个页面,甚至可以像时光机一样查看网页不同时期的版本。 Screely:截屏工具,主要是能美化截屏界面,让其不再难看,比如加点背景。 wappalyzer:查看网站技术栈,比如使用它一些主流网站的技术栈。 SimilarWeb:查看网站PV流量的工具,但是结果有时候准确,有时候偏差挺大的。 SEOquake:查看网站的SEO相关的信息,如外链数量、索引数量、SEO的站内问题等。 Keyword Surfer:关键词工具,可以查看一些关键词的月搜索量。 META SEO inspector:网页Meta信息查看工具,可以方便地解决一些网页SEO的基本问题。

00
天秤星语
2年前
了解了解

rosicky311_明浩: 当下(2023年9月)国内外AI行业状态大致是什么样的可能看下这几篇内容就能有一个不错的基础认知: 1、《全球最火的50个AI应用都是哪些?》---A16Z A16Z根据流量统计的当下最热的50个AI应用,并对这些应用进行了分类和分析(是否拿了VC钱,大公司还是小公司,助手/伴侣/内容生成/模型中心、用户付费意愿、APP还是web);以及这50个应用中其实不止一个是中国团队…… https://mp.weixin.qq.com/s/XUfXQzKDVOiUeOwQ1Fg92w 2、《行业图谱 | 2023年中国AIGC行业图谱V3.0》---非凡产研 不到一年的时间,非凡的这个AIGC图谱系列已经出到3.0了,除了几乎全部覆盖的厂商list是有用的之外,对于行业分类的划分其实也在逐渐形成共识(基础设施---通用大模型---中间层---通用应用/行业应用); https://mp.weixin.qq.com/s?__biz=MzU5Mjg5MjQ5Ng==&mid=2247507249&idx=1&sn=2619ef3bbed5be8bd576e12dcb9e1099&chksm=fe1a5a0ec96dd318c5118e86662899c7898490e1b887ed36053d0bdea7a6849f8ea963cf909e&mpshare=1&scene=24&srcid=0906DXPJ6BuihusdbF9OQ5wS&sharer_shareinfo=1f90871a7eae95db852f3065db113cb1&sharer_shareinfo_first=1f90871a7eae95db852f3065db113cb1#rd 3、《千万悬赏,81天竞赛,百度创业大赛卷出了哪些应用?》---百度 5月百度文心发布之后就举办了创业大赛,不同于行业内的一些黑客马拉松,这个比赛的时间跨度更长,参与比赛的团队更加“职业”,所以比赛最后的获奖项目基本上可以代表当下,在应用层一些相对“明牌”的尝试都有哪些。 比如最后一等奖是做文档理解和电商购物的,二等奖项目还包括PPT生成、销售AI、营销场景内容、平面设计、BOT、二次元图片生成、医疗、助手、法律等等……反过来讲,这些细分领域都已经比较卷了。 https://mp.weixin.qq.com/s?__biz=MjM5NzU2OTgyMg==&mid=2663192401&idx=3&sn=eaa96c564575b8b45c612da2e4720dc6&chksm=bd9e43208ae9ca36c26c50089178ed4659129c4461ddc7ada0cd458a14b367b8fd90de070e62&mpshare=1&scene=24&srcid=09082pWhKl31Yne6vrt80C3C&sharer_shareinfo=68f10fc10d99396d44a304dba509bb0a&sharer_shareinfo_first=9ece29f8f65471b365ac3e239598db4e#rd 4、《关于大模型和AIGC的36条笔记和真话》---创业家 创业家请了一批当下国内的大模型厂商(华为云、APUS、拓尔思、商汤、快手、360集团、清博智能、黑马天启、MiniMax、创新工场、奇绩创坛、中国信通院),组织了一次闭门会,这篇内容是这次闭门会的整理,内容很干,“暴论”也很多; 通过这篇内容你可以大致了解在当下,2B大模型这个“商业模式”在实际落地遇到的困难与挑战; https://mp.weixin.qq.com/s?__biz=MzUzNjQ1NjEzOA==&mid=2247496148&idx=1&sn=0f8e9604abf2173cfe116eb25caab1f4&chksm=faf74f71cd80c667a5ff3e307bc10333347b8ba42509b2a887a9824f25b1ac2bba3ae2ab7dab&mpshare=1&scene=24&srcid=0914EJr08BaU4bS4aYmYCEWo&sharer_shareinfo=b56158ea7530c36f9e5a6c2a40f43bbc&sharer_shareinfo_first=d2b37b3edaef3bdec5cf93da27ad8a9f#rd 5、《8.23 中国大模型「顶流群聊」笔记》---极客公园 和上面那篇文章类似,上个月阿里云联合极客公园也组织了一次闭门会,内容是张鹏老师在会后的总结,这次会议也基本聚齐了当下国内AI优秀创业者; https://mp.weixin.qq.com/s/-uCVv5SOLoZUATvqiTsdoA 6、《中美生成式AI创业与投资》---百度风投 百度风投AI应用赛道负责人温永腾最近的一次分享,主要是关于中美两地在这一波AI创业大潮中的相同与不同;因为百度风投在这一波AI浪潮中可能是投资比较猛的一家(当然,可能比不上投AI最猛的张津剑老师的绿洲),所以他们的理解和角度是值得借鉴的; https://mp.weixin.qq.com/s/Bx6Mkrd_pdLK-ICpJAoqdQ

00
天秤星语
2年前
感谢作者

ken_75Y5: 这个建议现在依旧有效 1. 阅读 Andrej Karpathy 的所有博客文章 2. 阅读 Chris Olah 的所有博客文章 2.5 阅读你感兴趣的 Distill 上的任何帖子。或者看下我列出的帖子(https://Qreydanus.qithub.io/) 3. 也许 - 参加像 Andrew Ng 的 Coursera 课程这样的在线课程 4. 绝对 - 使用 Jupyter Notebook、NumPy 和 PyTorch 编写简单的个人项目。当你完成它们时 a) 发布良好的、记录良好的代码(参见我的 github) b) 写一篇关于你所做的事情的简短博客文章(参见我的博客) 5. 下载Arx应用程序,浏览 Arxiv(机器学习预印本的在线存储库)上的论文。每天左右在通勤途中检查一下。遵循 cs.LG、cs.NE 和 stat.ML 标签。另外,请为以下作者加注星标:Yoshua Bengio、Yann LeCunn、Geoffery Hinton、Jason Yosinski、David Duvenaud、Andrej Karpathy、Pieter Abbeel、Quoc Lee、Alex Graves、Koray Kavukcuoglu、Gabor Melis、Oriol Vinyals、Jasch Sohl-Dickstein、Ian Goodfellow 和Adam Santoro。如果及时了解他们上传的论文,并浏览我提到的三个类别中论文的标题/摘要,就可以很快对 SOTA 研究有一个有效的了解。或者:开始每天浏览 Arxiv Sanity Preserver 的“热门炒作”和“最近热门”选项卡。 6. 当/如果你开始在达特茅斯进行研究时,请确保涉及深度学习的一些元素。 7. 如果可以在 PyTorch 和 TensorFlow 之间进行选择,请选择 PyTorch。你会终生感激这个决定。 8. 值得阅读的热门论文:AlexNet 论文、Alex Graves“生成序列”论文、Jason Yosinski(他是一位优秀作者)的任何论文、神经图灵机论文、DeepMind Atari 论文,也许还有 Goodfellow 的 GAN 论文,尽管我还没有读过。如果可以的话,远离 GAN。 9. 在 ML 阶段,简单问题 + 超简单实验 » 大型、多 GPU 的工作。有很多好的研究(例如,到目前为止我几乎所有的工作)都可以在一台像样的 MacBook 上完成。 10. 不要被这份清单淹没。你可能会找到更适合自己的道路。我能给出的最好建议就是重复Richard Feynman的建议:“以尽可能无纪律、无礼和原创的方式努力学习你最感兴趣的东西。”

00
天秤星语
2年前
学习学习AI艺术

歸藏: Niji官方最新推出了一系列免费的绘画课程-Niji Academy。这门实验性课程将艺术基础与人工智能技术巧妙结合。 不管AI绘画技术如何发展,要创作出精彩图像所需的学习内容决非仅限于抄写他人的提示或敷衍其间。 因此,我对Niji官方的课程选择感到非常欣喜。他们从最基础的地方开始讲起。 👇下面是第一节课程的内容: 由于篇幅很多我精简了一些内容,详细的内容可以去这里看:https://mp.weixin.qq.com/s/CxEv5NQF_wzAtqXnuNbKog 这里是第一节的课后练习:https://mp.weixin.qq.com/s/bFZz7XygW3jAHGRxmyWzlA 我也会跟着翻译这套课程的每一期笔记和相关的练习题,好我们开始第一期的内容:测量和抽象的基础知识:(如何绘制)一切的理论。 万物理论(为什么万物皆美?) 我一生中的大部分时间都是在这两幅图画之间度过的 为什么我的美术老师不认为左边那幅是 "真正的艺术"?为什么我的朋友觉得右边那幅 "无聊" (还有一些东西,似乎每个人都认为很了不起,但我就是不明白) 我可以把这一切归咎于 "品味 ,但我想知道一个全面的艺术理论。 意外的文艺复兴 基本原则:永恒的组织概念,甚至适用于你的手机相机! 上面的照片通过模糊信息来讲述一个故事。保留一些未说出的内容,给观众留下想象的空间。 你可以在Bouguereau的作品中看到同样的技巧。他并没有画出圣母的手臂,但他也不需要画:从画中的其他部分已经足够看出她有手臂。 视觉抽象 现在,你可能会想,我们如何将“抽象”应用到艺术上? 考虑以下这些句子的演变过程。 [你认为这些图片怎么样?你会如何排序它们的抽象程度?]下面四张图从左到右分别对应上面的四个提示词。 你会注意到,这个比例尺最抽象和最真实的两端都感觉奇怪。“真实”并不一定是最真实的。 真实与抽象是辩论的两种方式。 现实主义:从外向内的论证 如果看起来是真实的,那它就一定是真实的。现实主义就是通过证明来达到真实。 抽象主义:从内向外的论证 如果它像人一样走动,那么它就一定像人一样可爱。抽象主义就是通过归纳来达到真实。 那么对于超抽象的东西呢? 所以在这个背景下,你可能会说毕加索的《格尔尼卡》是难以接近的。 你挠头想,这种类型的文本有什么用呢?(除了文学“东西”) 原因1:有时候新的想法不完全成形,所以很难理解。 事实证明,像这样模糊的场景构成了赛博朋克流派的基础。多年来,《神经漫游者》的工匠们慢慢地把这些抽象的场景渲染成了每个人都能看到的“真实”。 原因2:人们愿意花大价钱来成为一个独特、新颖的想法的一部分,所以他们寻找那些故意排斥其他人的想法。(这看起来像一个有趣的概念,但在细致艺术方面,这是一个被广泛接受的想法。)毕加索本人就以在成为一个优秀的艺术家的同时,也是一位非常出色的销售员而闻名。 这是两个具有相同基础原理但表达两种非常不同观点的概念。所以,不要担心发展“风格”。剥去“风格”的外衣,学习组织视觉信息的方式。无论看起来如何,它的核心都只是主题、动词和对象。与其关注文本的信息,或者甚至是文本的写作方式,不如学会欣赏语言的声音。一旦你做到了这一点,你就能画任何东西! 这个课程比国内一堆卖几千美元的课程强一万倍,如果你真的想要学好画画,不管是自己用笔画还是用AI画我都推荐你看这一套课程。

00
天秤星语
3年前
感谢,收藏学习

Diiiii: 能够用大白话把GPT以及大模型的原理讲清楚,讲得让小白也能理解,但又能保留精髓而不做过份的简化,并没有那么容易。这里整理一些面向 零基础小白 或 非人工智能方向从业者的、个人觉得非常有帮助的普及型内容: 1. 播客:《大白话聊ChatGPT(Sarah&王建硕)》,适合零基础小白 https://www.xiaoyuzhoufm.com/episode/641183b5bb1fc0cb68f810c6 2. 文章:《ChatGPT为啥这么强:万字长文详解 by WolframAlpha之父》,适合零基础小白 https://zhuanlan.zhihu.com/p/606817644 3. 视频:《【渐构】万字科普GPT4为何会颠覆现有工作流;为何你要关注微软Copilot、文心一言等大模型》,适合零基础小白 https://www.bilibili.com/video/BV1MY4y1R7EN/ 4. 视频:《手把手从头实现GPT by Andrej Karpathy》,适合有基本编程概念的初学者 https://www.bilibili.com/video/BV1E14y1M75n/ 5. 课程:《李宏毅2023春机器学习课程》,适合有简单线代和编程基础、想要系统学习Machine Learning的用户 https://www.bilibili.com/video/BV1TD4y137mP/ 6. 论文讲解:《跟李沐学AI:GPT-4论文精读》以及同系列的其他视频,适合有简单机器学习基础的用户(跳过数学公式部分,理解论文精华即可,并不是非常困难) https://www.bilibili.com/video/BV1vM4y1U7b5/ 总之,理解GPT和大模型的基础原理并没有那么困难,最好的办法就是亲力亲为,动手实操,再不济也可以通过上述这些内容来做一些了解。听《张小珺 商业访谈录》最新的一期播客,听到清流资本的梦秋说自己“每天忙着对自己的大脑进行预训练”,以“互联网时代从未有过的忙碌”学习,恨不得比高考还拼,不禁深有同感。 科技的发展正在加速,“终身学习”已经变成了better have变成了must have。在这个时代,“你只有不停奔跑,才能停在原地”。

00