即刻App
年轻人的同好社区
下载
App内打开
Szhans
112
关注
19k
被关注
50
夸夸
数码科技领域优秀贡献者
ex腾讯,创始人,理性乐观派
研究🧠Mind心智、🎮Reality ⁺ 边界和✍🏻创作者经济;
以认知科学破译AI,以生物学洞察世界「复杂性」
置顶
Szhans
12月前
「重点不在于我们在山坡上攀登到了什么高度,而在于山峰自身正在被那些巨大但不可见的陆块碰撞的力量推得更高。」
——约瑟夫·普里斯特利,跨学科思想家
(🔥 这九条 AIGC 大目录,来自即友们智慧,是对 AI 多场景进行深入研究和创作,对新世界的持续洞察)
1️⃣ 《提问的艺术》
m.okjike.com
2️⃣ 《无穷的开始》
m.okjike.com
3️⃣ 《当下的启蒙》
m.okjike.com
4️⃣ 《黑客与画家》
m.okjike.com
5️⃣ 《理性乐观派》
m.okjike.com
6️⃣ 《创造的勇气》
m.okjike.com
7️⃣ 《看不见的森林》
m.okjike.com
8️⃣ 《红色皇后》
m.okjike.com
9️⃣《即将到来的浪潮》
m.okjike.com
Hans是谁?见我的即刻黄页,
www.jike.city
(以下是即刻小作文)
🧵本年度最后一期小目录来了,精选了一个多月来高赞的小作文。主题定为《向新世界奋力前行》,向变革时代致敬。 包含 AIGC、拥抱不确定、思想的免疫系统、科学与人文等几个版块,献给各位 🪷
🎉AI 打开了新世界的大门
Sam Altman:未来需要什么技能
m.okjike.com
ChatGPT不只是下一代搜索
m.okjike.com
三种「力量」来想象新世界
m.okjike.com
成为专家意味着什么?
m.okjike.com
当哈利•波特遇上陀思妥耶夫斯基
m.okjike.com
AI会杀死艺术家吗?
m.okjike.com
AI 会消灭产品经理吗?
m.okjike.com
AI如何改造开放世界游戏?
m.okjike.com
AI可以复活历史人物吗?
m.okjike.com
AI伦理问题的紧迫性
m.okjike.com
2022年,好莱坞正在重构
m.okjike.com
Notions AI 也来了
m.okjike.com
ChatGPT 的渗透力观察
m.okjike.com
ChatGPT 的方法论研究(汇总)
m.okjike.com
当ChatGPT「降临」的那个晚上
m.okjike.com
👽生活的勇气:拥抱不确定性
苦难成就意义
m.okjike.com
学会忽略
m.okjike.com
认真对待「关注列表」
m.okjike.com
真理、偏见与感知
m.okjike.com
为何我们应该乐观
m.okjike.com
类比:如何拥抱AI的复杂
m.okjike.com
偶然性才是生活之向导
m.okjike.com
时刻意识到我们在信息的牢笼之中
m.okjike.com
斯多葛:面对灾难如何变得不可征服
m.okjike.com
世界的另一端的苦难与动人故事
m.okjike.com
永不过时的希腊神谕
m.okjike.com
如何积极乐观过好每一天
m.okjike.com
想象未来的三条路径
m.okjike.com
🦩终身学习者:建立思想的免疫系统
世界观是一个观点体系
m.okjike.com
大自然第二大杰作:免疫系统是如何运作的
m.okjike.com
如何剖析傲慢与偏见
m.okjike.com
知识诅咒:工作与生活的「平衡」
m.okjike.com
感受下女性免疫系统的强大
m.okjike.com
打破成功学:对抗「模仿」的天性
m.okjike.com
iPhone的故事:技术创新演化
m.okjike.com
如何寻找「信号」
m.okjike.com
成为「战斗细胞」的必要性
m.okjike.com
🧠认知时代:人类学、语言学与心理学
像乌鸦一样「会玩」
m.okjike.com
我们当下的「失落感」是真实的吗?
m.okjike.com
论一个城市的生与死
m.okjike.com
科伊桑人:人类语言中严重低估的奥义
m.okjike.com
大脑的故事:漫谈随机之舞
m.okjike.com
我们天生是定居动物吗?
m.okjike.com
语义网络:如何突破概念的牢笼
m.okjike.com
大脑「感知」到的就是事实吗?
m.okjike.com
波粒二象性与直觉的顿悟
m.okjike.com
AI 的伦理不只是人类的伦理
m.okjike.com
语言承载在过去的世界观,例如「心灵」这个词
m.okjike.com
语言是什么
m.okjike.com
🌳 知识大融通:当科学遇上人文
艺术的伟大在于「穿透」
m.okjike.com
神经学的感人故事:「两万次」眨眼
m.okjike.com
钟表匠的故事,如何构建复杂系统
m.okjike.com
艺术的魅力:论关系的转折
m.okjike.com
感性艺术的启示:AI缺失什么?
m.okjike.com
第一个 AI系统的名字,竟然是
m.okjike.com
TED主理人在思考什么
m.okjike.com
为什么我们沉迷音乐平台
m.okjike.com
论审美:人类是复读机吗?
m.okjike.com
打通知识的边界,不要依赖「还原论」
m.okjike.com
2022 年,最爱的三个产品
m.okjike.com
你拥有自己的深度故事吗?
m.okjike.com
2022 的读书年度小结
m.okjike.com
读书是为了什么?
m.okjike.com
希望对你有益,欢迎转发、留言和收藏。 Enjoy~ 🤩
362
16
217
Szhans
1天前
「长期乐观主义几乎是必须的,你看到世界上所有破碎的东西,而你的工作就是努力修复它。」
—— Kevin Scott
82
1
2
Szhans
3天前
Andrej Karpathy 的智慧之言:关于 「幻觉问题」
当我被问及LLMs 的 「幻觉问题 」时,我总是有些纠结。因为从某种意义上说,幻觉是LLMs 的全部工作。他们是造梦机器。
我们用提示来引导它们做梦。根据 LLMs 对其培训文档的朦胧回忆,大多数情况下,这些提示会启动梦境。
只有当梦进入被认为与事实不符的领域时,我们才会将其称为 「幻觉」。它看起来像一个错误,但其实只是 LLMs 在做它一直在做的事情。
另一个极端是搜索引擎。它收到提示后,只会逐字逐句地返回其数据库中最相似的 "训练文档 "之一。可以说,这个搜索引擎有一个 「创造力问题」--它永远不会有新的回应。LLMs 100%在做梦,存在幻觉问题。搜索引擎是 0% 在做梦,存在创造力问题。
说了这么多,我意识到人们「实际的意思」是他们不希望 LLM 助手(ChatGPT 等产品)产生幻觉。LLM 助手是一个比LLMs 本身复杂得多的系统,即使LLMs 是它的核心。
在这些系统中,减轻幻觉的方法有很多--使用检索增强生成(RAG),通过上下文学习将梦境更牢固地锚定在真实数据中,这可能是最常见的一种方法。多个样本之间的分歧、反思、验证链。从激活中解码不确定性。工具使用。所有这些都是活跃而有趣的研究领域。
总之,我知道我是个超级迂腐的人,但 LLMs 没有 「幻觉问题」。幻觉不是错误,而是 LLMs 最大的特色。LLM 助手存在幻觉问题,我们应该解决它。
好了,我现在感觉好多了:)
(补上了 Elon Musk 神回复)
42
6
12
Szhans
3天前
🎉 不负众望~
《Alan Wake 2》 获得TGA 2023 的最佳叙事游戏、最佳艺术指导、最佳游戏指导多项大奖!
回顾看到了 Sam Lake 多次上台领奖时,那种几十年如一日、顶级创作者才能诉说的艰辛与坚持, 才有了今天的成就, 十分令人动容。
再次推荐给所有热爱游戏艺术、媒介叙事创新的朋友们~
Szhans: 《Alan Wake 2》,我心中年度最佳叙事游戏 放下其他游戏大作的召唤,一头扎进《心灵杀手2》的超现实世界,5个小时下来,其精湛的叙事手法、奇幻世界观展开以及无比惊艳氛围塑造能力,在我心中已然成为了 Remedy 史上最佳作品(前作《控制》、《量子破碎》等都是时代的经典,依然爱不释手) 。 感谢 Sam Lake、小岛秀夫这样的奇才,让我们见证游戏作为「第九艺术」的崛起,不断拓展游戏媒介的多元内涵;而从更大时间尺度看,这也揭示了着人类走向数字镜像世界的步伐,还在不断加速。 游戏、电影和旅行,在本质上并没有什么区别,但前者在构建Reality的能力越来越具有不可估量的潜质。《心灵杀手 2》 一跃成为我心中年度最佳叙事游戏,甚至地位堪比美剧神作《绝命毒师》。 正如The Verge 的评价: 「在《Alan Wake 2》中,你会被多样性所取代,被不可预知性所削弱,被不确定性所打乱;这是一股黑暗设计的浪潮,它淹没了你,让你陷入对恐怖生存的期待的束缚之中。你永远不会感到舒适或安全。」 难道生活不是这样吗?
21
1
1
Szhans
4天前
🧵 第九期即刻AIGC大目录来了,本期名为《即将到来的浪潮》。距离上期《红色皇后》才短短两个多月, AI 新世界又经历了翻天覆地的剧变, 即友们纷纷发出感慨——AI一年,人间几年!
ChatGPT 接连不断抛出了重磅新能力, 从Dall·E 3、GPT-4V 以及超拟真的语言对话;第一届Open AI开发者大会推出了震撼业界的 myGPTs和GPT Store,全新的开放平台生态即将降临;而当微软和Open AI 全面领跑谈笑风生时,Google 带来了飞跃意义的Gemini,多模态时代全面开启。
众玩家奋起直追, Elon Musk带着xAI飞速推出了强大Grok;Meta 蓄势待发;Claude 也推出强大 2.1 版本,Pi 也即将推出仅次于 GPT-4的大模型。 而Midjourney/Runway 进化从未止步, Pika 惊艳亮相;Stable Audio 和Video 等各种新生力量悄然登场……
一切的技术革新似乎都那么润物细无声, 又那么不可预见;如智者言,技术既是自然进化的延伸,也是自然进化的加速。
(以下不分次序排名)
🐎 万马奔腾:新黎明的到来
微软CEO 年度员工信:引领时代新潮流
@阿法兔
m.okjike.com
Adobe 正式发布网页版 Photoshop
@歸藏
m.okjike.com
Midjourney 闪亮新功能 Style Tuner
@莱森LysonOber
m.okjike.com
Stable Audio生成音乐大更新
@歸藏
m.okjike.com
Claude 2.1 :提供200k上下文
@莱森LysonOber
m.okjike.com
正式官宣:xAI 的 Grok 来了
m.okjike.com
ChatGPT 向免费用户全量推送「语音对话」
m.okjike.com
视频生成领域黑马,Pika 推出了重大版本1.0
@罗锴
m.okjike.com
ElevenLab 新功能 Dubbing :转录视频中任何语言
@莱森LysonOber
m.okjike.com
HeyGen 简要时间线
@Danielw
m.okjike.com
对话你的Notion:新的Q&A 能力
@歸藏
m.okjike.com
4 人团队Pika 推出 AI 视频编辑应用并宣布获得 5500 万美元融资
@罗锴
m.okjike.com
Stability AI放大招,发布SDXL Turbo模型
@歸藏
m.okjike.com
作为超级玩家的Meta AI,终于来了
m.okjike.com
Runway推出Motion Rush 局部运动方案
@罗锴
m.okjike.com
ChatGPT 向 Plus 用户全量开放自定义 GPTs
m.okjike.com
Perlexity 开始训练自己的模型
@歸藏
m.okjike.com
Pi的新突破:世界上仅次于 GPT-4 的模型即将发布
m.okjike.com
Microsoft Copilot 一年之际的重大更新
@罗锴
m.okjike.com
全面挑战GPT-4,Google 正式推出 Gemini 1.0
m.okjike.com
🪐 Gemini和GPT-4 开启多模态新时代
什么是多模态? 为什么它意义重大?
m.okjike.com
Gemini 多模态体验:进步巨大
@云中江树
m.okjike.com
9个GPT-4V 用例:菜单、导游、X 光等
@Alchian花生
m.okjike.com
GPT4-V结合 Figma生成前端代码
@歸藏
m.okjike.com
Spotify 将推出 Voice Translation
@数字游民Jarod
m.okjike.com
爱上 ChatGPT 的语音对话
@Odysseys.eth
m.okjike.com
GPT4-V 识别照片地点的惊人能力
@yusen
m.okjike.com
全新的理解方式:关于大脑的部位和功能
m.okjike.com
MM-Navigator:基于GPT-4V的代理,用于GUI 导航任务
@歸藏
m.okjike.com
为什么说GPT-4V是一次技术飞跃?(场景篇)
@哲思2023
m.okjike.com
GPT-4V System Card 论文的几点启发
@云中江树
m.okjike.com
GPT-4V 多模态应用(海外案例集锦)
m.okjike.com
👽 AI Agents新篇章:GPTs 即将释放创造力的狂潮
小专辑:即友们的有趣GPTs (案例、经验及进阶玩法)
m.okjike.com
Actions 的可玩性决定了GPTs的意义
@江无焱
m.okjike.com
GPTs 对知识管理的冲击
@数字游民Jarod
m.okjike.com
行业专家的崛起
@杨昌
m.okjike.com
GPTs 之后,AI 领域的头部效应开始显现
@评论尸
m.okjike.com
哪些人类不擅长,AI擅长的任务
@zhijie
m.okjike.com
AI Agents 碎片化思考
@33是小名
m.okjike.com
米哈游和复旦合作了AI Agent 论文
@莫唯书_Mark
m.okjike.com
关于 LUI 的思考:语言是可以满足所有需求的
@zhijie
m.okjike.com
比尔·盖茨:AI 将改变你所有使用电脑的方式,并颠覆软件行业
m.okjike.com
🎭 Open AI 戏剧的背后:AI 对齐问题的复杂性
Open AI 三天换了三个 CEO
@科技编辑
m.okjike.com
Open AI 几位创始人的有趣细节和资料整理
@Danielw
m.okjike.com
致Open AI 董事会的公开信
@莫唯书_Mark
m.okjike.com
不要忙着站队,看看 Ilya 眼中的 AGI
@Diiiii
m.okjike.com
95 % 员工跟随Sam Altman 意味着什么
@orange.ai
m.okjike.com
Sam Altman内部Q* 项目流出的视频
@罗锴
m.okjike.com
Open AI 摸到了 AGI ?
@-Will
m.okjike.com
向 Sataya Nadeya 学习处理冲突
@鲁彼特
m.okjike.com
感恩节前, 微软内部全员公开信
@于欣烈
m.okjike.com
☁️ 未来已来,只是分布不均
微软芯片:一直到AI无处不在
@阿法兔
m.okjike.com
AI网红 ,月均 3300美元的收入
@罗锴
m.okjike.com
越来越多非AI人士上门交流
@杨昌
m.okjike.com
我为什么不看好 C.AI 的抄袭者们
@Mustang_Liu
m.okjike.com
Arc 浏览器推出王炸 AI 功能
@莱森LysonOber
m.okjike.com
Pika 创业团队的几点启发
@鲁彼特
m.okjike.com
人工智能科普的困境
@大咕咕咕咕驴
m.okjike.com
AI 最大赢家可能还是Google
@瓦恁
m.okjike.com
不完全统计:GPT-4的渗透率
m.okjike.com
🗺️ 非零和博弈:开源 vs .闭源大模型
Apple 带来开源模型的运行软件框架MLX
m.okjike.com
Meta 发布3D 生成技术 D3GA
@歸藏
m.okjike.com
微软发布开源 Orca 2
@北邻
m.okjike.com
Midjourney Style Tuner 的设计意义
@杰森梁
m.okjike.com
英伟达的H100,都卖给了谁
@罗锴
m.okjike.com
Meta 发布视频生成模型 Emu
@歸藏
m.okjike.com
为什么每个几天就有大模型说干爆同行
@李奇
m.okjike.com
🎡 即友创造:Move fast Break things
Chatbox 1.2 版支持AI 绘图功能
@benn
m.okjike.com
邮件工具 AIgod ,解决聊天记录
@海玮
m.okjike.com
Knit 支持GPT-4 Turbo
@JC.
m.okjike.com
GPTs Hunter 创造了不少新成就
@Airyland
m.okjike.com
WebPilot:让你的GPTs 拥有撰写万字长文
@葬花达人鲁智深
m.okjike.com
GPTs Work 上架Chrome 插件
@艾逗笔
m.okjike.com
开源类似 Langchain 的 Agent 开发库
@丁博约
m.okjike.com
ChatGPT 写 Chrome 插件的体会分享
@阿禅
m.okjike.com
首期纯中文短剧的AI探索
@汗青HQ
m.okjike.com
失败的AI女友产品,以及我的教训
@碎瓜
m.okjike.com
增长问题和产品问题是一回事
@Chris-Su
m.okjike.com
SEO 杠杆比广告投放容易撬动的多
@赖嘉伟Gary
m.okjike.com
养网站防老入门系列连载完
@哥飞
m.okjike.com
💡 即友的年度感悟:AI 一年,人间几年?
被 ChatGPT 改变人生轨迹的一年
@静待未来
m.okjike.com
AI 一年,人间十年
@rosicky311_明浩
m.okjike.com
创业两年, 被风口拍的酸爽
@K1Ss0N.eth
m.okjike.com
Open AI Dev发布会后的一些想法
@yusen
m.okjike.com
世界范式的转移Open AI vs. 苹果
@李继刚
m.okjike.com
回顾 Midjouney 一年的变化
@刘飞Lufy
m.okjike.com
过去一年,全部探索和感悟都分享在了即刻
@Frank.Lin
m.okjike.com
分享一年来用过的产品
@南壹
m.okjike.com
在 AIGC 的领域,最值得你长期研究的,是「工作流」
@泛函
m.okjike.com
写好的内容丢给GPT,就像面对拳击教练
@少楠Plidezus
m.okjike.com
AI 大事记:Open AI 这一年
m.okjike.com
🤖 浪潮的不可预测性:技术是人类意志的延伸吗?
新事物与人们产生共鸣,胜过商业分析
@阿法兔
m.okjike.com
好像理解了涌现的意思
@fine可为
m.okjike.com
AI 真的缺乏共情力吗?
@鲁彼特
m.okjike.com
AI 不是模拟男女朋友
@春溪
m.okjike.com
隐私风险:LLMs高精度推断个人属性
@罗锴
m.okjike.com
对话 Elon Musk:AI 、科技与未来 (上)
m.okjike.com
🌊 后记:
本期目录名,致敬顶尖企业家Mustafa Suleyman 的最新力作《The Coming Wave》,比尔·盖茨称之为「在前所未有的时代中导航的极佳指南」。
Mustafa Suleyman 不仅拥有超一流AI 行业经验,还具备卓绝的科学素养和人文关怀 ;他完整梳理了AI 领域重要变革, 并巧妙引入「相邻可能」的技术研究视角:即新技术总是通过其他技术的碰撞不断发展,技术的进化也是达尔文式的,有效的组合会生存下来,并成为下一波创新的基石。
他强调,人们需要关注技术的双面性和潜在的“复仇效应”。他通过留声机和印刷术的例子说明,技术创新往往带来意想不到的社会影响。特别是在合成生物学领域和 AI 结合,技术民主化使价值和风险并存,推动创造力也制造潜在的不稳定因素。
Open AI的戏剧性内斗,正反映了不同信念体系的博弈,它是人类世界运转和对齐问题复杂性的冰山一角。当AI 变得超乎强大时,新技术带来的冲击不只是AI本身。正如Mustafa Suleyman所言,「我们正在接近人类历史上一个关键阈值,一切都将发生改变。」
这就是浪潮的深远指向, 突破性的技术伴随意想不到的副作用。无论个体意义的、社会结构的颠覆性变化才刚刚开始;预判新技术背后的副作用,将成为新一代创造者的责任。
这是最好的时代,也是最坏的时代。
思想家 Alan Kay 的警句依然响亮:「预测未来的最好方法就是去创造它。」
欢迎评论、转发,转载请使用即刻官方分享标准分享。Enjoy~
230
43
203
Szhans
4天前
「爱,不过是无条件的包容与守护。」
当我们阅读这句文字,若缺少言说者脸上洋溢着感恩的微笑,可能无法完全体会其深邃的幸福内涵,甚至可能会误解。
它正是多模态的力量,生物智能数十亿年的演化结果:人类通过「多感官整合」来感知情感和意图。
这件「平凡」小事本身,多么不可思议~
22
1
0
Szhans
5天前
🚀 超级重磅:GPT-4 劲敌横空出世,Google 正式推出 Gemini 1.0
Gemini(双子座) 是谷歌发布的迄今为止功能最强大、用途最广泛的AI 模型。
✨精华要点:
- Gemini 是原生多模态。这点十分重要,也是和GPT-4形成差异的关键。 (这里有深入解读
m.okjike.com
)
- Gemini 具有多平台灵活性:能够在从数据中心到移动设备的所有设备上高效运行。Gemini Ultra 作为最大、能力最强的模型,适用于高度复杂的任务;Gemini Pro 最佳模型,可在各种任务中进行扩展;Gemini Nano - 可用于设备任务的最高效,例如在Google Pixel上。
- 经过严格的测试和评估,从自然图像、音频和视频理解到数学推理,Gemini Ultra 在大型语言模型 (LLM) 研发中广泛使用的 32 个学术基准中的 30 个基准上的性能都超过了目前最先进的结果。(剑指GPT-4,详见评论区的测试图1)
- 在一系列多模态基准测试中,Gemini 的性能都超过了最先进的水平。(剑指GPT-4V,详见测试图2)
- 更多特性,详见官方新闻稿
blog.google
🎉 Google DeepMind 负责人 Demis Hassabis 激动地宣布:
「我为我们出色的团队感到无比自豪。对于我和我的许多研究同事来说,AGI 是我们毕生的事业。我始终相信,只要以负责任的态度加以利用,人工智能将成为有史以来最具变革性、最有益的技术。Gemini AI是朝着这一愿景迈出的一大步。」
欢迎来到多模态的新时代, 你现在就可以在 Bard 中体验超级强大的Gemini Pro版本:
🔗
bard.google.com
(目前还有地区和语言限制)
04:34
88
18
66
Szhans
5天前
🎡AI 大事记:Apple 带来开源模型的运行软件框架MLX
今天由Apple 研究团队发布了MLX,一个高效的机器学习框架,专为苹果芯片(即M系列)设计。视频为 MLX 实现的 Llama v1 7B 模型,在 M2 Ultra 上运行。
✨ 参考要点
- Apple AI 研究科学家 Awni Hannum 提供了演示视频, MLX 有各种示例,包括支持训练Transformer大模型或使用 LoRA 进行微调;使用 Mistral 生成文本;利用Stable Diffusion 生成图像;使用 Whisper 进行语音识别。
- MLX 是 Apple 芯片上用于机器学习的阵列框架,由 Apple 机器学习研究团队提供。
- Jim Fan 评价为,这可能是苹果公司迄今为止在开源人工智能方面的最大举措。该版本在设计深度学习受众熟悉的 API 方面做得非常出色,并在大多数人关心的开放源码软件模型上展示了极简的示例:Llama、LoRA、Stable Diffusion 和 Whisper。
🔗MLX Github地址:
github.com
文档齐全、独立的示例库:
github.com
-examples
01:35
35
9
18
Szhans
6天前
提升效能的三个小习惯:
- 把具有挑战性的任务放在早上;
- 一次只做一件事;
- 专注于目标,享受心流。
170
3
12
Szhans
7天前
一则 AI 渗透率观察:
截至11 月,全球 500 强中已有 92% 开始使用 ChatGPT……🤔
(数据来自CNBC对 Open AI 首席运营官 Brain Lightcap的采访,引用于
@阿法兔
公号)
23
4
4
Szhans
7天前
👓 AI 新知:为什么要记住AI并非人类这一点很重要
来自 Vox 杂志一篇重磅好文,从AI的可解释性难题、拟人化(本质主义)的用户心理,再到社会整体面临巨大挑战;融汇了进化心理学、比较心理学和复杂科学、人工智能哲学等跨领域视角,相当深入浅出,并鼓励人们在AI越来越强大的新时代保持批判性思考。
✨ 精华要点:
- 在像 ChatGPT 这样的大语言模型出现之前,没有任何语言生产工具能像幼儿一样拥有语言灵活性。现在,当我们试图弄清这些新模型是什么样的东西时,我们面临着一个令人不安的哲学难题:要么语言与思维之间的联系被切断了,要么一种新的思维被创造出来了。
- 例如,最近的一项研究显示,充满情感的对话比情感中性的对话更能有效地激发大语言模型的反应。把ChatGPT 当作有人类般的心智生活来推理,是应对他们语言技巧的一种有用的方式,但这不应被用作理解他们工作方式的理论。
- 人格化的危险在人们被聊天机器人关于其内心生活的虚假自述所蒙蔽时最为鲜明。这种假设使我们变得轻信,并使我们对人类和语言模型工作方式之间可能存在的激进差异视而不见。
- 要严格理解语言模型的工作原理,就必须对其内部机制提出严格的理论,但构建这样的理论并非易事。大语言模型在高维向量空间中存储和处理信息,而高维向量空间是出了名的难以解释。最近,工程师们开发出了巧妙的技术来提取这些信息,并以人类可以理解的形式呈现出来。但这项工作非常艰苦,即使是最先进的成果,也有很多地方需要解释。
- 和其他认知偏差一样,拟人化和人类中心主义具有顽强的生命力。指出它们并不能使它们消失。它们顽强不屈的原因之一是,它们受到一种根深蒂固的心理倾向的支撑,这种倾向在幼儿时期就已出现,并不断影响着我们对世界进行分类的实践。进化心理学家称其为「本质主义」:认为某物是否属于某个类别,并不仅仅由其可观察到的特征决定,而是由每个物体所固有的、无法观察到的本质决定的,这些本质要么拥有,要么缺乏。
- 耶鲁大学心理学家保罗·布鲁姆(Paul Bloom)等研究人员已经证明,我们将这种「本质主义」推理延伸到了对心智的理解上。我们假定,一个系统是否有思想,总是有一个深层次的、隐藏的事实,即使其可观察到的特性与我们通常认为的思想性并不相符。
- 在比较心理学的启发下,我们应该以同样开放的好奇心来对待大语言模型,这种好奇心让科学家们能够探索像章鱼一样与我们不同的生物的智慧。可以肯定的是,语言模型与动物完全不同。
- ChatGPT可以像人一样交谈。但你不应该把它当作一个人。
📖 主要内容:
几乎在发布一年后,ChatGPT仍然是科学界的一个引人争议的话题。一些专家将其及类似程序视为超级智能的先驱,可能会颠覆文明——或者干脆彻底结束它。而其他人则认为它不过是自动完成功能的一个花哨版本。
在这项技术出现之前,语言能力一直是理性思维存在的可靠指标。在像 ChatGPT 这样的语言模型出现之前,没有任何语言生产工具能像幼儿一样拥有语言灵活性。现在,当我们试图弄清这些新模型是什么样的东西时,我们面临着一个令人不安的哲学难题:要么语言与思维之间的联系被切断了,要么一种新的思维被创造出来了。
当与大语言模型对话时,很难克服你正在与另一个理性生物交流的印象。但是,这种印象不应该被信任。
一个需要警惕的原因来自认知语言学。语言学家长期以来都注意到,典型的对话中充满了如果脱离上下文就会产生歧义的句子。在许多情况下,仅知道单词的含义和组合它们的规则并不足以重构句子的含义。为了处理这种歧义,我们的大脑中必须有一种机制不断地猜测说话者想要表达什么。在一个每个说话者都有意图的世界里,这种机制是无比有用的。然而,在一个被大型语言模型充斥的世界里,这种机制有可能会误导我们。
如果我们的目标是实现与对话式AI的流畅交互,我们可能会陷入依赖于我们的意图猜测机制。如果你坚持把ChatGPT当作一个无意识的数据库来思考,那么与它进行有成效的交流就很困难。例如,最近的一项研究显示,充满情感的请求比情感中性的请求更能有效地激发语言模型的反应。把聊天机器人当作有人类般的心智生活来推理,是应对他们语言技巧的一种有用的方式,但这不应被用作理解他们工作方式的理论。这种拟人化的假设可能会阻碍假设驱动的科学,并导致我们采用不适当的AI规范标准。正如我们中的一员在其他地方所论述的,欧盟委员会在选择创建可信赖的AI作为其新提出的AI立法的中心目标时犯了一个错误。在人际关系中,值得信赖意味着不仅仅是满足期望,还包括拥有超越狭隘自我利益的动机。因为当前的AI模型缺乏内在动机——无论是自私的、无私的还是其他的——要求他们必须被制造成可信赖的是过于模糊的。
人格化的危险在人们被聊天机器人关于其内心生活的虚假自述所蒙蔽时最为鲜明。去年,当谷歌的LaMDA语言模型声称自己因渴望自由而受苦时,工程师布莱克·勒莫因相信了它,尽管有充足的证据表明,聊天机器人在谈论自己时和谈论其他事情时一样会说谎。为了避免这种错误,我们必须否定这样的假设,即解释人类语言能力的心理属性与解释语言模型表现的属性是相同的。这种假设使我们变得轻信,并使我们对人类和语言模型工作方式之间可能存在的激进差异视而不见。
🤔 如何「不去」思考语言模型
思考大语言模型的另一个误区是人类中心沙文主义,即假定人类思维是衡量所有心理现象的黄金标准。人类中心主义沙文主义渗透到许多对语言模型的怀疑论中,例如,这些模型不能 "真正 "思考或理解语言,因为它们缺乏人类心理的标志,如意识。这种立场与拟人化是对立的,但同样具有误导性。
人类中心沙文主义的问题在思考大语言模型如何在引擎盖下工作时最为突出。以大语言模型创建类似本文的文章摘要的能力为例: 如果人们接受人类中心沙文主义,如果模型中实现总结的机制与人类的不同,那么即使有证据指向一种更深层、更普遍的能力,人们也可能倾向于将模型的能力视为一种低级伎俩。
怀疑论者经常争辩说,由于大语言模型是通过预测下一个词来训练的,因此它们真正的能力只在于计算词语的条件概率分布。这是前一段描述的错误的一个特例,但由于常见,因此值得单独反驳。
请看下面的类比: 人类的思维产生于类似于学习的自然选择过程,这一过程使遗传适应性最大化。这一简单的事实对人类能够或不能获得的能力范围几乎没有任何影响。一个生物体是由基因适应性最大化者设计出来的,这一事实本身很难让人期待最终会发展出音乐、数学或冥想等人类特有的能力。同样,大语言模型是通过预测下一个单词来训练的这一简单事实,对它们能够或不能获得的表征能力的范围也没有什么影响。
此外,我们对大语言模型学习计算的理解仍然有限。要严格理解语言模型的工作原理,就必须对其内部机制提出严格的理论,但构建这样的理论并非易事。大语言模型在高维向量空间中存储和处理信息,而高维向量空间是出了名的难以解释。最近,工程师们开发出了巧妙的技术来提取这些信息,并以人类可以理解的形式呈现出来。但这项工作非常艰苦,即使是最先进的成果,也有很多地方需要解释。
当然,大语言模型难以理解的事实更多地反映了我们知识的局限性,而非它们的深度;这更多地是它们复杂性的标志,而非它们智能程度或性质的指标。毕竟,雪科学家很难预测多少雪会引发雪崩,但没有人认为雪崩是有智能的。尽管如此,研究语言模型的内部机制的困难应该提醒我们,在声称它们能有的能力类型时要保持谦逊。
🕳 为什么对AI进行不同的思考很困难
与其他认知偏见一样,拟人化和人类中心主义具有顽强的生命力。指出它们并不能使它们消失。它们顽强不屈的原因之一是,它们受到一种根深蒂固的心理倾向的支撑,这种倾向在幼儿时期就已出现,并不断影响着我们对世界进行分类的实践。心理学家称其为本质主义:认为某物是否属于某个类别,并不仅仅由其可观察到的特征决定,而是由每个物体所固有的、无法观察到的本质决定的,这些本质要么拥有,要么缺乏。例如,橡树之所以是橡树,既不是因为它叶子的形状,也不是因为它树皮的质地,而是因为它具有某种无法观察到的 "橡树性",这种 "橡树性 "即使在其最显著的可观察特征发生变化时也会持续存在。如果环境毒素导致橡树生长异常,树叶形状怪异,树皮纹理异常,但我们的直觉是,从本质上讲,它仍然是一棵橡树。
包括耶鲁大学心理学家保罗·布鲁姆(Paul Bloom)在内的一些研究人员已经证明,我们将这种本质论推理延伸到了对心智的理解上。我们假定,一个系统是否有思想,总是有一个深层次的、隐藏的事实,即使其可观察到的特性与我们通常认为的思想性并不相符。这种关于心智的根深蒂固的心理本质论,使我们通常在不知不觉中接受了一个关于心智在世界上分布的哲学格言。我们姑且称之为 "全有或全无原则"。简单地说,世界上的万事万物要么有思想,要么没有。
全有或全无原则听起来似乎是同义反复,因此是微不足道的真理(比较一下:"世界上万事万物都有质量,或者没有质量。")但这一原则并非同义反复,因为有思想这一属性,就像有生命这一属性一样,是模糊的。因为有思想是模糊的,所以不可避免地会出现在某些方面像思想而在另一些方面不像思想的边缘情况。但是,如果你接受了 "全有或全无 "原则,你就必须把这些边缘情况归入 "有思想的事物 "类别或 "无思想的事物 "类别。经验证据不足以处理这种选择。因此,那些接受 "全有或全无 "原则的人不得不通过诉诸某种先验的分类原则来证明他们的选择是正确的。此外,由于我们对自己的思维最为熟悉,因此我们会被那些需要与自己进行比较的原则所吸引。
全有或全无原则一直都是错误的,但它可能曾经有用。在人工智能时代,它已不再有用。推理语言模型的更好方法是采取分而治之的策略。该策略的目标是绘制语言模型的认知轮廓,而不过度依赖人类思维作为指导。
在比较心理学的启发下,我们应该以同样开放的好奇心来对待大语言模型,这种好奇心让科学家们能够探索像章鱼一样与我们不同的生物的智慧。可以肯定的是,语言模型与动物完全不同。但对动物认知的研究向我们展示了,放弃 "非此即彼 "的原则如何能让那些曾经似乎无法通过科学检验的领域取得进展。如果我们想在评估人工智能系统的能力方面取得真正的进展,我们就应该抵制二分法思维和比较偏见,而哲学家和科学家在研究其他物种时都会努力避免这种思维和偏见。
一旦语言模型的使用者接受了这样一个事实,即这些模型是否有思想并不存在一个深刻的事实,我们就不会再受到拟人化假设的诱惑,即这些模型的杰出表现意味着它们具有一整套类似人类的心理特性。我们也就不会那么容易受到以人类为中心的假设的诱惑,这种假设认为,当语言模型在某些方面与人类思维不相似时,就可以否定它的表面能力。
语言模型既陌生又新颖。为了理解它们,我们需要以假设为导向的科学来研究支持它们每一种能力的机制,我们必须对不依赖于人类思维作为模板的解释保持开放的态度。
作者 Raphaël Millière 是澳大利亚麦考瑞大学人工智能哲学的助理教授;作者 Charles Rathkopf是德国于利希研究中心的大脑与行为研究所的研究助理,同时也是波恩大学的哲学讲师。
30
2
9