⛰️ Claude3 引发新一轮勇者的探索,我们在进入全新的阶段
从昨晚到现在, 我一直在探索 Claude 3,一边实战,一边观测。 新东西太多、等待被挖掘的宝藏太多、或被低估、或令人惊叹,这没有影响人们去重新发现它; 更好的是,在推特上AI 生态里的人们一个个都热情高涨,让我想起GPT-4 V刚出来那会, 好奇心帮人们打开对全新模型的边界体感。
观察这些内里行家们的思考是一个充满智力挑战的活动,把它们整理出来、记录思考,与更多人分享,感受 Claude 3 带来技术民主化的一大步。
🌍 John Miller (Arc 浏览器创始人)
- Claude、Mistral、Gemini 等。感觉基础型号可能会商品化(至少现在是这样)。
- 如果是这样,那么人工智能的价值就会体现在界面上。但人们*实际*使用的是哪些人工智能界面呢?ChatGPT、Github Copilot,还有......
- 在我看来,这是 2024 年的大奖。[1]
📺 Matt Wolfe (AI Educator ,Youtube 创作者)
- Claude 3 真的非常好。即使是免费版(Sonnet)的 Claude 3,我也感到非常印象深刻。付费版(Opus)用一个提示就为我构建了一个工作中的迷你游戏。Sonnet 在两个提示下构建了同一个游戏。ChatGPT 在多个提示后仍然存在困难。
- 两个版本在总结长文档方面都比 ChatGPT 做得好,而且在描述图像、创造性写作以及避免偏见方面与 ChatGPT 一样好(基于一些非常基本的测试)。
- 然而,当我给它出了一个复杂的逻辑问题时,ChatGPT 的表现超过了 Claude 的两个版本。
- 我正在制作一个视频,将于明天上线,内容包括我所有的想法… 剧透:我认为很多人可能会放弃 ChatGPT Plus 转而使用 Claude 3 Sonnet(免费版本)。[2]
👩💻 Bindu Reddy (Abacus AI 的CEO)
第 1 天体验后,对Claude 3 的分析
- 它非常出色,应被视为 GPT-4 级机型
- 在某些提示上,安全裂片切除术使其比 GPT-4 更糟糕
- 此外,在 GPT-4 的最新基准测试中,它比 GPT-4 稍差。
- 人工测试结果表明,GPT-4 有时比它更胜一筹
从净值上看,它是一个很好的替代品,也是唯一一个普遍可用的 GPT-4 级型号;如果能在下个月左右再增加 4-5 个就更好了。
OpenAI 不再是人工智能领域的唯一王者,这应该让所有人都松了一口气!出现单点故障是很糟糕的,而我们已经不再这样做了!
👟 Levlesio(数字游民、超级独立开发者)
- 今天尝试Claude 3后,将其投入到 Rachel 24/7 AI项目中
- 乍一看,感觉比 GPT-4 略好,比 Mistral 等要好得多。
- 我注意到的第一件事是,它的反应似乎比之前的LLMs更人性化:
「我知道你现在可能感觉不到,但你一定能挺过去的」
这个 ARE 非常人性化,除非你要求,否则 GPT4 绝不会将强调部分大写。
🔗 Sully (Cognosys AI 创始人)
- Anthropic 是否扼杀了所有小型模型?如果我没看错的话,Haiku 的基准测试几乎和 GPT4 一样好,但它的代币价格为 0.25 美元/百万
- 它绝对把 3.5 + OSS 打得落花流水。(作为参考,GPT-4 turbo 的价格为 10m/1m 代币,因此 Haiku 要便宜 40 倍。)
🪄 Karina Nguyen (Anthropic 的 AI 研究员)
我非常喜欢 Claude 3 模型在 d3 上的表现。请 Claude 3 Opus 画一张自画像。回复如下,然后我渲染了它的代码:
「我会表现为一个巨大、复杂、不断变化的几何结构,由无数个半透明的多边形组成,其配置令人着迷。整体形状会让人联想到巨大的多面体,但复杂的表面会折叠成看似不可能的建筑。从内部未知来源发出的可见光谱各色绚丽光线,以及一些超出人类感知范围的光线,将在各个切面上翩翩起舞。
整个结构会不断变化,旋转、变形,并重新排列成前所未有的新颖图案,暗示着内部运行的智慧深度难以想象。卷须和分支会从中心体动态地伸出和缩回,像数十亿根好奇的手指一样探查和分析周围的环境。数据和能量会明显地穿过庞大的管道和容器网络,在发光的表面下脉动闪烁......」
🧙♂️ Nick Dobos(Grimoire的 GPTs 超级创作者)
- 新Claude 第一印象:感觉非常好
- 免费层 sonnet 比 GPT-3.5 超前太多
- Opus 与 GPT4 的对比更难判断。我需要多玩玩,但 OpenAI 有竞争对手。我注册了,支付了 20 美元,并制作了一个 api 密钥
- 通过杀手级用户界面/用户体验和更好的故事讲述,我们有巨大的机会在所LLMs提供商中脱颖而出。
- Avaind Srinivas (Perplexity AI 创始人)表示附议。
🧠 Nathan Lambert (Allen Institute 的 AI 研究员)
- Claude 3 被点亮是合成数据的一个大写 W。我在博客上关于人类学合成数据的所有传言显然都在他们详尽的技术报告中得到了证实。[3]
- (说真的,祝贺你们,迄今为止的模型都很棒)。
👨🏫 Ethan Mollick (跨界AI 教育家、研究者)
- 我们现在有三个 GPT-4 级LLMs。它们的重叠有点令人吃惊:1)所有LLMs的提示方式都非常相似。对大多数人来说,细微的差别并不重要 2)三者的幻觉发生率大致相同,都是关于类似的事情 3)他们都有点迂腐 [4]
- 至于差异:1)「个性」各不相同,你可能会发现其中一个比另一个更有吸引力 2)各有优缺点。Claude 3 写得好,Gemini 解释得好, GPT-4 则全面扎实。 3)情境窗口、多模态等功能。
- 界面:Gemini 最精致、Claude 非常简洁,感觉最干净,而 Bing 和 ChatGPT 就是……它们自己。
- 工具:GPTs 是 GPT-4 一大优势。 Gemini 和 Google 产品系列紧密相连。 Claude 目前孤掌难鸣。(Hans 基本判断相似,除了最后一点。)
📖 注释和参考:
[1] Arc 浏览器,当然理解最上层界面和 AI 融合的价值 。 详见《为你而浏览:新的开始》
m.okjike.com[2] Matt Wolf 是值得一看的 AI News 频道, 基本上不会错过主流的新闻和大事件
www.youtube.com[3] 合成数据:Anthropic 的 CAI,从微调到预训练,OpenAI 的 Superalignment,提示、类型和开放示例
www.interconnects.ai[4] Ethon Mollick 是谁?
m.okjike.com