Pi的新突破：世界上仅次于GPT-4的模型即将发布

即刻App年轻人的同好社区

下载

Szhans

3年前

Pi的新突破：世界上仅次于GPT-4的模型即将发布

✨ 精华要点：

- Inflection AI，这家开发了会话式聊天机器人Pi的初创公司，已经推出了一种新模型Inflection-2。该公司声称，新模型可以超越Google和Meta开发的两种流行替代品，并且正在紧追OpenAI 更具旗舰意义的模型GPT-4。

- 「无论你想就种族、性别、OpenAI或者当下的任何有争议的问题进行敏感的对话，Pi都会以一种非常微妙且谨慎的方式，以事实为基础与你交流，并实时获取信息」，Mustafa Suleyman透露。

- 苏莱曼表示，Inflection-2在性能上超越了最大的700亿参数版本的LLaMA 2，埃隆·马斯克的xAI创业公司的Grok-1，谷歌的PaLM 2 Large和创业公司Anthropic的Claude 2，仅次于GPT-4。

- 在OpenAI混乱的董事会争斗达到临时解决之前的几个小时，Suleyman 敦促公众“以同情和宽恕”的态度对待涉事人员。“那里有很多非常有良好意愿的人，”他特别提到了联合创始人Ilya Sutskever，他原本是开除 Altman的董事会董事之一，后来在周日晚上宣布他对那个决定感到后悔。

- 当被问到OpenAI的失误——ChatGPT在周一和周二的至少部分时间内瘫痪，而客户们则带着担忧观看这一过程——是否给了竞争对手更多的机会时，Inflection的CEO并未否认。

📖 主要内容如下：

Inflection AI，这家开发了会话式聊天机器人Pi的初创公司，已经推出了一种新的AI模型。该公司声称，这种新模型可以超越Google和Meta开发的两种流行替代品，并且正在紧追OpenAI的更大、更具旗舰意义的模型GPT-4。

被称为Inflection-2的模型在许多标准基准测试中的表现优于Google在五月份公布的PaLM Large 2模型，Inflection公司表示，同时在不同的评测中击败了主要由Meta开发的开源LLaMA 2模型。总的来说，Inflection的模型是同类中表现最好的，这家初创公司表示。它仅次于OpenAI发布的旗舰模型GPT-4，后者被认为规模要大得多。

“我们的信念是，我们现在只是处在这个扩展曲线的起点，即将出现的新能力真的令人震惊，”首席执行官Mustafa Suleyman在一次采访中说。

“无论你想就种族、性别、 OpenAI或者当下的任何有争议的问题进行敏感的对话，Pi都会以一种非常微妙且谨慎的方式，以事实为基础与你交流，并实时获取信息，”他说。Suleyman补充说，Pi将“很快，不会太久”就会更新新的模型，但他拒绝提供具体日期。

他没有提供Pi的更新用户数量，但表示“它非常受欢迎，保留用户数量巨大。”两周前，OpenAI透露其免费的ChatGPT服务每周用户量已达到1亿，就在董事会周五临时解雇CEO Sam Altman之前。

很难不将Inflection发布的大型语言模型，被誉为“当今世界第二大能力的LLM”，放在行业最知名的模型制造商的动荡背景下来看。周三早些时候，OpenAI宣布Altman将重返OpenAI担任CEO，此前的周末，Altman的盟友们正在为他的回归进行谈判，而OpenAI的员工们签署了一份呼吁他们的董事会集体辞职的请愿书。

在Inflection，Suleyman坚称他的初创公司，尽管早些时候的公开言论似乎暗示了年底发布，但他们并未提前发布Inflection的新模型，该公司今年早些时候完成了13亿美元的融资轮。他声称，这次发布实际上已经推迟了一周，培训在上周就已经完成。

为了训练Inflection-2，这家初创公司使用了5000个Nvidia H100图形处理单元，或者说GPU，比起训练其前身的几千个旧的A100来说有所增加。Suleyman说，这个新模型训练起来更快、更便宜，但仍然处理了大量的运算（10^25 FLOPs，或者说浮点运算）。Inflection与Microsoft、Nvidia和CoreWeave紧密合作，以管理其计算集群。

Inflection 在一个被称为MMLU的流行基准上测试了其新模型，该基准包含了从世界知识到问题解决和伦理等57个主题的高中和专业级任务，模型被要求回答这些问题。

苏莱曼表示，Inflection-2在性能上超越了最大的700亿参数版本的LLaMA 2，埃隆·马斯克的xAI创业公司的Grok-1，谷歌的PaLM 2 Large和创业公司Anthropic的Claude 2，仅次于GPT-4。这个新模型在七个科学回答基准测试中，除了两个以外，都击败了LLaMA 2和PaLM 2模型，Inflection报告称；它在三个问题和答案任务基准测试中也表现最好，只在一个中输给了PaLM 2 Large。尽管这些领域并非公司明确的关注点，但在四个数学和代码基准测试中，它的表现仍然可观；然而，对于OpenAI已经分享结果的两个测试，它在GPT-4面前明显落后。

虽然这样的基准可能除了AI研究员或开发者之外，对任何人来说都不显著，但Suleyman表示，小的改进可以使模型从“粗糙的原型”变为“生产级别、可靠且高质量”的模型。总的来说，Suleyman声称Inflection-2可以被认为是其大小类别中的最佳——“非常、非常接近”GPT-4。从今天开始，Inflection将把其训练重心转向下一个模型，他预测这个模型将在六个月内达到其前身的10倍规模，再过六个月将再增长10倍。（对于那些在计分的人来说，这是现在的一百倍。）

在OpenAI混乱的董事会争斗达到临时解决之前的几个小时，Suleyman敦促公众“以同情和宽恕”的态度对待涉事人员。“那里有很多非常有良好意愿的人，”他特别提到了联合创始人Ilya Sutskever，他原本是开除Altman的董事会董事之一，后来在周日晚上宣布他对那个决定感到后悔。（目前尚不清楚Sutskever是否会留在OpenAI，但他喜欢公司和Altman在X上宣布回归的帖子。）

Ilya Sutskever 在2011年作为承包商和顾问为Suleyman工作，当时他在DeepMind工作，这是他三年后卖给Google的AI创业公司。“我非常尊重他，不仅仅是在技术上，他非常有原则，非常真诚。我认为他和团队其他成员都有真正的好意，”Suleyman说。

Inflection和Suleyman此前一直公开谈论AI安全，他们在7月份签署了拜登总统的自愿令，此外还有其他举动。他还发誓要避免让Pi回答与选举相关的问题，或参与创建政策活动的材料。Suleyman最近出版了一本部分详述AI风险的书，名为《即将来临的浪潮》。

“显然，OpenAI的董事会和其非常特殊的非营利董事会在行动上犯了一些非常非常重大的错误，”他谈到近日来在科技行业中受到一些人诋毁的情况。“我希望人们能尝试宽恕，并将此视为在努力建立做正确事情的更好公司，并试图通过新的治理结构使世界变得更好的整体旅程上的一个小插曲。”

也就是说，Suleyman也是一个资本家：当被问到OpenAI的失误——ChatGPT在周一和周二的至少部分时间内瘫痪，而客户们则带着担忧观看这一过程——是否给了竞争对手更多的机会时，Inflection的CEO并未否认。

“从根本上说，我正在建立一家公司，”Suleyman说。“这非常有竞争性。这是硅谷多年来最具竞争力和创造力的时期。”

🔗 相关报道链接： www.forbes.com 模型评估的更多内容：inflection.ai

Pi的App Store的链接：apps.apple.com

55 827

来自圈子

AI探索站

116053人已经加入