即刻App年轻人的同好社区
下载
App内打开
卡尔的AI沃茨
43关注469被关注0夸夸
公众号:卡尔的AI沃茨
明明是码农却在AI创作领域不停开坑填坑,果然除了修电脑外什么都会
置顶
卡尔的AI沃茨
1年前
AI保姆级教程|ChatGPT,Midjourney,Runway

取代你的不是AI,而是比你更懂AI的人。普通人应该如何学会并使用AI产品呢?这里我推荐我开发的开源教程learnprompt.pro。初学者也不用担心,我们准备了基础、案例和高级篇的教程指南,详细讲解操作步骤。目前已经支持ChatGPT,Mid journey,Runway,后续也会开发Stable Diffusion的课程。希望大家学得开心😄
726
卡尔的AI沃茨
1天前
奥特曼刚刚宣布完成了OpenAI技术目标里的第三项“建立一个具有自然语言理解的Agent“

在 2024 年 T-Mobile Capital Markets Day 上,OpenAI CEO Sam Altman 表示:

1. OpenAI 新发布的推理模型 o1 preview 相当于 GPT-2 时刻,升级曲线会很陡峭,意味着很快就会达到它的 GPT-4 时刻。

2. 推理模型这种新范式的一个最大特点就是升级速度极快。因此,现在模型无法解决的问题,过几个月它们就能解决。而最重要的是,我们将看到一些全新的模型使用方式。

3. 在 o1 的研发早期阶段,将会有全新的使用方式,这些不仅仅是聊天界面。我们需要一段时间来构建这些新方式,其他人也需要时间来适应。用户也需要一段时间来学习如何使用它。这与 GPT 模型有很大的不同。

4. AI 的五个发展阶段。第一个阶段是聊天机器人。第二个阶段,也就是我们现在刚刚达到的,是推理系统。第三阶段是 AI 智能体。第四阶段是创新者,具有发现新科学信息的能力。第五阶段是完整的组织。从第一阶段过渡到第二阶段花费了一段时间,第二阶段能相对较快地推动第三阶段 AI 智能体的发展。

5. OpenAI 不会用 API 调用的数据后者训练的数据来训练他们的模型

更多新模型o1的信息📪: mp.weixin.qq.com

完整字幕链接🔗:baoyu.io
00
卡尔的AI沃茨
2天前
o1花了一周陆陆续续放的彩蛋都被我包圆了

ChatGPT o1 的幕后故事,以及这颗草莓晚来的使用说明书

00
卡尔的AI沃茨
3天前
OpenAI你变了!o1-mini 模型开始在 ChatGPT 免费计划的用户界面中出现,但目前并不能正常工作,而且被归类在内部 Alpha 模型类别中。
00
卡尔的AI沃茨
3天前
是不是额度太低,大家都跑去用OpenRouterAI 了,OpenAI连夜把额度提升了7x,是连夜去进货显卡了吗😧
00
卡尔的AI沃茨
4天前
我每天都使用 o1-mini vs Claude Sonnet 3.5 进行编程,所以我的想法是?

过去几天,我一直在 Cursor 中测试 o1-mini(OpenAI 声称它比预览版更适合编码,具有 64k 输出令牌),与 Sonnet 3.5 相比,后者一直是模型的主力,对我的编码需求非常一致和有用

结论:Claude Sonnet 3.5 仍然是更好的模型

测试是一名创始人/开发人员,在湾区科技公司拥有几年的专业软件开发经验。

项目:我正在开发自己的 SaaS 启动应用程序,该应用程序使用 React/NextJS/Tailwind 前端和 FastAPI Python 后端构建,并使用 Upstash Redis KV 存储来存储一些配置。就专业代码库标准而言,这不是一个非常复杂的代码库。

o1-mini 优点
- 64k 输出上下文意味着可以完成大型重构作业,例如 10 多个文件,每个文件几百个 LoC
- 如果您的提示很好,它 *通常* 可以在 2-3 次内完成大型重构/重构作业
- 例如,我需要重新设计我存储在 Upstash KV 存储中的用户配置的方式。我写了一个简单的提示(与我对 Claude 的提示工程相同),解释了如何将 JSON 文件拆分为两个端点(从最初的一个端点),并告诉它更新我的其他七个 React 组件中的输入文本常量。它思考了大约一分钟,然后开始编写代码。我的初次尝试失败了。相当困难。代码甚至没有运行。我做了第二次尝试,并且在我的提示中非常具体地设计了拆分的 JSON 配置。这次,谢天谢地,它确实正确地编写了所有代码。我确实必须手动修复一些东西,但实际上这不是 o1 的错。我的 Redis 存储中有一个不正确的值,所以我更新了它。Cursor 当前对 o1 的实现也有错误;它经常生成重复的代码,所以我也必须删除它。
- 但总的来说,这是一项相当大的重构工作,它确实做得相当好 - 大输出上下文是促进这一点的重要部分

❎o1-mini 缺点
- 你必须非常具体地说明你的提示。比如,过于冗长。它让我想起了 GPT-3.5 左右的时代,我的提示非常明确,描述了每个步骤。我已经被 Sonnet 3.5 宠坏了,我实际上不需要使用太多的特殊性,它就能理解我的意图。
- 由于思考时间长,你几乎需要一个完美的提示,它还会要求它考虑边缘情况。否则,您将浪费聊天和时间来修复小的语法问题
- 您(目前)使用 o1 的方式是您必须一次性完成所有事情。不要像使用 4o Sonnet 3.5 那样使用它。从 POV 的角度考虑您只有一个提示,因此请在第一个提示中塞入尽可能多的细节和特异性,并让它完成这项工作。由于思考时间长,o1 不是“对话式”法学硕士
- 每天/每周的聊天次数有限是广泛采用者的巨大限制。我发现自己只使用 Sonnet 3.5 手动重构较小的部分,工作速度更快。但我知道如何编码,所以我可以更细致地思考。
- 64k 输出上下文改变了游戏规则。我希望 Sonnet 3.5 有这么多输出标记。我想如果 Sonnet 3.5 64k,它的表现可能会类似
- o1-mini 说得太多了。它太冗长了。我真的不喜欢这一点。我认为 Cursor 的当前版本也没有系统提示告诉它要简洁
- Cursor 实现存在错误;有时没有文本输出,只有代码。有时,生成步骤会重复代码。

o1-mini Claude Sonnet 3.5 结论
- 如果您正在进行大规模重构工作,或正在为大型项目做准备,请使用 o1-mini。更深层次的思考和大量输出令牌限制的结合意味着您可以一次性完成任务
- 如果您有一组较小的任务,Claude Sonnet 3.5 仍然是闭源编码 LLM 的👑
10
卡尔的AI沃茨
4天前
开源版ChatGPT o1!由 @GroqInc 上的 Llama-3.1 提供支持。它使用推理链来解决问题。

它解决了“草莓问题”的概率约为 70%,无需微调或少量技巧。

#chatgpto1 #gpto1

传送门👉 x.com
01
卡尔的AI沃茨
6天前
ChatGPT o1 is all you need

在Ask Me Anything采访环节中从OpenAI o1团队那里了解到的内容总结如下:

1. 模型命名和推理范式
OpenAI o1 代表了AI能力的一个新层次,名称重置为1。
“Preview”表示它是完整模型的早期版本。
“Mini”表示它是o1模型的较小版本,优化为更快的速度。
“o”代表OpenAI。
o1不是一个“系统”,它是一个能够在给出最终答案之前生成长链推理的模型。
o1的图标象征着一个拥有非凡能力的外星人。

2. o1模型的大小与性能
o1-mini比o1-preview更小且更快,因此未来会提供给免费用户使用。
o1-preview是o1模型的早期检查点,既不大也不小。
o1-mini在STEM(科学、技术、工程、数学)任务中表现更好,但其世界知识有限。
在某些任务中,特别是代码相关任务,o1-mini的表现优于o1-preview。
o1的输入Token与GPT-4o的Token计算方式相同,使用相同的分词器。
o1-mini可以探索比o1-preview更多的思维链条。

3. 输入Token上下文与模型能力
更大的输入上下文即将为o1模型提供。
o1模型能够处理更长的、更开放的任务,相比GPT-4o,减少了对输入分块的需求。
o1能够在提供答案之前生成长链推理,与之前的模型不同。
当前无法在推理过程中暂停推理以添加更多上下文,但未来的模型可能会探索这种可能性。

4. 工具、功能与即将推出的特性
o1-preview 目前还不能使用工具,但计划支持函数调用、代码解释器和浏览功能。
未来的更新将加入工具支持、结构化输出和系统提示词。
未来版本可能允许用户控制思考时间和Token限制。
计划推出流式传输功能,并考虑在API中展示推理进展。
o1内置多模态(multimodal)功能,旨在在任务中实现最先进的性能,如MMMU(多模态推理任务)。

5. CoT(推理链)推理
o1在推理过程中生成隐藏的推理链。
暂无计划向API用户或ChatGPT公开CoT Token。
CoT Token会被总结,但不能保证推理过程与实际推理完全一致。
提示词中的指令会影响模型思考问题的方式。
强化学习(RL)用于提升o1的CoT能力,而GPT-4o无法仅通过提示达到同样的CoT表现。
思考阶段看起来较慢,是因为它总结了思维过程,尽管答案生成通常更快。

6. API与使用限制
o1-mini 对ChatGPT Plus用户每周有50次提示词的限制。
在ChatGPT中,所有提示词计数相同。
更多的API访问层级和更高的速率限制将在未来推出。
API中的提示词缓存是一个热门需求,但尚无时间表。

补充:
目前,只有 5 级账户才能访问到新的 o1-preview o1-mini 模型 API——意味着用户至少需要花费 1000 美元来购买 API 积分。
不支持系统提示词——这些模型使用现有 Chat Completion API,但用户只能发送 user assistant 消息。
不支持流媒体、工具使用、批量调用或者图像输入。
“根据模型解决问题所需的推理量,这些请求可能需要几秒到几分钟时间才能获得响应。”
最有趣的是新模型引入了“推理 token”的概念——这些 token API 响应中不可见,但仍会按照输出 token 的形式计算。正是有它们的存在,新模型才表现出种种神奇的推理能力。

7. 定价、微调与扩展
o1模型的定价预计会遵循每1-2年降价的趋势。
一旦速率限制增加,将支持批量API定价。
微调(fine-tuning)已在计划中,但尚无具体时间表。
o1的扩展瓶颈在于研究与工程人才。
推理计算的新扩展范式可能为未来几代模型带来显著的性能提升。
逆向扩展尚不显著,但个人写作提示中,o1-preview的表现仅略优于或甚至略逊于GPT-4o。

8. 模型开发与研究见解
o1通过强化学习训练以实现推理性能。
该模型在创造性思维和横向任务(如诗歌创作)中表现出色。
o1的哲学推理能力及其对问题的广泛泛化能力(如破译密码)令人印象深刻。
研究人员利用o1创建了一个GitHub机器人,它可以提醒适当的CODEOWNERS进行代码审查。
在内部测试中,o1自我提问以测试其能力。
正在增加广泛的世界领域知识,未来版本将有所改善。
o1-mini未来计划使用更新的数据集(当前为2023年10月的数据)。

9. 提示技巧与最佳实践
o1从提示风格中获益,特别是边缘案例或推理风格的提示。
与早期模型相比,o1模型对提示中的推理提示更敏感。
在检索增强生成(RAG)中提供相关的上下文可以提升性能,而不相关的片段可能会降低推理能力。

PS:“提示中的推理提示”是指在给AI模型的提示词(prompt)中,明确包含的引导模型进行推理的提示或指示。简单来说,就是在编写提示词时,加入一些引导性语言或指令,要求模型通过逻辑推理、推理链(Chain of Thought, CoT)等方式来解决问题或回答问题。

10. 一般反馈与未来增强
o1-preview的速率限制较低,主要是由于早期阶段的测试,但未来会增加。
正在积极改善延迟和推理时间。

11. 模型的显著能力
o1可以思考诸如“生命是什么”这样的哲学问题。
研究人员发现o1在处理复杂任务和从有限指令中泛化的能力令人印象深刻。
o1的创造性推理能力,如自我提问以测试其能力,展示了其高级问题解决能力。
00
卡尔的AI沃茨
7天前
挑战用一个提示词生成文章锐评卡片,只需要输入URL!

✅用Jina爬取网页内容
❌(成功了一半)用API获取QR Code提取SVG部分

卡片样式的写法保留了@李继刚 哥的「汉语新解」,最大可能地原汁原味,扩展图片信息的输入输出路径。

提示词地址:aiwarts101.feishu.cn

如果有解决思路,欢迎随时在评论区戳戳我,成功做出来的话以后大家都可以随时随地分享卡片了📇
00
卡尔的AI沃茨
7天前
有尝试稳定用Claude Artifacts生成二维码的朋友吗👫,
网页爬虫整合到一个prompt里了,
But svg二维码嵌入失败无数遍

#汉语新解引发的旧活新整 @李继刚
00