即刻App年轻人的同好社区
下载
App内打开
歸藏
549关注16k被关注29夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
置顶
歸藏
2年前
很多朋友最近老问我一些我之前写过的东西在哪里,所以整理了一下写个置顶贴,内容会定期更新:

1️⃣ 我运营的 AIGC 周刊每周一更新,主要内容是上周 AI 领域的重点动态解析以及相关的产品和文章:
op7418.zhubai.love

2⃣️ 我的Midjourney作品汇总和对应的提示词:
walling.app

3⃣️ 我开发的一些产品

帮你将 Midjourney 的图片和提示词快速收集到你的 Notion 数据库中:
mp.weixin.qq.com

帮你自动分段翻译 Midjoureny 官网的提示词:
mp.weixin.qq.com

利用 ChatGPT 自动监控对应领域的信息并处理和发送到Discord 频道:
op7418.zhubai.loveposts/2251721691841511424

4⃣️ 我写的一些教程

AI 歌手系列课程教你使用和训练自己的 AI 歌手模型:
mp.weixin.qq.com
mp.weixin.qq.com

Stable Diffusion 保姆级入门教程包括 Web UI 的部署和 LoRA 模型的使用:
op7418.zhubai.loveposts/2238998671356555264
op7418.zhubai.loveposts/2239983151969951744

Stable Diffusion 模型大神工作流解析:
mp.weixin.qq.com
web.okjike.com

教你十几分钟不用代码创建自己的AI应用
mp.weixin.qq.com
14132
歸藏
1天前
一个喜讯,藏师傅第二个Claude账号只存在了一晚上就没了
70
歸藏
1天前
可能过去几年我们会像记住ChatGPT发布的时间一样,记住昨天晚上的时间。

整理了一些大佬对O3发布发表的看法:

1/ 在我看来,在FrontierMath上的进步比ARG-AGI更令人印象深刻。从2%跃升到25%

陶哲轩曾说这个数据集应该"至少能抵抗人工智能几年",并表示"这些问题极其具有挑战性。

2/ 在技​​术可以创造一切的现实中,那些知道什么不该创造、能够优雅地对某些可能性说“不”的人将脱颖而出。

3/ o3真的很特别,每个人都需要更新他们对人工智能能力边界的认知。

虽然现在还处于早期阶段,但这个系统展现了真正的智能提升,这一点通过ARC-AGI得到了验证。

4/ 我相信o3是程序合成领域的AlexNet时刻。我们现在有了具体证据表明深度学习引导的程序搜索是有效的。

从我的角度来看,我们正在仰望另一座同样高且对AGI同样重要的山峰。

5/ 这个模型在前沿数学基准测试中得分25%。这些数学问题难到几乎没有人能理解,更不用说解决它们。我做不到,你也做不到。

这就是经济奇点,所有旧有的社会和经济模式都将崩塌。前方是一个巨大的未知世界,没有人能真正理解即将发生什么。

6/ 更重要的是,从o1到o3的进展仅用了三个月,这表明在新范式下进展会有多快 —— 这种新范式是在思维链上使用强化学习来扩展推理计算能力。这比每1-2年训练一个新模型的传统预训练范式要快得多。
210
歸藏
1天前
Gemini Deep Research 现在支持中文了

如果你有会员一定要来试试。

这是它搜了几十个关键页面给出的昨晚 O3 的介绍

简洁精炼没有废话,还会加表格对比

只能说搜索还得谷歌做,要是Gemini 2 Pro驱动的话不知道会有多强
33
歸藏
1天前
你永远可以相信 Sam

怎么说呢AGI确实有希望,普通用户也是再次被耍猴了

真的有O3,O3也真的牛皮,但是不知道啥时候才能用

在ARC-AGI测试集高计算模式下得分为 87.5%,人类是85%

SWE-bench O3有70分真的离谱,推理这路上也算看到希望了

他们给了O3 Mini 1月底就可以用

O3 Mini比O1强的有限,有些分数甚至在倒退
43
歸藏
2天前
Anthropic 几个核心创始人罕见的一起录了一个播客

详细介绍了他们如何认识然后产生共识最后迫不得已创建公司的事情

整理了一下核心内容笔记:

- 创始历程与动机
- 公司文化特点
- 几个联创展望未来
- 有趣的AI历史细节

里面很多以前没说过的事情,强烈建议看看:www.youtube.com
017
歸藏
2天前
Krea 这个局部重绘功能的演示真的吸引人

用他们的 Lora 训练功能加局部重绘就能让产品穿在模特身上

能把 FLUX Fill 模型和 Lora 训练结合成这样的产品真的很强
00:30
313
歸藏
2天前
Runway 更新了

现在除了首尾帧之外还支持插入中间帧控制视频生成

跑了个视频给我整笑了,再研究研究
13
歸藏
2天前
Anthropic 说 2025 年将是 Agentic 系统年

所以发了一个 Agents 综述的文章,介绍了他们构建 Agentic 系统的一些发现。

原文地址:www.anthropic.com

非常适合入门看,这里是大致的笔记:

1. 代理系统的基本概念
- 工作流(Workflows):通过预定义的代码路径编排LLM和工具
- 代理(Agents):LLM动态指导自己的流程和工具使用

2. 何时使用代理系统
- 建议从最简单的解决方案开始
- 仅在必要时增加复杂性
- 需权衡延迟和成本与任务性能的关系

3. 框架使用建议
- 常见框架:LangGraph、Amazon Bedrock、Rivet、Vellum等
- 建议开发者从直接使用LLM API开始
- 使用框架时需理解底层代码

4. 主要构建模式

A. 基础构建块:增强型LLM
- 具备检索、工具使用和记忆能力
- 通过Model Context Protocol实现工具集成

B. 工作流模式:
- 提示链(Prompt chaining):将任务分解为连续步骤
- 路由(Routing):对输入分类并导向专门任务
- 并行化(Parallelization):
- 分段:将任务分解为并行子任务
- 投票:多次运行获取不同输出
- 编排者-工作者(Orchestrator-workers):中央LLM分配任务
- 评估者-优化者(Evaluator-optimizer):循环评估和改进

C. 代理模式:
- 可自主规划和操作
- 需要环境反馈
- 适用于开放性问题

5. 实践应用领域
- 客户支持:结合对话流程和工具集成
- 编码代理:可验证且结构化的问题领域

6. 工具设计原则
- 注重工具文档和接口设计
- 考虑模型使用便利性
- 进行充分测试和迭代

7. 核心建议
- 保持设计简单性
- 确保透明度
- 精心设计代理-计算机接口(ACI)
- 仅在简单方案不足时增加复杂性

这篇文章为开发者提供了构建代理系统的实用指南,强调了从简单开始、逐步优化的方法论。
238
歸藏
2天前
谷歌这几天这输出也太可怕了,给 Sam 估计都气死了

发布基于 Gemini 2 Flash 的推理模型 Gemini 2.0 Flash Thinking

直接在 LMArena 所有类别拿到第一,而且比 O1 5 倍!

现在可以直接在 AI Studio 免费使用,推理过程公开
717
歸藏
3天前
谷歌 Veo 2 这个水墨动画有点离谱了嗷

来源:x.com/moderncpp7/status/1869494828977049862
00:16
46