即刻App年轻人的同好社区
下载
App内打开
-Zho-
118关注2k被关注11夸夸
🏡建筑师|🤖AI探险家
📝ComfyUI|AI资讯|AI测试|SD云部署|AI+建筑|2091
置顶
-Zho-
7月前
🏆来了朋友们!!!ComfyUI 全球领导力峰会第二站·东京站!!!

🚤11月CLSCN东京站开启报名!AI开源社区首次出海!

🤣CLS深圳获得海外强烈反响,我们趁热将中国AI活动带到东京,会见到亚洲领域内知名开源开发者、头部AI企业、艺术家和学术团队等,相信开源的力量!

🚗11月16日-17日在东京(*最终日期可能有前后1周调整)
😎预期规模:50-100人,依然免票审核制

🤝海外筹备不易,提前收集大家的参与意愿,以便有更多时间调整场地,日程会在近期公布~

✅详情请见:waytoagi.feishu.cn
15
-Zho-
4天前
开个 QwQ-32B 开源推理模型的测试合集帖子,小而强!

1️⃣首先写了 gradio 并在 Colab 上测试了一下 QwQ-32B-AWQ 量化版本,可太行了!!!(附 Colab,ComfyUI 插件在路上

使用显存: 18.12 GB
生成速度: 平均 7.45 tokens/秒
GPU:A100 上测试
VRAM:40GB
提示词:使用 p5js 创建令人惊叹的动画,要求为我提供可以运行的html完整代码
生成时间: 415.27 秒
效果:如视频

Colab(需 Pro):colab.research.google.com
00:32
22
-Zho-
4天前
【模型即产品】非常有意思的文章!结合我自己的观点和大家开放讨论,先放观点:

1️⃣【远未来】模型将带来新体系而非现有体系延伸:技术爆炸,而非应用爆炸/应用伪爆炸(近未来),新体系应用终将爆炸(远未来)

2️⃣【近未来】专而精的综合 > 通用性扩展:强化学习的价值被低估

3️⃣【模型与应用】模型好比小孩,技术发展好比教育,应用好比工作,别伤仲永

具体阐述:

1️⃣(远未来)生成式模型将会带来全新体系而非对现有体系的提升/延伸

结合文章“模型即产品”观点,首先,我认为生成式模型甚至不仅仅是产品(现有体系的延伸),而将会是更大的全新的综合(颠覆的新系统)

这就好比钢玻璃混凝土带来的不是更坚固的大屋顶,而是全新的建筑体系和语言,由此彻底改变人类对空间的塑造和使用(如近千米的摩天楼、近万人的综合体)

生成式模型这样的技术革新终将会带来全新体系,这是远未来,当然需要发展和时间,但对远未来的判断会影响近未来的选择,因此,拉回近未来,我同意文章所提到的是“技术的爆炸,而非应用的爆炸”,我认为基于还未成熟的技术基础做出的应用只是一时的


DeepSeek 创始人梁文峰则更加直接地指出了这一点:
当前的AI发展,是一场技术创新的爆炸,而非应用创新的爆炸……如果上下游生态体系还不完整,直接去押注应用并没有意义


一句话总结:技术爆炸还没到更大的点,应用急不得

2️⃣(近未来)专而精的综合 > 通用性扩展

1)文章提到非常重要的一点:强化学习的价值被严重低估

DeepSeek R1 浪潮以及最新的各类模型如昨晚的 QwQ32B 都在证明 RL 的重要性、可拓展性和巨大潜力,特别是垂直领域的强化学习可以让模型以小搏大


目前所有AI投资都存在同质化现象,投资机构普遍认为:真正的价值只存在于与模型无关的应用层;所有形式的训练,包括强化学习,都没有投资价值

但现实情况是,强化学习(RL)的进步已经彻底改变了这种情况。现在的市场情况更像是风险投资出现了集体错误定价,忽视了强化学习最新的技术突破带来的巨大价值

OpenAI最近也开始表达对这一现象的不满,希望硅谷创业公司多关注 垂直领域强化学习


2)文章提到“通用模型扩展遇到了瓶颈、特定任务的强化训练效果远超预期”

这里结合昨晚最新开源的 QwQ-32B推理模型的创新 2 阶段 RL 来说:第一阶段选择放弃传统奖励模型,而专注于数学和编程任务,使用准确性验证器和代码执行服务器作为奖励信号,有效提升模型专项能力。然后在第二阶段加入通用能力训练,利用通用奖励模型和规则验证器优化,实现了少量训练步骤即提升指令遵循、人类偏好对齐及agent性能,并且不损坏数学和编程能力。通过专而精的综合是QwQ能够以 32B 媲美 671B R1的关键


GPT-4.5模型能力呈现线性增长,但算力成本却指数级飙升,OpenAI无法以合理的价格广泛部署最新的大模型

特定任务的强化训练效果远超预期。结合强化学习与推理能力训练,模型开始真正地“学习任务”,出现了一种新东西:既非传统机器学习,也不是基础模型,而是一种神秘的第三种类型。小模型突然展现出极强的数学能力;代码模型不仅会写代码,甚至能自己管理整个代码库;Claude甚至能在信息极少的情况下玩宝可梦游戏,并且做得很好


3️⃣别着急让小天才超前工作!我自己一直以来这么看待生成式模型和应用的关系:

当下他是一个刚刚学会说话的2岁半小孩,他的潜力非常大,将来会考上最好的大学,做出最棒的研究/艺术,但那是18岁之后的事,他现在也才2岁半,在2岁半的时候强行安排很多20岁才能做到的事会揠苗助长,不仅没效果还会“伤仲永”,另外生成式模型从2岁半到20岁成长的会很快,一步一步来,别急

而当下,RL 的扩展似乎是他这个年龄接受的最合适的教育

原文章和宝玉老师的翻译⬇️

https://x.com/dotey/status/1896782845248504175?s=46

01
-Zho-
4天前
又一开源推理模型!Qwen 发布 QwQ-32B,媲美 DeepSeek-R1,划重点【5】:

1)【模型/许可】:Qwen 刚刚发布了基于 Qwen2.5-Plus 的 32B 中型推理模型,Apache 2.0 开源许可
2)【RL 潜力无限】:研究发现强化学习训练可以持续提升模型性能(特别是在数学和编码领域),并且持续扩展强化学习可以让中等规模的模型获得与巨型MoE模型相竞争的性能
3)【集成 agent 能力】:将与 agent 相关的能力集成到推理模型中,模型能在利用工具的同时进行批判性思考,并能根据环境反馈调整推理过程
4)【媲美 R1】在多项指标上得分接近甚至超越DeepSeek-R1
5)【2 阶段创新 RL 训练】:
第一阶段:从冷启动开始,专注于数学和编程任务,使用准确性验证器和代码执行服务器作为奖励信号,避免传统奖励模型的复杂性
第二阶段:特化训练后加入通用能力训练,采用通用奖励模型和规则验证器优化,只需少量训练步骤即提升指令遵循、人类偏好对齐及智能体性能,且不损数学和编程能力

官网体验:chat.qwen.ai
官文: qwenlm.github.io
模型: huggingface.comodelscope.cn
Demo: huggingface.co
01
-Zho-
12天前
卧槽?全新架构!!!何恺明团队新作:分形生成模型 FractalGen!生成过程也非常好玩(附 Colab)

将模块化推向极致:把复杂模型抽象为“原子生成模块”,通过递归调用构建自相似架构,灵感源自数学中的分形

1)模块化:原子模块独立又可组合(像乐高)。实验以自回归模型为例,验证了其灵活性与潜力
2)分形特性:递归嵌套让模型在不同尺度上保持自相似,既简化设计,又能处理复杂任务,如逐像素图像生成
3)性能优异:在似然估计和生成质量上表现出色,生成图像细节丰富,概率分布精准

论文:arxiv.org
代码:github.com
Colab(免费层可跑):colab.research.google.com
00:07
10
-Zho-
12天前
猫猫拳击赛开始!!!Wan2.1 1.3B 的文生视频已经可以在 ComfyUI 中使用了!动作幅度真不错,连贯性也挺好!

A100 上测试:
5s(81帧)视频
50步
832*480
用时 3min2s
guidance_scale 建议 4.0

项目地址(已含工作流):github.com
00:15
10
-Zho-
12天前
Wan2.1 初见面!!在 Google Colab(A100 40GB VRAM)里测试了下最新开源的 Wan2.1 视频模型(附 Colab 链接):

1)文生视频 1.3B:
分辨率:832*480
用时:6分11s
参数:50步
显存:生成需 9.9GB 左右,解码需 16.8GB 左右
效果:动作幅度大且较为连贯,光影清晰对比度高,无抖动,但动态细节仍有较明显错误,整体效果还不错(如下视频所示)!

2)文生视频14B:1280*720 和 832*480,40GB VRAM 都不够用,测不了

Colab(需 Pro):colab.research.google.com
00:05
00
-Zho-
17天前
【Zho】冲!!!DeepSeek|All-In-One|ComfyUI

为迎接 @deepseek_ai 即将开启的 #OpenSourceWeek 开源周,特意开了个新项目,届时将使用 R1 模型把 DeepSeek 每天开源以及之前的所有项目迁移到 ComfyUI 中!

欢迎大家参与共建!开源冲鸭!!!

项目地址:github.com

项目节点计划:
1️⃣OpenSourceWeek 新开源项目:及时迁移
2️⃣DeepSeek R1/R1 Zero(推理模型):API 接入(API All-in-One),会将全球提供 API 的都接入
3️⃣使用 GRPO 训练你自己的推理模型(来自 @UnslothAI your own R1 reasoning model with Unsloth (GRPO))
4️⃣DeepSeek R1 Distill(蒸馏模型),本地运行
5️⃣DeepSeek R1 GGUF(量化版本),本地运行
6️⃣优化并整合现有 JanusPro(多模态统一模型),并增加 Janus 系列
7️⃣DeepSeek V3、DeepSeek VL2
……

另外,如项目图所示的我自己全新 UI 风格将在全新项目 BetterComfy 中发布:github.com
12
-Zho-
17天前
卧槽!原来 DeepSeek 才是真正的 Open AI!!!给 AI 世界上强度了!

DeepSeek 宣布下周开启“开源周”#OpenSourceWeek:每天开源一项,共 5 天,均为 “实战” 过的项目!

开源冲啊!!!如果没有 DeepSeek 的冲击,开源的共识恐怕已经在剧烈下滑了
10
-Zho-
18天前
Grok 3 已免费!!!新上的 DeepSearch 和 Think,交互好舒服(避免等待焦虑)!逻辑真清晰!还能一键发 Twitter

在 Grok 的手机端 App 上测试了一下:

1)交互:在顶部的折叠蓝框中滚动显示思考过程,可打开完整显示,这让人在等待过程非常舒服 而不是陷入等待焦虑

2)DeepSearch 逻辑清晰/Think 思维可视化清楚:理解用户请求➡️搜索相关信息并分析➡️分析具体内容➡️构建逻辑框架➡️整理框架内容➡️优化逻辑框架➡️总结答案

3)回答结构完整:三段式,每段都有“令人惊讶的细节”
第一大段:为简述回应问题
第二大段:展开具体内容,并详细分类展示所用信息(如代码和表格)
第三大段:总结关键点和提供关键引用

4)底部直接有x的分享按钮,一键发推!

这是一键分享的回答:grok.com
01:36
00
-Zho-
20天前
我不允许还有人不知道可移动双面软木墙!!!CCS冲鸭!!!
10