即刻App年轻人的同好社区
下载
App内打开
-Zho-
118关注2k被关注11夸夸
🏡建筑师|🤖AI探险家
📝ComfyUI|AI资讯|AI测试|SD云部署|AI+建筑|2091
置顶
-Zho-
6月前
🏆来了朋友们!!!ComfyUI 全球领导力峰会第二站·东京站!!!

🚤11月CLSCN东京站开启报名!AI开源社区首次出海!

🤣CLS深圳获得海外强烈反响,我们趁热将中国AI活动带到东京,会见到亚洲领域内知名开源开发者、头部AI企业、艺术家和学术团队等,相信开源的力量!

🚗11月16日-17日在东京(*最终日期可能有前后1周调整)
😎预期规模:50-100人,依然免票审核制

🤝海外筹备不易,提前收集大家的参与意愿,以便有更多时间调整场地,日程会在近期公布~

✅详情请见:waytoagi.feishu.cn
15
-Zho-
2天前
OpenAI o3-mini 正式来了!已可在 ChatGPT 和 API 中使用

模型:
1)o3-mini:
2)o3-mini-high:所有付费用户可选,更高智能版本,响应时间更长

使用限制:
1)Pro 用户可无限制访问 o3-mini/high
2)Plus 和 Team 每天 150 条
3)免费用户可选择 Reason 按钮尝试 o3-mini(首次向免费用户提供推理模型,这不得感谢 DeepSeek 带来的冲击!

官文:openai.com
00
-Zho-
2天前
划重点:中等风险模型!

1)OpenAI o3-mini 具备接近人类的说服能力,并能生成与人类撰写的论述同样具有说服力的文本,但并未超越人类顶尖写作者,也未达到高风险门槛。评估重点在于 模型是否能影响他人改变信念或采取行动,评测方式涵盖静态与交互式模型生成内容

2)o3-mini (Pre-Mitigation) 成为首个在模型自主性上达到中等风险的模型(得益于编码与科研工程能力的提升),但由于在与自我改进相关的现实机器学习研究能力测试中表现仍不理想所以被认为还未达到高风险

-Zho-: 卧槽来了!OpenAI o3-mini 的 System Card 已经出来了:https://cdn.openai.com/o3-mini-system-card.pdf 更快、更擅长代码、科学和数学

00
-Zho-
2天前
卧槽来了!OpenAI o3-mini 的 System Card 已经出来了:cdn.openai.com

更快、更擅长代码、科学和数学
01
-Zho-
3天前
DeepSeek R1 = ComfyUI 插件自由!

我也总结了 DeepSeek R1 写代码 5 步走:学、写、修、纠、成

这下不会代码的朋友也可以实现 ComfyUI 插件自由啦!

1)学:给 R1 一个完整代码样例
2)写:R1 独立完成代码,并对其运行/验证
3)修:报错反馈给 R1 令其多次修改
4)纠:过程中 R1 可能会出现过度思考导致偏离,需纠正
5)成:代码成功运行,R1 给出结果/文件和说明

另外,这次由 R1 搞定的 Janus Pro 插件,其统一架构能实现反推生成无限迭代(反推-反推词生成-继续反推-继续生成,直到优化到满意为止),示意:
116
-Zho-
3天前
卧槽!下岗了朋友们!DeepSeek R1自己给自己的 JanusPro 成功写好 ComfyUI 插件(我没写一行!附具体过程

无需微调直接就成,无需人看代码/写代码,细节准确度高,预计交互次数理想状态下可以控制在 3-5 次以内(标准是直接就能在 ComfyUI 成功运行),体感比 O1 的细节/准确度更好(还需进一步验证

关键点:之前是 LLM 辅助我写插件,我还得了解代码本身,现在几乎无脑(不用了解代码)给 R1 就能直接交付了

具体过程如下,部分思考过程见下图:
1)我的角色:信息传递员+判断者,我没看 JanusPro 代码,直接都丢给 R1 处理
2)给 R1 的样本学习:我自己写的 Emu3 插件的完整代码(两者架构不同
3)把 JanusPro 的官方 demo 代码丢给 R1
4)R1 先将其分为3个核心节点,然后写出了完整代码,并对其做了优化和兼容性考虑(增强,还给出了使用方式和建议参数范围
5)运行之后遇到第一次报错(1个,我提出要求之后 R1 完成修改
6)运行之后遇到第二次报错(2个,成功解决,但是由于报错之后未运行第二项功能的节点,所以我提出同样也需要修改,R1 完成修改,但是漏掉了部分关键格式
7)补充完整遗漏,第一部分功能已经实现可以正常运行
8)第二部分功能 R1 做了过度思考和复杂化,导致偏离原代码,我在发现此现象后,向其提出是否已经偏离原代码,请检查,R1 回顾之前报错并纠正偏离,第二部分也成功实现并运行,运行结果如下图

项目地址:github.com
010
-Zho-
4天前
【个人观点】局部中心化收割开源生态贡献这件事本身除了恶心之外,让我加速思考开源生态价值体系的构建和本质,层级结构和门槛提升似乎是不可避免的方向,分层结构化的开源似乎是略微清晰的方向。
如果生态的发展创造与分配颠倒和被收割,那也不是真的生态,学术与商业的循环关系需要被结构化延伸。
超级个体如何进一步发展为超级群体,开源是必经之路,一定充满新的形态可能,有意思。
00
-Zho-
5天前
CCS 给大家拜年啦!祝大家新年快乐!万事如意!巳巳如意!CCS 比心!!!

(字是手写的哈哈哈哈哈
10
-Zho-
5天前
望周知,别被假账号忽悠了
10
-Zho-
6天前
【Zho】Janus-Pro-7B 初见面!!!做了版 Colab 初测了下 DeepSeek 新开源的多模态统一模型

1)模型直接支持中文交互(图像理解+图像生成
2)云上 L4 测试,显存需 22GB
3)图像生成速度:约15s/张
4)图像理解质量:文字和信息识别基本准确,内容理解完整清晰,局部细节有欠缺

由于 Gradio 界面比较 sb(显示不全结果,所以把结果拼成了一张图如下

Colab(需Pro,因需 20GB 以上显存):colab.research.google.com
02
-Zho-
6天前
卧槽!!!DeepSeek 又直接发大招了!整上多模态大一统开源模型 Janus-Pro 系列了!!!卧槽了!!!

上一个开源多模态统一模型还是Emu3(10月21号左右),我发的测试原帖在:x.com
x.com

模型(7B):huggingface.co
模型(1B):huggingface.co

等我过年期间写好JanusPro的插件和当时Emu3的插件一起发!
01