即刻App年轻人的同好社区
下载
App内打开
歸藏
530关注13k被关注26夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
置顶
歸藏
1年前
很多朋友最近老问我一些我之前写过的东西在哪里,所以整理了一下写个置顶贴,内容会定期更新:

1️⃣ 我运营的 AIGC 周刊每周一更新,主要内容是上周 AI 领域的重点动态解析以及相关的产品和文章:
op7418.zhubai.love

2⃣️ 我的Midjourney作品汇总和对应的提示词:
walling.app

3⃣️ 我开发的一些产品

帮你将 Midjourney 的图片和提示词快速收集到你的 Notion 数据库中:
mp.weixin.qq.com

帮你自动分段翻译 Midjoureny 官网的提示词:
mp.weixin.qq.com

利用 ChatGPT 自动监控对应领域的信息并处理和发送到Discord 频道:
op7418.zhubai.loveposts/2251721691841511424

4⃣️ 我写的一些教程

AI 歌手系列课程教你使用和训练自己的 AI 歌手模型:
mp.weixin.qq.com
mp.weixin.qq.com

Stable Diffusion 保姆级入门教程包括 Web UI 的部署和 LoRA 模型的使用:
op7418.zhubai.loveposts/2238998671356555264
op7418.zhubai.loveposts/2239983151969951744

Stable Diffusion 模型大神工作流解析:
mp.weixin.qq.com
web.okjike.com

教你十几分钟不用代码创建自己的AI应用
mp.weixin.qq.com
14115
歸藏
10:48
Notion AI 现在变成了一个单独的页面。

支持询问问题、单独搜索指定内容,还可以正常跟 AI 进行对话。

看起来终于有点数据库助理的样子了。

未来还会支持链接 Google Drive Github AI从中获取信息帮助回答,把所有的场景都覆盖到了。

试了一下查询内容丰富了不少,之前明明就有老搜不到。
00
歸藏
10:03
最近LLM的推理能力进步真的很快。

谷歌Deepmind宣布他们的数学模型解决了今年国际数学奥赛(IMO)中的四个问题,达到了银牌。

同时 Sam 还在评论区可能暗示Open AI的模型可以拿到金牌。

如果按Paul Christiano的预测的话,如果在 2025 年之前看到 IMO 金牌,那么AGI将会在几年内快速实现。

两个数学模型分别是:

AlphaProof,这是一个基于强化学习的正式数学推理系统。

以及 AlphaGeometry 2,几何问题解决系统的改进版本。

在训练过程中,AlphaProof 通过证明或反驳数百万个问题来提高其性能。

AlphaGeometry 2 的性能也得到了显著提升,能够解决历史上大部分 IMO 几何问题。

而且通过对 Gemini 模型的微调,AlphaProof 能够自动将自然语言问题翻译成正式语言,从而创建了一个用于训练和解决问题的大型正式问题库。

详情:deepmind.google
02
歸藏
09:49
谷歌研究,对图像中对象材质属性的参数化编辑。

能够在保持图像逼真性的同时,对对象的颜色、光泽度或透明度等材质属性进行精确控制。

本质上还是滑块Lora的思路,数据集创建的思路可以借鉴,基于SD1.5做的。

详情:research.google
00:20
02
歸藏
1天前
智谱今天早上也发布了 DiT 视频生成模型清影。

在智谱小程序、网页端和移动端都可以使用。

文生视频支持调整视频风格、情感氛围和运镜方式。

图生视频目前只支持提示词和图片输入。

简单跑了几个视频,怎么说呢,继续加油吧。
00:24
52
歸藏
2天前
Pixverse、Luma、可灵、Runway 的对比测试。

Pixverse DiT 模型也发布了,刚好完整的图生视频 DiT 凑齐了三家。

我发现 Pixverse 在文生视频上有些实诚,对提示词的响应非常好。

你只要写了它就会生成出来,不像其他几家觉得生成不好就不生成了。

比如第一个提示词是宇航员在空间里,Runway Luma 都没生成宇航员。

另外Pixvers对于奇幻和科幻的响应也很好。可灵就别说了,前两个很好,第三个也拉了。

第二个巫师施法的效果非常好,火焰甚至覆盖了巫师全身类似火焰护盾的效果,luma 直接皮克斯了,runway 也很滑稽。

第三个的提示词是“一个角色被拉进了魔法书里,旋转的页面和墨水形成现实”,属实有些难度,大家都拉了,不过Pixverse的起码能看。

图生视频这里Pixverse的优势是运动幅度非常大,是几家里面最大的,比如飞船那个。

这里面 luma 的问题是亚洲人脸变成了欧洲人,可灵是无法维持老虎那个图片的美学氛围。

Pixverse的问题是运动幅度过大带来的抽卡成功率下降。
00:45
43
歸藏
2天前
kijai 更新了他的 LivePortrait ComfyUI 插件。

基本实现了摄像头实时进行表情迁移以及将表情迁移到已有的视频中。

可以玩玩,很好玩。

项目地址:github.com
00:25
03
歸藏
2天前
LivePortrait 最近进展神速啊,已经可以直接使用 OBS 直播了,低配 Vtuber。

来源:x.com
00:30
05
歸藏
2天前
Luma 真是把图生视频玩出花了。

又更新了尾帧生成视频功能。测试了一下效果真的不错,出片率非常高,都是一次出。

极光那个我太喜欢了。Udio 新模型搞的音乐。
00:20
42
歸藏
3天前
AI 音乐生成工具 Udio 昨晚发布大量更新,音质提升非常离谱。

1.5 模型现在有:更高的音频质量、关键音调控制、多语言支持。

产品功能的更新有:专属创作页面、下载音乐片段(Stem)、音频到音频的重混功能、可分享的歌词视频。

下面是 V1 1.5 相同模型的对比
01:05
47
歸藏
3天前
Mistral 搁这里母猪下崽呢,发布Mistral Large 2模型。

模型大小为123B,刚好适合单个H100推理。

上下文长度扩展为 128k,对十几种主流语言有更好的支持。

代码与推理有了大幅提升,支持十几种编程语言。

提示词遵循能力大幅提升,同时支持工具使用和函数调用。

不开源,只能在 le Chat 上使用。

详细公告:mistral.ai
20