即刻App
年轻人的同好社区
下载
App内打开
三花AI
4
关注
84
被关注
0
夸夸
三花AI
6月前
Black Forest Labs 开源最强图像编辑模型 FLUX.1 Kontext [dev]
黑森林团队(Black Forest Labs) 昨日宣布开源 FLUX.1 Kontext dev 模型。
这款目前最强的开源图像编辑模型可在 ComfyUI 中与 LoRA 结合使用。
0
0
0
三花AI
6月前
DRA-Ctrl:基于视频模型的跨维度图片编辑技术
DRA-Ctrl(Dimension-Reduction Attack)是一个创新的跨模态图片编辑框架,通过整合视频模型中的视觉、时间、空间和因果等多维度高维特征表示,实现对图片主体的状态预测与精准编辑。
一种非常有意思的编辑图片的思路,佬们可以在线体验下看看。
0
0
0
三花AI
6月前
OmniGen2 是一个统一的多模态图像编辑模型,支持单图和多图编辑。
可以理解为开源领域的 Flux Context 替代方案,支持通过自然语言指令实现精准的局部图像编辑,包括:对象删除与替换、风格转绘、颜色调整、背景处理(删除/替换)、物品添加、表情修改以及动作修改等多种编辑任务。
0
0
0
三花AI
6月前
DeepSite 正式推出 V2 版本,这是一款专注于网页生成的 Vibe Coding 工具。新版本可以选择接入 DeepSeek-R1 模型,现在还可以对任何网页元素进行精准编辑。
此外还新增了 "Redesign your Site!" 功能 - 只需输入网址链接,就能自动重新设计整个网站。
佬们可以在 HuggingFace Spaces 体验,值得一试,不要错过。
2
0
0
三花AI
6月前
佬们可以在HF演示空间进行实时测试,看来小红书这次是认真在搞大模型了!
dots.llm1 是小红书开源的最新 MoE 大语言模型,总参数达 143B ,激活参数 14B ,提供 base 和 inst 两个版本。
从官方公布的 MMLU-Pro 评分来看,表现相当不错 - 虽然比不上 DeepSeek-V3,但居然能压过 Qwen3-235B-A22B 一头。
0
0
0
三花AI
7月前
ComfyUI 即将推出革命性的子工作流功能,让复杂的工作流管理变得前所未有的简单。
通过将常用工作流封装为可重复使用的节点,实现一次编辑即可全局更新的高效操作。
0
0
0
三花AI
7月前
OpenAudio S1:支持多语言情感控制的专业级 TTS 模型
OpenAudio S1 是由 OpenAudio 团队开发的文本转语音(TTS)模型,它能像专业配音演员一样生成语音。
该模型支持丰富的情感和语气精细控制,涵盖英语、中文、日语、德语、法语等多种语言。价格非常良心,仅为每百万字节 15 美元(约合每小时 0.8 美元)。
佬们可以在官方博客查看技术报告,或者在FishAudio上直接在线体验。
小视频宝也支持这个模型!
0
0
1
三花AI
7月前
OmniConsistency 是一个媲美 GPT-4O 的风格迁移模型,基于 Flux-dev 框架开发,兼容任意 Flux LoRA 适配器。在人物一致性保持方面,其表现甚至优于 GPT-4O 原生模型。
佬们可以直接在 Hugging Face 在线体验空间 上试玩
0
0
0
三花AI
7月前
ai剪辑已经发展成这样了?
最近被这类型的视频刷屏了,小视频宝紧跟热度,上新了“鸡汤V2.0”,鸡汤文、企业规则、养生赛道都能⛏起来了
00:52
3
0
1
三花AI
7月前
Cutemorphic 是一个完全免费且无需登录的可爱 3D 风格头像生成器,基于 OpenAI Responses API 和 gpt-image-1 实现。
佬们只需上传头像点击生成即可获得个性化 3D 头像,还可以通过提示词编辑功能进行更精细的控制。
0
0
0