三花AI的个人主页

即刻App年轻人的同好社区

下载

三花AI

4关注84被关注0夸夸

三花AI

6月前

Black Forest Labs 开源最强图像编辑模型 FLUX.1 Kontext [dev]

黑森林团队(Black Forest Labs) 昨日宣布开源 FLUX.1 Kontext dev 模型。

这款目前最强的开源图像编辑模型可在 ComfyUI 中与 LoRA 结合使用。

0 00

三花AI

6月前

DRA-Ctrl：基于视频模型的跨维度图片编辑技术
DRA-Ctrl（Dimension-Reduction Attack）是一个创新的跨模态图片编辑框架，通过整合视频模型中的视觉、时间、空间和因果等多维度高维特征表示，实现对图片主体的状态预测与精准编辑。

一种非常有意思的编辑图片的思路，佬们可以在线体验下看看。

0 00

三花AI

6月前

OmniGen2 是一个统一的多模态图像编辑模型，支持单图和多图编辑。

可以理解为开源领域的 Flux Context 替代方案，支持通过自然语言指令实现精准的局部图像编辑，包括：对象删除与替换、风格转绘、颜色调整、背景处理（删除/替换）、物品添加、表情修改以及动作修改等多种编辑任务。

0 00

三花AI

6月前

DeepSite 正式推出 V2 版本，这是一款专注于网页生成的 Vibe Coding 工具。新版本可以选择接入 DeepSeek-R1 模型，现在还可以对任何网页元素进行精准编辑。

此外还新增了 "Redesign your Site!" 功能 - 只需输入网址链接，就能自动重新设计整个网站。

佬们可以在 HuggingFace Spaces 体验，值得一试，不要错过。

2 00

三花AI

6月前

佬们可以在HF演示空间进行实时测试，看来小红书这次是认真在搞大模型了！

dots.llm1 是小红书开源的最新 MoE 大语言模型，总参数达 143B ，激活参数 14B ，提供 base 和 inst 两个版本。

从官方公布的 MMLU-Pro 评分来看，表现相当不错 - 虽然比不上 DeepSeek-V3，但居然能压过 Qwen3-235B-A22B 一头。

0 00

三花AI

7月前

ComfyUI 即将推出革命性的子工作流功能，让复杂的工作流管理变得前所未有的简单。

通过将常用工作流封装为可重复使用的节点，实现一次编辑即可全局更新的高效操作。

0 00

三花AI

7月前

OpenAudio S1：支持多语言情感控制的专业级 TTS 模型

OpenAudio S1 是由 OpenAudio 团队开发的文本转语音（TTS）模型，它能像专业配音演员一样生成语音。

该模型支持丰富的情感和语气精细控制，涵盖英语、中文、日语、德语、法语等多种语言。价格非常良心，仅为每百万字节 15 美元（约合每小时 0.8 美元）。

佬们可以在官方博客查看技术报告，或者在FishAudio上直接在线体验。

小视频宝也支持这个模型！

0 01

三花AI

7月前

OmniConsistency 是一个媲美 GPT-4O 的风格迁移模型，基于 Flux-dev 框架开发，兼容任意 Flux LoRA 适配器。在人物一致性保持方面，其表现甚至优于 GPT-4O 原生模型。

佬们可以直接在 Hugging Face 在线体验空间上试玩

0 00

三花AI

7月前

ai剪辑已经发展成这样了？
最近被这类型的视频刷屏了，小视频宝紧跟热度，上新了“鸡汤V2.0”，鸡汤文、企业规则、养生赛道都能⛏起来了

00:52

3 01

三花AI

7月前

Cutemorphic 是一个完全免费且无需登录的可爱 3D 风格头像生成器，基于 OpenAI Responses API 和 gpt-image-1 实现。

佬们只需上传头像点击生成即可获得个性化 3D 头像，还可以通过提示词编辑功能进行更精细的控制。

0 00