太有意思了，使用Qwen-VL生成SVG矢量图，还能看着他怎

即刻App年轻人的同好社区

下载

Simon的白日梦

1年前

太有意思了，使用Qwen-VL生成SVG矢量图，还能看着他怎么一点一点画出来！🥹
OmniSVG：统一的可扩展矢量图生成模型
🧐OmniSVG 是首个支持多模态输入（文本、图像、角色参考）并生成复杂可编辑 SVG 矢量图的 AI 模型，突破以往“只能生成简单图标”的技术瓶颈，为设计工作流引入真正“结构化图形”的自动生成能力。
➡️链接：omnisvg.github.io
✨重点

●🎨 支持复杂矢量图生成：不仅能生成简单图标，还能处理复杂角色、插画类 SVG，具备从 icon 到动漫角色的高保真图形能力。
●🧠 多模态输入适配：可通过文本描述（Text-to-SVG）、图像参考（Image-to-SVG）或角色样式（Character Reference SVG）进行多种类型创作，是罕见支持多模态生成的矢量图模型。
●🪄 创新式Token建模方式：将 SVG 的结构命令与坐标参数统一编码为离散 token，既提升训练效率，又保留结构可读性，彻底区别于传统像素图生成。
●📦 高质量公开数据集 MMSVG-2M：包含 200 万带注释 SVG 样本，细分为 icon、illustration 和 character 三大类，为后续研究和标准化评估提供基石。
●⚖️ 对比现有模型优势明显：比肩 IconShop、LLM4SVG、StarVector 等项目，在结构合理性、图形复杂度和跨模态表现上全面超越。
●⚙️ 底层基于 Qwen-VL 大模型：借助强大的视觉-语言理解能力，为 SVG 生成提供自然语言理解和图像识别支持。
●📐 高度可扩展的设计潜力：适合嵌入至 UI 设计工具、AI 插画引擎、Web可视化平台等作为“可编辑可追溯”的图形生成后端。

00:15

31 218

来自圈子

人工智能讨论组

475756人已经加入