即刻App年轻人的同好社区
下载
App内打开
Simon的白日梦
8月前
太有意思了,使用Qwen-VL生成SVG矢量图,还能看着他怎么一点一点画出来!🥹
OmniSVG:统一的可扩展矢量图生成模型
🧐OmniSVG 是首个支持多模态输入(文本、图像、角色参考)并生成复杂可编辑 SVG 矢量图的 AI 模型,突破以往“只能生成简单图标”的技术瓶颈,为设计工作流引入真正“结构化图形”的自动生成能力。
➡️链接:omnisvg.github.io
✨重点

●🎨 支持复杂矢量图生成:不仅能生成简单图标,还能处理复杂角色、插画类 SVG,具备从 icon 到动漫角色的高保真图形能力。
●🧠 多模态输入适配:可通过文本描述(Text-to-SVG)、图像参考(Image-to-SVG)或角色样式(Character Reference SVG)进行多种类型创作,是罕见支持多模态生成的矢量图模型。
●🪄 创新式Token建模方式:将 SVG 的结构命令与坐标参数统一编码为离散 token,既提升训练效率,又保留结构可读性,彻底区别于传统像素图生成。
●📦 高质量公开数据集 MMSVG-2M:包含 200 万带注释 SVG 样本,细分为 icon、illustration 和 character 三大类,为后续研究和标准化评估提供基石。
●⚖️ 对比现有模型优势明显:比肩 IconShop、LLM4SVG、StarVector 等项目,在结构合理性、图形复杂度和跨模态表现上全面超越。
●⚙️ 底层基于 Qwen-VL 大模型:借助强大的视觉-语言理解能力,为 SVG 生成提供自然语言理解和图像识别支持。
●📐 高度可扩展的设计潜力:适合嵌入至 UI 设计工具、AI 插画引擎、Web可视化平台等作为“可编辑可追溯”的图形生成后端。
00:15
218

来自圈子

圈子图片

人工智能讨论组

472544人已经加入