即刻App年轻人的同好社区
下载
App内打开
莫唯书_Mark
1年前
多模态MiniGTP-4开源了,同时支持在线体验,可以把玩的应用场景有根据手写草稿创建网站、生成图像描述、根据图像创作诗歌、为图像中显示的问题提供解决方案、跟GTP聊图、根据提供的宣传图想广告文案、根据美食照片教你如何做饭等。

从技术上来说,MiniGTP-4将来自预训练的视觉编码器的视觉信息与大语言模型对齐。具体来说分为两个阶段来训练:第一个阶段进行传统的预训练,第二个阶段是在对话数据集上进行微调,从而显著提升生成内容的可靠性,感兴趣的朋友可以去体验下。

小彩蛋:论文的一作和二作名字后面都标上了On Job Market!的注释,看来是临近毕业有点着急找工作了

Github项目地址:github.com
Demo体验地址:minigpt-4.github.io
927

来自圈子

圈子图片

AI探索站

64913人已经加入