我的第一篇顶会,ACM Multimedia 2024 Accepted!在本篇论文中,我们针对以NFT为典型代表的高相似性图文检索问题进行探索,主要贡献有:
1. 我们构建了业界内首个大型NFT图文数据集NFT1000,包含756w高质量图文数据,数据体量1.75TB;
2. 我们提出了一种名为“动态蒙版”的模型高效微调策略,使得我们仅在使用13%全量训练数据的情况下(79w v.s. 610w)模型Top1召回率提升7.4%,实现了模型训练的降本增效;
3. 我们也对AIGC for NFT 进行了一系列有益的探索,并取得还不错的结果。
后续我会出一期视频以及文字稿详细介绍这篇工作。
这篇论文对我而言具有里程碑一样的意义,它让我可以继续坚定地探索下去。我喜欢NFT,我创作NFT同时我也研究NFT,NFT就这样近乎完美地把我的兴趣爱好,我的专业以及我的研究方向融合在一起。
作为元宇宙内重要的数字资产,NFT使用场景的想象空间是无穷无尽的!未来我们会把NFT1000数据集向大众免费公开,并会联合各大Web3开源社区一起以社区的形式继续拓展它,目标是在2025的6月份之前把数据体量推到1亿,我们也大力欢迎任何对NFT感兴趣的小伙伴们能一起参与NFT的相关研究。
同时也预告一下,为了纪念这篇论文,我们准备在以太坊发一套纪念性的NFT,名为SOTA Cat,All Free Mint,敬请期待!