- 文章标题:EMU: GENERATIVE PRETRAINING IN MULTIMODALITY
- 文章地址:https://arxiv.org/abs/2307.05222
- ICLR 2024


- 数据:图像文本对(LAION-2B, LAION-COCO);视频文本对(WebVid-10M);图像文本交错数据(MMC4);视频文本交错数据(YT-Storyboard-1B)
- 指标:zero-shot能力(多模态理解,文生图);few-shot能力;in-the-wild能力
- 硬件:128 A100
- 开源:https://github.com/baaivision/Emu