Emu2

相对于上一个版本Emu,这个版本的改进主要有:模型结构的改进(去掉了Causal Transformer);训练数据(增加了一些grounded图像文本对数据);针对不同任务,使用不同数据二次训练了不同版本的模型(Emu2-Chat关注对话,Emu2-Gen关注可控图像生成)
  • 数据:同Emu外,增加了另外的grounded数据以及针对特定任务的数据(Chat Gen)
  • 指标:不同模型有不同的指标
  • 硬件:未提及
  • 开源:https://github.com/baaivision/Emu