iVideoGPT是一种通用高效的世界模型架构。它通过提出的条件VQGAN进行视频压缩标记化,减少标记数量,加快生成速度并保持时间一致性。之后,经标记化的视频用自回归Transformer实现逐帧预测,能灵活整合多模态输入输出、兼容不同任务。
Chinese,actor,Wang,Baoqiang,has,made,history,by,becoming,the,first,male,lead,actor,born,in,the,1980s,to,surpass,the,20,billion,yuan,box,office,milestone,,according,to,the,cinema,ticket,sales,platform, ...