我关注的其他前沿

起因是发现NLP领域的进展完全没了解

然后扩散模型图像生成方面了解一点，但对文生图、视频，了解寥寥

多模态归CV/NLP都不太准确，就...不想再建太多了

文生图

GLIDE
DALL-E 2
Imagen

文生视频