我关注的其他前沿 起因是发现NLP领域的进展完全没了解 然后扩散模型 图像生成方面了解一点, 但对 文生图、视频, 了解寥寥 多模态 归CV/NLP都不太准确, 就...不想再建太多了 文生图 GLIDE DALL-E 2 Imagen 文生视频