Vidu是北京生数科技有限公司研发的AI视频大模型,一个由来自清华大学人工智能研究院和顶尖科技公司的专家团队创立的公司,致力于开发前沿的多模态大模型,这些模型通过融合文本、图像、3D和视频等信息,解锁了创意产业的新可能性。
多模态能力:
- 图像生成:基于文本描述生成高质量和多样化的图像。
- 3D生成:从文本或图像输入生成个性化的3D模型,或对现有模型进行自动化编辑。
- 视频生成:利用简单文字输入生成个性化的视频内容。
公司的技术成果在多个领域得到应用
- 高速采样:DPM-Solver-v3等技术显著提高了采样效率。
- 高效训练:开发了具有4位状态的内存高效优化器。
- 可控生成:通过参数高效调整,实现精确的模型控制。