美团推出开源视频生成模型 将融入自动驾驶、嵌入式智能等场景 – 新京报
新京报贝壳财经讯(记者 陈伟晨)10月27日,美团龙猫团队上线并开放LongCat-Video视频生成模型。对于 Vincent 和 Tusheng 视频中的基本任务,集成模型达到了开源 SOTA(最先进的水平)。它还依赖于对本机视频延续任务的事先训练来持续生成长达一分钟的视频,确保一致的帧到帧同步和物理运动的合理性。 LongCat-Video模型评估围绕内部和公共基准,涵盖两个主要任务:文本到视频和图像到视频。基于视频延续任务的预训练,新模型可以稳定生成5分钟长视频,视频推理速度提升10.1倍。美团龙猫团队认为,此次发布的视频生成模型是探索“世界模型”的第一步。未来,LongCat模型将凭借其精确的能力重构现实世界的运营状况,也将融入公司近年来持续投入的自动驾驶、嵌入式智能等深度交互业务场景。编辑 杨繁芳 校对 陈迪彦