美团LongCat团队正式发布LongCat-Video视频生成模型,旨在以视频生成路径探索“世界模型”,为自动驾驶、具身智能等场景夯实技术基础。
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
美团LongCat团队正式发布LongCat-Video视频生成模型,旨在以视频生成路径探索“世界模型”,为自动驾驶、具身智能等场景夯实技术基础。
该模型基于DiT架构,以“条件帧数量”区分任务,原生支持文生、图生视频及视频续写,形成任务闭环。可生成720p/30fps高清内容,原生支持5分钟级长视频输出,通过多重技术规避时序与物理合理性问题;经三重优化提升推理效率10.1倍。
其136亿参数基座模型在文生、图生视频任务中达开源SOTA,VBench等测试表现优异。模型已开源至GitHub、Hugging Face等平台,供开发者使用。