阿里正式发布视频模型Wan2.2-S2V，静态图片秒变会说话

通义万相

2025/08/27 03:25

全新发布的音频驱动的视频模型Wan2.2-S2V仅需输入一张静态图像、一段音频和文字描述即可生成高质量、自然流畅的动态角色视频。视频不止于“对口型”，更实现了电影级的画面控制能力，支持分钟级长视频稳定生成。不止嘴动，手势、表情、姿态都能动，兼容卡通、动物、风格化形象。

来源：通义万相，原文标题：《Wan2.2-S2V 正式发布！》

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

相关文章