阿里正式发布视频模型Wan2.2-S2V,静态图片秒变会说话 通义万相 03:25 全新发布的音频驱动的视频模型Wan2.2-S2V仅需输入一张静态图像、一段音频和文字描述即可生成高质量、自然流畅的动态角色视频。视频不止于“对口型”,更实现了电影级的画面控制能力,支持分钟级长视频稳定生成。不止嘴动,手势、表情、姿态都能动,兼容卡通、动物、风格化形象。 来源:通义万相,原文标题:《Wan2.2-S2V 正式发布!》风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。