作者 | 刘宝丹
编辑 | 周智宇
一个多月前,字节发布了豆包大模型家族,直接将大模型价格带入“厘时代”。如今,快手也搬出了压箱底的大模型矩阵,盯上了工具应用。
7月6日,在“新AI·新应用·新生态”论坛上,快手大模型首次集体亮相,视频生成大模型可灵、图像生成大模型可图等产品的多项新功能正式发布。
快手高级副总裁、主站业务与社区科学线负责人盖坤表示,快手搭建了以快意语言大模型、推荐大模型、视觉生成大模型为核心的大模型矩阵,覆盖内容理解、分发、生成等多个层面,并深度服务快手的商业生态场景。
快手面向AI时代打出了自研+应用的大模型矩阵,重点在于快手本身的业务提效和业绩增长。快手终于开始向大模型市场亮剑了。
亮相
千呼万唤始出来,快手大模型终于亮相了。
在会上,快手宣布,基于自研的视觉生成大模型产品可灵AI网页端正式上线,这是可灵AI在一个月内迎来的第三次重大升级,意味着,普通用户可以登录网站进行功能试用。
可灵AI基础模型也进行了升级,推出更加清晰的高画质版,以及首尾帧控制、镜头控制等全新编辑能力。同时,创作者单次生成的文生视频时长增加至10s,是业内对用户开放使用可实现的最长时长。
据介绍,可灵以真实世界物理规则为基准,生成的视频展现出了电影级别的画质与动态效果,甚至能够模拟大幅度的物理运动,打破了传统视频生成技术的局限,收获了国内外的好评。
快手视觉生成与互动中心负责人万鹏飞表示,可灵AI大模型最新发布的版本中,可灵在运动生成、生成时长、物理规律、视频画质、指令响应、图生视频、视频可控性等七个方向的能力亮点实现进一步升级,可单次生成更高清更可控的10s及更长的视频。
自从6月6日正式发布文生视频功能以来,可灵迎来了快速发展。在CVPR(IEEE国际计算机视觉与模式识别会议)期间,可灵推出了图生视频、视频续写等多项新功能。
本次论坛上,快手还正式宣布,可图将正式开源。
盖坤介绍,可图大模型集成了快手在大语言模型领域的深厚积累,通过数十亿中文语料的训练,成为最懂中文的文生图模型,其综合性能超越了SDXL/SD3等开源模型以及Midjourney等闭源模型,树立了中文场景下图像生成的新标杆。
对于开源动作,盖坤表示,这一举措旨在激发行业活力,共建一个更为繁荣的文生图大模型社区生态。
前景
从一开始,快手就很明确,大模型的核心目标是为快手体系内的场景和商业化而服务。
这主要体现在两个方面,一是内容生产,快手意在打造“新一代AIGC创作、素材工具”和低门槛、智能化的内容生产体验;二是内容消费,快手打算升级内容理解和分发体系,提升用户的消费体验。
前者主要服务于快手的商业化效率。据了解,基于快意大模型构建的视频脚本生成工具,叠加数字人技术,助力快手商业化广告主低成本生成视频和直播内容,并提升线索转化效率。
快手数据显示,AIGC营销素材在今年6月达到了单日消耗峰值突破2000万的里程碑,展示了大模型在商业场景中的巨大潜力。
快手商业化外循环和AI商业产品负责人刘逍透露,半年来,有近2万商家在快手平台借助大模型能力实现智能化经营。相比今年1月,今年6月的AIGC月活跃客户数增长了8倍,月GMV规模提升了64倍,平台AIGC广告收入规模提升了12倍。
内容生产方面,更大的市场前景来自C端用户和包含短剧在内的相关行业。
据盖坤透露,截至目前,已有超过50万用户申请可灵的内测资格,视频生成数量达700万,尤其用户通过“可灵”创造的“老照片复活”等作品,因为触动人心的力量火爆全网。
在3月的年度业绩电话会上,快手创始人兼首席执行官程一笑表示,2023年公司启动AI战略后,一步步推进自研大模型的研发训练。对于文生视频,快手已于去年底推进专项研发。
“这对短视频生态是巨大的机会,未来快手会把生成模型和生产者工具结合起来,不断帮助创作者降低创作门槛,提升短视频制作质量和效率。”程一笑如是强调。
行业方面,快手大模型已经率先用在了短剧生产上,由可灵提供深度技术支持的国内首部AIGC原创奇幻短剧《山海奇镜之劈波斩浪》已经发布预告片,不日即将上线。
对此,快手副总裁、大模型团队负责人张迪表示,“可能半年以前,大家都没法想象真正用AIGC来制作电影,(现在它)来了!”在他看来,利用AI技术可大幅度提高短剧生产、制作和运营的效率。
内容消费方面,发挥更大作用的是推荐大模型SIM。据盖坤介绍,该模型凭借十万亿参数的规模,成为全球领先的推荐系统之一。其下一代架构ACT预计每日将为快手App增加4亿分钟的用户观看时长,显著提升用户粘性和活跃度。
对于未来,快手非常笃定,盖坤表示,快手未来将继续加大在AI领域的投入,大力推动技术创新。