中国媒体报道,腾讯和清华大学、香港科技大学联合推出全新图生视频大模型 “Follow-Your-Click”。
报道称,在目前的图生影片大模型中,一般的生成方法不仅需要用户在提示词中描述运动区域,还需要提供运动指令的详细描述,过程较为复杂。另外,从产生的效果来看,现有影像产生视频技术在移动影像的指定部分上缺乏控制,产生的影片往往需要移动整个场景,而不是影像上的某一个区域,精准度和灵活性上有所欠缺。
IT 之家报道,这款图生视频模型主要功能包括局部动画生成和多对象动画,支持多种动作表达,如头部调整、翅膀拍动等。
据介绍, Follow-Your-Click 可以通过用户的点击和简短动作提示生成局部图像动画。用户只需点击对应区域,加上少量提示词,就可以让图片中原本静态的区域动起来,一键转换成视频,比如让物体微笑、跳舞或飘动。
除了能够控制单个对象的动画,这个框架还支持同时对多个对象进行动画处理,增加了动画的复杂性和丰富性。用户可以通过简单的点击和短语提示轻松地指定希望动画化的区域和动作类型,无需复杂的操作或详细描述。
资料来源:综合报道;图片来源:Follow-Your-Click 网站