输入一段文字或上传一张图片,可灵AI即可在数十秒内生成一段画面连贯、动作自然的高清视频,极大降低视频创作门槛。
通过简单的笔刷涂抹或路径指示,精准控制视频中物体的运动轨迹与方向,让创意细节随心而变,告别完全随机的生成。
输出分辨率最高可达1080p,支持单段生成最长约2分钟的视频,并能对已有视频进行智能延展,保持场景与风格一致性。
快手旗下AI团队正式对外发布可灵AI,这是一款基于扩散模型的视频生成大模型,支持文生视频、图生视频及延续视频功能。内测期间面向创作者开放申请,因生成画质与运动合理度突出迅速引发关注。
可灵AI上线1.0版本,在原有基础上升级了视频时长与分辨率,支持最长10秒、1080p视频生成。同时推出“运动笔刷”功能,允许用户对画面中特定对象指定运动轨迹,可控性明显提升。
可灵AI 1.5版本发布,核心改进在于光影一致性、物理运动模拟和细节丰富度。新增“首尾帧控制”功能,用户可定义视频起始与结尾画面,再由模型自动补全中间过程。该版本大幅降低了手部、肢体等复杂结构的变形问题。
可灵AI 1.6版本上线,重点增强了对复杂场景的理解能力,包括多人互动、高速运动物体和微距镜头表现。同步推出“图生视频”高清模式,支持将单张图片扩展为连贯动态视频,并开放了API接口供企业级用户调用。
可灵AI升级至2.0版本,实现“可图”与“可灵”两大模型深度融合。新版本支持单模型同时处理图像生成与视频生成任务,并加入“参考视频风格迁移”功能,用户上传一段参考视频即可使生成画面保持相同色调、构图与动态节奏。推理速度较1.6版本提升40%,生成成本下降近半。
可灵AI推出2.1更新,引入“AI演员”模式,用户可上传人物多角度照片生成专属数字分身,并在生成的视频中精准复现表情、动作与口型。同期上线“剧本转视频”工具,支持输入分镜描述后自动生成多段连贯镜头并拼接成短片,标志着从辅助生成向自动化创作工作流的跨越。