可灵AI

可灵AI是快手推出的领先AI视频生成大模型,支持文生视频与图生视频,画面逼真、动作流畅,为创作者提供强大的AI视频与图像生成创作能力。

访问官网
可灵AI

特点

文生视频与图生视频

输入一段文字或上传一张图片,可灵AI即可在数十秒内生成一段画面连贯、动作自然的高清视频,极大降低视频创作门槛。

动态笔刷控制

通过简单的笔刷涂抹或路径指示,精准控制视频中物体的运动轨迹与方向,让创意细节随心而变,告别完全随机的生成。

高清画质与视频延展

输出分辨率最高可达1080p,支持单段生成最长约2分钟的视频,并能对已有视频进行智能延展,保持场景与风格一致性。

基本信息

可灵AI
  • 出品方:北京快手科技有限公司
  • 产品类型:AI 视频生成与编辑大模型
  • 首次发布:2024 年 6 月(内测阶段)
  • 核心能力:将文本描述、图片或视频片段转化为高保真视频,支持图生视频、文生视频、视频续写及运动笔刷等交互方式
  • 技术架构:基于快手自研的 3D VAE 和扩散 Transformer 架构,融合时空注意力机制,可生成 1080p 分辨率、最长 2 分钟的视频内容
  • 主要功能:文生视频(输入文字直接生成)、图生视频(上传图片并添加描述)、视频延长(对已有片段进行补全)、运动笔刷(指定画面中物体的运动轨迹)
  • 支持语言:中文、英文等多语言文本输入
  • 适用场景:短视频创作、广告制作、影视预演、教育培训、社交媒体内容生成等
  • 平台兼容:Web 端及移动端 App(iOS / Android),部分功能需内测资格
  • 前沿升级:1.5 版本起新增“图生视频”高清模式、多主体分离控制、物理模拟优化等特性

所获荣誉

可灵AI
  • 2024世界人工智能大会“镇馆之宝”:可灵AI在2024年世界人工智能大会(WAIC)上,凭借其领先的视频生成能力与实拍级画质,被评选为大会最高荣誉“镇馆之宝”,成为该届唯一获此殊荣的AI视频生成产品。
  • 2024中国AIGC产业峰会“年度创新产品”:在由量子位主办的中国AIGC产业峰会上,可灵AI荣获“年度创新产品”奖项,表彰其在AI视频生成领域的技术突破与商业应用价值。
  • 2024快手年度技术突破奖:作为快手自研的AI视频生成大模型,可灵AI荣获快手集团内部“年度技术突破奖”,以肯定其在多模态生成、长视频流畅度与可控性上的核心技术成果。
  • 2024中国人工智能大会“最佳应用实践奖”:在中国人工智能学会主办的年度大会上,可灵AI因其在影视级视频生成、虚拟人动作生成等场景中的创新落地,获得“最佳应用实践奖”。
  • 2024全球数字经济大会“AI创新标杆”:可灵AI在2024全球数字经济大会上被评为“AI创新标杆”,其支持的文生视频、图生视频、以及首尾帧控制功能,被认为重新定义了视频创作的生产效率。

发展历史

2024年6月

快手旗下AI团队正式对外发布可灵AI,这是一款基于扩散模型的视频生成大模型,支持文生视频、图生视频及延续视频功能。内测期间面向创作者开放申请,因生成画质与运动合理度突出迅速引发关注。

2024年7月

可灵AI上线1.0版本,在原有基础上升级了视频时长与分辨率,支持最长10秒、1080p视频生成。同时推出“运动笔刷”功能,允许用户对画面中特定对象指定运动轨迹,可控性明显提升。

2024年9月

可灵AI 1.5版本发布,核心改进在于光影一致性、物理运动模拟和细节丰富度。新增“首尾帧控制”功能,用户可定义视频起始与结尾画面,再由模型自动补全中间过程。该版本大幅降低了手部、肢体等复杂结构的变形问题。

2024年12月

可灵AI 1.6版本上线,重点增强了对复杂场景的理解能力,包括多人互动、高速运动物体和微距镜头表现。同步推出“图生视频”高清模式,支持将单张图片扩展为连贯动态视频,并开放了API接口供企业级用户调用。

2025年3月

可灵AI升级至2.0版本,实现“可图”与“可灵”两大模型深度融合。新版本支持单模型同时处理图像生成与视频生成任务,并加入“参考视频风格迁移”功能,用户上传一段参考视频即可使生成画面保持相同色调、构图与动态节奏。推理速度较1.6版本提升40%,生成成本下降近半。

2025年5月

可灵AI推出2.1更新,引入“AI演员”模式,用户可上传人物多角度照片生成专属数字分身,并在生成的视频中精准复现表情、动作与口型。同期上线“剧本转视频”工具,支持输入分镜描述后自动生成多段连贯镜头并拼接成短片,标志着从辅助生成向自动化创作工作流的跨越。