2月19日,《中国科技信息》杂志社新媒体中心携手中国科技新闻学会品牌传播工作委员会,组织了一场别开生面的走访活动。部分杂志读者和品牌传播委员会会员齐聚一堂,前往位于北京市西二旗的快手科技总部,与快手研究院的有关专家就国内外视频生成 AI 的现状和发展趋势,展开了一场深入的交流。
交流活动围绕着“可灵”展开。可灵是由快手 AI 团队自主研发的视频生成大模型。作为快手 AI 团队的核心成果,其自 2024 年 6 月发布后,经过持续迭代升级,已居于全球视频生成 AI 的第一梯队。
快手培训经理阮英超重点分享了可灵在短视频创作、影视特效制作等场景中的创新应用。
据了解,可灵之所以能够在视频生成 AI 领域脱颖而出,关键在于其多项创新技术成功突破了行业瓶颈。例如,可灵的高分辨率与长时长生成技术,支持生成 3 分钟 1080p 视频,并能灵活适配多种宽高比,无论是竖屏的短视频,还是横屏的影视制作,多场景需求都可以满足。在此基础上,可灵拥有强大的物理规律模拟能力,能够精准模拟真实世界的物理特性,如光影反射、流体运动及物体交互。在AI生成的一段“男子吃面条”视频中,可灵能够将人物的每个动作连贯、自然地展现出来,解决了同类模型在细节一致性上的不足。
与此同时,可灵还构建起了想象力与概念组合能力,可以将抽象文本转化为富有创意的具象画面。无论是“各省代表性动物演奏当地特色乐器”这类充满奇思妙想的虚构场景,还是跨维度的语义理解需求,可灵均能通过深度语义解析生成符合逻辑的视觉内容,突破传统 AI 视频生成工具的限制,为用户打开了一扇通往无限创意的大门。在功能拓展层面,可灵不断深化多模态技术融合。此前发布的“人脸模型”已经创新性地满足了用户创作多个包含同一人物镜头的需求,今年 1 月,可灵又推出了备受期待的 “多图参考” 模式,进一步解决了视频生成中的一致性难题。用户可以自由组合各种图片元素,让视频生成的精准性和可用性有了大幅的提升。
在互动环节,快手科技副总裁、快手研究院院长余敬中与参访读者和会员展开了深入交流。大家从技术原理聊到应用场景,从用户体验谈到科技伦理,从行业趋势展望未来发展,畅所欲言,直到活动延时结束,仍旧意犹未尽。
通过此次走访活动,参访读者和会员对视频生成 AI 有了深入的了解,大家纷纷表示将进一步关注AI领域的发展,早日将自身业务与其结合发展。
杂志收录情况:《中国知网》《中国期刊核心期刊(遴选)数据库》《中国学术期刊综合评价数据库(CAJCED)统计源期刊》《中国期刊全文数据库(CJFD)》《中国科协、中国图书馆学会(解读科学发展观推荐书目)》