凌晨3点17分,新区企业炫佳科技的一间实验室里,首席科学家武文博士与团队成员紧盯屏幕,共同观看一支动画样片。有趣的是,这支样片是
“这意味着,我们自主研发的Kino动画垂类大模型训练成功了。”武文说,“这是一次技术突破,也是底层逻辑的创新。”
作为当下最受关注的前沿技术, AI的应用越来越广泛。利用 AI技术,生成文案、图片、视频等内容,这样的生成式人工智能(AIGC)也正走进我们的生活,吸引众多企业涌入赛道。
深耕视听行业多年的炫佳科技,就奔跑在这一风口之上。去年,公司推出了 “Kino-AIGC视听制作平台”,利用AI进行脚本创作、角色创建、分镜生图、视频剪辑等。而随着公司业务量日益增加,一个问题也由此显现:与文本生成相比,视频生成的计算量更大,画质与成本之间也难以平衡。
“我们必须找到第三条路径。”武文感慨。正因于此,团队开始寻找“低成本”的解决方法,他们创造性提出“GAN+Diffusion Transformer”混合架构。据介绍,这套架构可以将复杂问题“拆解”,既能快速生成低分辨率草稿,又能无缝升级至4K超清,实现“快速出片”和“极致画质”间的自由切换。
基于这套创新架构,从公司的业务核心动画板块出发,炫佳团队训练出了 Kino动画垂类大模型。“我们精准‘喂养’了5万分钟动画素材,最终仅用8张H100显卡就实现了动画制作。”武文介绍。
彼时,恰好一家头部动画公司发来需求,希望团队在一个月内完成 10集4K动画制作。利用这一动画大模型,炫佳不仅完成了任务,还将单集番剧的制作周期从2周缩短至3天,预计制作成本下降超过70%。
低成本、少语料、高效率,Kino动画垂类大模型的成功训练,带来的是技术范式的变化。“不仅是动画,短剧、音乐甚至特效、场景等,都可以进行模型迭代。”武文说。
例如,在近日举行的第二十一届中国(深圳)国际文化产业博览交易会上,炫佳科技作为南京文化特色企业亮相,其与广西广电联合推出的出海微短剧也成为展区焦点。
这部短剧,完全由AI生成,从演员、场景、剧情到配音,都与海外观众喜好适配。据了解,短剧还搭载“智能文化适配引擎”,可实现中、英、泰等六国语言同步译制,角色对话也能保留原声韵律。
“这部短剧,就来源于我们的Kino短剧垂类大模型。”武文介绍,当前,短剧大模型还在技术迭代中,投入应用后,可助力国产爆款短剧出海。此外,炫佳团队还构建了一个“数字资产模型超市”,覆盖文化遗产活化、虚拟拍摄、IP开发等场景。在他们的设想中,未来,无论是还原敦煌飞天动画,还是搭建各种幻想场景,都将有垂直且低成本的大模型来制作。
“科技与文化犹如鸟之双翼,我们希望用AIGC技术,为行业发展提供新动能。”
武文向小北透露,近期,在华为南京研究所内,炫佳科技技术团队也在与昇腾计算团队进行联合攻关。双方合作的“鲲鹏计划”已完成昇腾910B芯片适配测试,8K雪崩特效生成效率提升65%。待技术路径“跑通”,炫佳的AI视频技术就可以实现“全国产化”。从单点突破到生态共建,这个团队想做的还有很多。