Kaiyun·(官方定制)-中国大陆未来网站

18568522466
当前位置: 首页 > 行业资讯 > 公司新闻

Soul引领AI社交实时人像视频生成研究成果获国际学术顶会录用

2025-05-30 05:59:27 小编

  在科技飞速发展的当下,AI与各行各业的融合正成为行业变革的新趋势。前不久,IEEE国际计算机视觉与模式识别会议CVPR2025公布论文录用结果,新型社交平台Soul凭借实时人像视频生成研究成果,成功闯入大家视野,被CVPR2025录用,为AI社交领域注入了新的活力。

Soul引领AI社交实时人像视频生成研究成果获国际学术顶会录用(图1)

  CVPR是人工智能领域*具学术影响力的*会议之一,是中国计算机学会(CCF)推荐的A类国际学术会议。在谷歌学术指标2024年列出的全球*有影响力的科学期刊/会议中,CVPR位列总榜第2,仅次于Nature。根据会议官方统计,本次CVPR2025会议总投稿13008篇,录用2878篇,录用率仅为22.1%。相较2023年(25.8%)、2024年(23.6%),录用率的持续下降也凸显了CVPR不断严格的审核标准,以及论文入选竞争的逐年激烈。SoulApp能在这样的竞争环境中崭露头角,充分展现了其强大的技术研发实力。

  Soul作为较早思考将AI应用于社交领域的平台,早在2016年就推出灵犀引擎,借助AI算法重构社交关系网络。此后,在AI技术研发的道路上持续深耕,2020年开启AIGC技术研发,聚焦多模态领域,并于2023年推出自研语言大模型SoulX。目前,Soul已陆续上线了语音生成大模型、语音通话大模型、音乐生成大模型等语音大模型能力。SoulAI大模型能力已整体升级为了多模态端到端大模型,支持文字对话、语音通话、多语种、多模态理解、真实拟人等特性,能够实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。

  Kaiyun有哪些新产品即将推出?

  在Soul看来,AI融入社交场景,除了需要AI介入内容表达以及关系的发现、建立、沉淀等环节,提高社交效率和社交体验,同时也需要AI作为交互对象向个体提供情绪价值。而这要求团队必须加快提升AI的感知能力和交互能力,即需要在语音、视觉、NLP的融合上下功夫,让用户能实时与具备形象、表情、记忆的AI多模态交互,而这也是更接近真实社交互动的方式。

  在近期接受媒体采访中,SoulAppCTO陶明这样解释团队关注视觉交互的逻辑,“从交互的信息复杂度来讲,人和人面对面的沟通是信息传播方式*快的,也是*有效的一种。所以我们认为在线上人机交互的过程当中,需要有这样的表达方式。”

  此次论文的研究成果正是Soul在融合视觉的多模态交互方向的积极探索。在论文中核心介绍了Soul团队为提高视频生成效率以及生成效果的拟人性、自然度所提出的创新方法。

  在未来,Soul将在AI技术上持续创新,致力于打造出更具沉浸感和趣味性的社交体验,为用户带来更多惊喜。

联系专业的商务顾问,制定方案,专业设计,一对一咨询及其报价详情
服务热线服务热线 18568522466
免费互联网咨询服务

联系我们 contact us
18568522466