分析|AI数字人:人工智能赛道新蓝海

赛迪顾问
2022-07-08 16:29 来自湖南省

作者:于凯迪

AI数字人是具有数字化外形的虚拟人物。通过计算机视觉、自然语言处理、智能语音、知识图谱、动作捕捉等AI技术手段实现高度拟人的交互能力和持续学习能力。2022年以来,AI新闻主持人、AI主播、AI员工轮番上岗,掀起人工智能领域新技术赛道的一片蓝海。这些虚拟形态正被赋予日益真实的外观形象和不断接近人类本身的情感和智力,成为能够同人类进行舒适、真实交互的虚拟社会角色。本文将进一步从交互模式、核心技术、应用场景三个方面解构AI数字人。

一、AI数字人是新一代人机交互范式,成为智能助手增强“人效”的重要抓手

近年来,在全球新冠肺炎疫情持续扩散的背景下,零售、教育、旅游、医疗等行业面临挑战,亟待新的产品供给模式和消费方式为行业创造生存与发展机会。AI数字人作为人机交互新范式,能够显著提升智能助手在线上教育、远程医疗、线上旅游等行业的交互效果。与侧重在视觉制作层面进行建模、渲染等虚拟形象外形设计的IP型数字人不同,AI数字人在商业、金融、直播、媒体、教育等领域交互所需的“专业素质”更强,例如AI新闻主播需要具备朗读和播报、专业化的资讯撰写、新闻摘要能力;AI带货主播需要具备互动聊天、实时语音、冷场话术创作等能力。AI数字人作为新一代人机交互范式的特点就在于其侧重情感和智力的表达。

二、AI数字人是多模态技术的发展成果,成为人工智能向认知智能演进的核心载体

在现实世界中,人类通过综合运用视觉、听觉、触觉、嗅觉等多种感官来接触和理解外界环境,AI数字人作为高度拟人化的产品,也应像人类大脑般可以同时处理听觉、视觉以及触觉认知与感知信息。AI数字人的语言表达、面部表情和具体动作需要计算机图形学、图形渲染、动作捕捉、深度学习、语音合成、语义分析等多种手段和技术的融合,是人工智能多模态融合应用的综合产物。认知智能是与人的语言、知识、逻辑相关的智能,是人工智能的高级阶段,认知智能的突破并非由单个技术所完成,而是需要结合多种不同的技术的发展。AI数字人集成了语义处理技术、语音处理技术、图像处理技术等人工智能技术,可以实现用人类熟悉的方式同人类进行沟通和互动,将成为人工智能从感知智能向认知智能发展的核心载体。

三、AI数字人是虚实融合世界的基本构成,成为连通虚拟世界的关键入口

随着新兴业态兴起,直播购物、在线教育、远程问诊等生产生活新方式加速推广;伴随超高清电视的普及应用,互动视频、沉浸式视频、VR/AR游戏等新业态正不断拓展社交、娱乐、展览、旅游等领域的边界,都为AI数字人在上述行业的应用普及提供良好的基础。AI数字人应用将优先面向金融、政府、传媒、电商等行业的专业服务场景,以AI主持人、AI主播、金融及政务行业AI顾问等虚拟身份接入。同时,互联网直播、在线教育、在线文旅、在线医疗、电竞、特效影视等诸多行业也对具有更加鲜活形象的AI数字人存在广泛的潜在需求,AI数字人正以各种职业身份渗透到各个行业,成为未来虚实融合世界的基本构成。

热点新闻