智能数字人为新一代多模态人机交互系统,快捷打造有智能、有形象、可交互的“数智分身”,引领企业服务智慧升级,助力数智化转型,提升企业沟通效率和服务温度。
1.形象自然度业界领先
5种形象类型:2D真人、2D卡通、3D写实、3D半写实、3D卡通;效果逼真:唇形、表情、姿态、动作拟人度高;定制高效:具有2D形象制作管线,支持摄影棚录制训练、3分钟视频训练、换脸定制;3D形象制作管线支持照片建模;IP授权:可提供优势IP形象授权。
2.覆盖企业服务全周期
4类企业服务版块:业务办理、用户运营、营销获客、品牌宣传;落地规模:业务办理规模市场第一;行业案例:覆盖银行、证券、保险、教育、政务、传媒、文旅、运营商、交通出行等多个行业;业务场景:业务场景丰富,数据积累量大。
3.驱动技术业界领先
3种驱动方式:文本驱动、声音驱动、单目摄像头驱动;音色种类丰富:支持60+多情感音色,支持多语种,多方言;音色自然度高:MOS评分高,无延迟感,真实度高,语音质量好。
4.交互体验佳;2种交互类型:播报、交互;时延低:首帧延迟<600ms,POC多次获得第一名;服务器并发高、服务器性能优越、软硬件配置规格高;多模交互能力全:NLP、知识图谱、视觉等多种AI技术综合运用,加深感知理解
应用场景
一站式应用平台:支持数智人运营管理全流程服务
我们的能力
接入方式:H5 / 小程序 / Android / iOS
渲染引擎:Webgl / Unity / UE
通信协议:支持RTSP / WebRTC / TRTC等多种通信协议
功能特色
1.形象生产
多种形象任君挑选,同时支持形象定
部分形象可以选择展示姿态
部分形象提供多套服装造型选择
支持对声音进行语速和音色的调整
2.交互会话
唇形语音同步,表情动作拟人
支持声音驱动和文本驱动
支持指定文本插入动作,灵活性高
落地场景丰富,落地终端多样
3.音视频播报
唇形动作与声音实时同步
支持多种手势动作,自然生动
小样本数智人制作成本低,时效快
应用场景广泛,提升企业沟通效率和服务温度