简介
讯飞虚拟人是由科大讯飞推出的全栈式AI虚拟人应用服务平台。平台深度融合语音识别、语义理解、语音合成、自然语言处理及星火大模型等AI核心技术,提供虚拟人形象资产构建、AI智能驱动与多模态交互的全场景产品服务体系。该平台旨在通过先进的AI虚拟形象技术,为各行业提供高效、低成本、全栈式的虚拟人应用解决方案,覆盖从通用型视频内容生产到垂直领域智能交互的多元化需求。

核心功能
- 一站式虚拟人音视频内容生产(虚拟主播):用户可在虚拟“AI演播室”中,通过输入文本或录音,一键完成音视频作品输出,高效生成数字人播报内容。该功能尤其适用于新闻播报、企业宣传、知识口播、教育培训等场景。
- 虚拟人智能交互机:以大屏交互一体机为载体,运用多模态感知技术(视觉、听觉、触觉),实现用户与虚拟人的“面对面”实时互动交流。支持语音、触屏、人脸等多种唤醒方式,并可接入星火大模型以进行开放式知识问答,广泛应用于金融、文旅、政企等领域的业务咨询、智能问答与服务导览。
- 虚拟人能力开放与集成:为有虚拟人应用搭建和集成需求的客户提供全方位接入服务,包括终端SDK、服务端API、公有云API及私有化部署方案,支持在APP、Web、小程序等产品形态中集成应用。
- 快捷的虚拟人克隆与定制:平台提供快速便捷的个性化定制服务,支持2D真人形象克隆、3D数字人定制以及专属声音复刻。
- 丰富的数字资产库:平台内置多风格的2D/3D虚拟人形象资产及声音资产库,涵盖新闻播报、教育培训、直播带货、营销推广等多个垂直场景,用户可根据需求直接选用,快速构建虚拟内容。
产品优势
- 全栈式技术体系:以星火大模型为核心引擎,融合多模态生成、实时交互与智能驱动能力,构建从形象生成到场景落地的全栈技术体系,实现数字人从“形似”到“神似”的跨越。
- 高精度形象与声音复刻:通过少量数据即可完成1:1真人虚拟分身与声音复刻。形象定制高度还原真人,声音复刻支持个性化音色匹配,口型唇形同步精度与动作匹配度均处于行业领先水平。
- 高效率的AIGC视频生产:颠覆传统人工录制模式,只需输入文本或录音,即可由AI驱动生成虚拟人讲解视频,渲染出稿迅速,极大提升了音视频内容的生产效率,尤其在紧急突发和更新频率高的内容播报场景优势明显。
- 多模态感知与智能交互:融合语音识别、计算机视觉与情感语义理解技术,实现毫秒级响应与全双工自然交互,能精准理解复杂语义与上下文,并支持中、英等多语种实时切换,打造类人化自然对话体验。
- 灵活的部署与集成能力:提供从公有云API到私有化部署的多种接入方案,支持与APP、Web、小程序等多种终端快速集成,满足企业对数据安全、业务定制及系统融合的不同需求。
- 引领行业标准:讯飞虚拟数字人平台已通过中国信通院大模型数字人系统基础能力评测,并主导制定了2项数字人ITU国际标准,在技术创新与行业规范上具有权威性和前瞻性。
应用场景
- 新闻媒体:面向新闻媒体行业,以虚拟人替代真人主播进行新闻资讯播报,实现音视频媒体生产的流程自动化,快速响应紧急突发新闻。典型合作伙伴包括新华社、川观新闻等。
- 金融领域:为银行、证券公司等提供定制虚拟人智能客服,通过智能交互机为用户提供“面对面”有温度的业务咨询、理财介绍等服务,实现降本增效。典型合作伙伴包括上海银行、桂林银行、光大银行等。
- 政务便民:在政府服务大厅、行政中心等场景部署智能交互机,为市民提供政务咨询、办事引导、政策解读等24小时不间断的智能服务。
- 智慧文旅:在博物馆、景区、酒店等文旅场景,虚拟人可作为智能导游或迎宾大使,为游客提供景点介绍、路线指引、文化讲解等服务。
- 教育培训:利用虚拟人讲师进行课件讲解、知识口播与在线教学,丰富教学形式,降低课程录制成本。
- 企业宣传与营销:应用于企业宣传片、产品介绍、营销推广视频的制作,以及作为虚拟员工进行内部培训等。
- 电商直播:利用虚拟数字人进行24小时不间断的直播带货,通过AI驱动进行产品介绍与互动,显著降低真人主播的人力成本。
使用教程
- 确定应用需求:明确使用场景(如新闻播报、营销视频、智能客服等),并选择合适的虚拟人产品形态(如“讯飞智作”视频制作平台或“智能交互机”)。
- 选择虚拟人形象与声音:
- 使用公共资产:从平台提供的丰富虚拟人形象库和声音库中,直接选择合适的2D/3D形象与音色。
- 定制专属分身:若需定制形象,按照指引录制5-10分钟视频素材(真人形象克隆)或5分钟音频素材(声音复刻),上传至平台进行AI训练。
- 在“讯飞智作”平台制作视频:
- 访问平台:登录讯飞虚拟人平台,进入“讯飞智作”模块。
- 选择形象与声音:从库中选择或调用已训练好的自定义形象与声音。
- 输入内容:在“AI演播室”中输入文本台词,或上传录音文件。
- 一键生成:点击生成按钮,系统将自动完成语音合成、口型同步、表情生成与视频渲染,输出完整的虚拟人播报视频。
- 部署智能交互机:
- 硬件部署:根据场地需求部署大屏交互一体机终端。
- 功能配置:配置虚拟人形象、接入专业知识库与大模型能力,并设置唤醒方式、交互逻辑及UI界面。
- 集成与交付:
- 视频应用:生成的视频内容可用于官网、自媒体、广告投放等渠道。
- 软件集成:开发者可通过SDK或API,将虚拟人交互能力集成到现有的APP、Web或小程序中。
- 设备交付:智能交互机完成配置后,可直接放置于服务场景中投入使用。
价格说明
讯飞虚拟数字人平台提供灵活的模块化计费方案,以适配不同企业的规模与需求,企业可按需选配功能,有效规避预算浪费。具体价格构成主要包含以下几个方面:
- 虚拟人形象与声音定制费用:根据形象类型(2D真人克隆、3D超写实、3D卡通等)和复刻精度,价格有所差异,提供从标准到高端的多种定制方案。
- 视频内容生成时长包费用:讯飞智作等视频制作平台通常以时长包形式计费,分为2D小样本数字人、2D精品数字人等不同服务等级,并提供有效的时长服务包供用户选购。
- 智能交互机解决方案费用:包括硬件采购、软件授权、形象与知识库定制开发等综合服务费。
- 私有化部署与API调用费用:针对有私有化部署需求的客户,采用按项目和授权费用计费;API服务则根据调用量进行计费。
FAQ
Q1:讯飞虚拟数字人平台由哪家公司开发运营?
A:由科大讯飞股份有限公司开发并运营。
Q2:讯飞虚拟数字人平台的核心能力是什么?
A:以星火大模型为引擎,具备高精度2D/3D数字人形象与声音定制、AIGC内容视频生成,以及融合多模态感知与自然语言处理的智能实时交互能力。
Q3:如何定制一个属于自己的虚拟数字人?
A:通过平台提供的快捷定制服务,用户仅需录制5-10分钟的真人视频或5分钟的音频素材并上传,平台AI即可进行自动训练,生成1:1的真人虚拟分身及复刻声音。
Q4:使用讯飞虚拟数字人平台需要专业的技术背景吗?
A:不需要。对于基础的视频内容制作,用户仅需在“讯飞智作”中选择形象并输入文本即可。平台也提供SDK/API接口,供有技术集成能力的客户进行深度开发。
Q5:讯飞虚拟数字人主要应用于哪些行业?
A:已广泛应用于新闻媒体、金融、政务、文旅、教育、企业营销及电商直播等多个行业领域。
Q6:生成的虚拟人视频可以商用吗?
A:可以。用户拥有通过平台自主生成内容的合法使用权,可用于企业宣传、广告投放等商业用途。
Q7:讯飞虚拟数字人平台是否支持私有化部署?
A:支持。平台为有数据安全和系统集成需求的客户提供成熟的私有化部署方案。
Q8:讯飞虚拟数字人平台有哪些合作伙伴?
A:平台已为新华社、中国建设银行、上海银行、桂林银行、中国移动、光大银行等众多知名机构提供了虚拟人技术服务。
