随着智能硬件物联网的快速发展,人们对于智能语音交互技术的需求也越来越高。传统的语音技术虽然能够进行语音识别和合成,但在端到端的、非配合的自然口语交互模式下,识别率已经不再是唯一的核心指标。作为一家专注于智能语音交互技术的公司,思必驰更加重视端到端的、非配合的自然口语交互技术的研发,以提高用户的交互体验。
在这种端到端、非配合的口语交互模式下,机器需要具备认知智能,能够理解交互语境、理解声学环境和语言领域,跨模块融合信息进行理解、学习、推理和反馈。这就需要在传统的感知环节以外加入认知智能,并进行场景和领域自适应,形成具备容错、调节、适应能力的个性化的认知型对话系统。
对此,思必驰以基础算法技术为依托,自主研发了一系列面向产业落地的特色技术和能力。
个性化声音复刻技术
思必驰基于深度学习模型自适应技术,已实现基于非严格控制条件的小数据的高质量语音合成模型自适应,可快速复刻说话人的声音特性,实现个性化语音合成。
例如近期思必驰推出的一句话复刻功能,用户仅需录制一句话,即可复刻出自己的音色,然后输入任意文本,即可聆听由自己音色朗读的内容。
目前,思必驰“声音复刻”技术服务,支持男声、女声、童声的复刻,支持中、英文文本,支持UTF-8等多种文本格式,支持SSML标签控制。同时,该服务支持8k、16k、32k等多种采样率,支持合成mp3、wav、pcm等多种音频格式。声音复刻技术可应用于导航播报、讲故事、新闻播报、短视频配音等场景。
全双工交互技术
思必驰实现基于语义打断的全双工交互技术,机器与人可以在无唤醒情况下进行持续交互,且无关的语言不会影响任务型对话的正常继续。
例如在公共交通领域,思必驰打造了全双工智能语音交互系统的轨交智慧车站Turnkey产品级解决方案,通过为轨交车站大厅提供智能客服一体机、智能知识管理后台等,解决用户语音购票、语音咨询、服务自助处理等问题,即便乘坐公共交通,也能感受到思必驰的贴心服务。
这些技术和能力的综合应用,使得思必驰的智能语音交互系统能够在不同的场景和领域中发挥出最佳的作用。
在智能硬件物联网的时代下,智能语音交互技术已经成为了人们生活中不可或缺的一部分。思必驰将继续致力于研发更加先进、更加智能的语音交互技术,为人们的生活带来更多的便利和舒适。
延伸阅读:
- 技术解读思必驰DUI标注训练一体化平台,语音识别全场景覆盖
- NLPCC 2021丨思必驰NLU技术再突破,开拓服务数字化新视角
未经允许不得转载:零时古怪 - 中国第一时事资讯综合门户 » 思必驰:从感知智能到认知智能,打造产业级人机智能对话交互能力