近年来,随着人工智能技术的不断发展,AI语音克隆技术逐渐走进了人们的生活。这种技术可以通过分析一个人的语音特征,生成与其声音相似的语音,实现声音的“克隆”。然而,这项技术的出现也引发了一系列的争议。一方面,AI语音克隆技术可以被用于诈骗、冒充等不良行为,对社会造成潜在的危害;另一方面,它也可以被用于音频制作、语音合成等领域,为人们带来便利和创造价值。
对于音乐行业来说,AI克隆声音生成音乐的影响是巨大的。随着技术进步,在不久的将来,人们可以利用某款软件很容易地将自己的歌声转换为自己最喜欢的歌手的声音。
智能语音是人工智能的核心技术之一。从人工智能行业细分的比重来看,智能语音的比重占到22%,仅次于机器视觉所占比重,位居第二。
语音识别的研究工作可以追溯到20世纪50年代。在1952年,AT&T贝尔研究所的Davis,Biddulph和Balashek研究成功了世界上第一个语音识别系统Audry系统,可以识别10个英文数字发音。这个系统识别的是一个人说出的孤立数字,并且很大程度上依赖于每个数字中的元音的共振峰的测量。1956年,在RCA实验室,Olson和Belar研制了可以识别一个说话人的10个单音节的系统,它同样依赖于元音带的谱的测量。到21世纪之后,深度学习技术极大的促进了语音识别技术的进步,识别精度大大提高,应用得到广泛发展。
目前,语音识别技术已逐渐被应用于工业、通信、商务、家电、医疗、汽车电子以及家庭服务等各个领域。例如,现今流行的手机语音助手,就是将语音识别技术应用到智能手机中,能够实现人与手机的智能对话功能。其中包括美国苹果公司的Siri语音助手,智能360语音助手,百度语音助手等。
随着语音技术和自然语言理解技术的快速进步,AI语音语义技术已在智能翻译、智能医疗、智能汽车、智能客服、互联网语音审核等多个领域实现场景应用。
疫情之后不仅是工业领域,政务服务领域的语音机器人、传统行业企业的语音机器人也将有较高的市场增长空间。另外,NLP、AI数字员工、RPA的发展,一定程度上也将重塑AI应用场景。
2018年,全球智能语音市场仍呈现快速增长趋势,市场规模为142.1亿美元,根据预测到2024年全球智能语音市场规模将达到215亿美元,其中智慧医疗健康、智慧金融以及各类智能终端智能语音技术需求将成为主要的驱动因素。
近日,“AI诈骗”案的出现引发社会关注。对此,香港中文大学系统工程与工程管理学系教授及系主任、语音语言处理人工智能专家蒙美玲表示,开发语音语言转换技术的初衷,是利用AIGC技术帮助有语言障碍的人重建语言系统,追求音色等方面都近似本人。但没有想到这一技术会被坏人利用,成为假冒他人行骗的工具。我们不仅要在技术上思考如何进行对抗,也要通过法规进行监管。
经济学家、横琴粤澳深度合作区数链数字金融研究院学术技术委员会主席朱嘉明提出,在支持、理解和推动人工智能发展的过程中,政府、企业及社会各界首先要充分预估它的正面影响和长期作用,加强正面引导;同时,要制定相应的法律法规,使它未来的发展更加规范。
前瞻经济学人APP资讯组
更多本行业研究分析详见前瞻产业研究院《中国人工智能行业发展前景预测与投资战略规划分析报告》。
同时前瞻产业研究院还提供产业大数据、产业研究报告、产业规划、园区规划、产业招商、产业图谱、智慧招商系统、IPO募投可研、IPO业务与技术撰写、IPO工作底稿咨询等解决方案。
未经允许不得转载:零时古怪 - 中国第一时事资讯综合门户 » AI语音克隆技术引发争议 加强监管和规范十分必要!【附AI语音识别行业分析】