零时古怪 - 中国第一新闻资讯综合门户

零时古怪资讯网
提供最新的热点新闻资讯
首页 > 科技

比AI作图更离谱,AI声音克隆是否为大众所接受?

随着ChatGPT和AI绘图的持续火热,人工智能已不可阻挡地被推上风口浪尖。

ChatGPT完成了从3.5到4.0大模型的飞跃,StableDiffusion同样经历了从原始SD模型,到借助Lura、ControlNet等插件和其他模型的快速进阶,其所生成的图片已达到真假难辨的效果,让即便没有美术功底的用户,也能生成大师级的绘画作品,且效率惊人。

相较于ChatGPT,AI绘图的入口更多,且可以本地部署,甚至不需要联网。尤其是以StableDiffusion为首的免费开源程序,随着越来越多自由创作者的加入,已经延伸出许多功能强大的插件和风格各异的模型,其所生成的图片相较于ChatGPT也更具娱乐性和传播性,可以预测其在不久的将来还会更加强大。

 

与之相似的还有AI声音克隆工具,同样可以本地部署,通过输入同一个人的不同声音进行训练,能够还原出所训练对象的音色,达到以假乱真的效果。

如果使用自己的音色,则可以借助AI生成自己所要表达的话语内容,还可以使用歌手的声音来训练,还原歌手的音色来翻唱其他歌曲。

人工智能所发展的速度超乎了许多人的想象,因此也不可避免的带来了许多问题。比如AI绘画作品的版权纠纷问题,AI绘画使用名人图片进行训练的侵权行为,借助AI绘画生成不良图片并传播的违法行为等等。

 

而比AI绘图要冷门的AI声音克隆,其所暴露的问题可能更加突出。

由于线上的口语传播具有很强的隐蔽性,AI声音克隆所生成的内容很可能被用来远程诈骗,即便有些人能够分辨真人和AI生成语音的区别,但对于一些文化程度低或年龄较高的中老年人来说,还是容易上当受骗。

而如果用来制造虚假消息,其很大程度上降低了造谣的成本,很容易利用互联网的病毒式传播散布谣言。

在未得到正视以及法律保障之前,有关AI的这些问题估计很难为大众所接受,更多需要用户自发来约束自己的行为。

 

另一方面,如果尽可能规避负面影响,AI能够帮助用户极大地提升工作效率,这一点是毋庸置疑的,且随着人工智能的快速发展,我们可以预见AI将会与我们的工作和生活息息相关。

运用AI工具进行创作还有一定门槛限制,比如StableDiffusion绘图要调用模型的参数,需要强有力的GPU硬件来协助完成,显存和算力越高做图效率以及图形质量会更好,创作512x512分辨率图片大约占用5G显存,创作1024x1024分辨率图片大约占用14G显存,创作1920x1080分辨率图片大约占用21G显卡显存。

使用AI声音克隆工具,如果想要获得比较好的音色模仿,需要使用GPU训练十几个小时以上的时间,且建议使用8G以上显存的显卡,显卡性能越强训练所使用的时间越少,二者对CPU和内存的硬件要求则不高。

影驰新一代GeforceRTX40系列新品已经陆续上线,散热系统全面升级,极力释放新一代性能级显卡的澎湃动力,使用影驰RTX40系列显卡,为创作加速!

【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】

 

延伸阅读:

  • 天猫年度双12,影驰40系显卡狂欢购
  • 影驰天猫情人节特惠!多款存储惊喜好价,RTX 4070 TI低至6499元

 

未经允许不得转载:零时古怪 - 中国第一新闻资讯综合门户 » 比AI作图更离谱,AI声音克隆是否为大众所接受?

分享到:更多 ()
来源: 编辑:cxr4186

评论

留言/评论 共有条点评
昵称:
验证码:
匿名发表