继此前在今年6月发布基于通义千问大模型打造,集语音识别、自然语言处理、文本生成于一体的AI产品AI通义听悟,并启动公测后。日前阿里云方面宣布,通义听悟已于近期完成升级,在原有实时记录、音视频文件转写、全文概要等功能基础上线了三大新功能,其中包括国内音视频AI领域首创的视频自动提取PPT,以及浏览器插件、小程序扩展等,旨在帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容,提升职场人士和学生的工作学习效率。
据了解,通义听悟是国内首个开放公测的大型模型应用产品,且应用场景广泛,可以用于教育、娱乐、新闻等多个领域。同时通义听悟还具有高度可定制性,用户可以根据自己的需求对其进行个性化设置,例如用户可以选择特定的主题领域,以便通义听悟能够提供更加精准的内容推荐。
阿里云CTO周靖人此前曾表示,“我们的目标是让通义听悟成为用户工作学习的AI助手,专注于具有高知识附加值的音视频内容场景。通过运用先进的自然语言处理技术,通义听悟能够将音视频内容转化为易于理解的文字,帮助用户快速掌握关键信息”。
据悉,通义听悟此次新增的自动提取PPT功能通过引入视觉AI算法,可自动将PPT讲解视频分割为演示文稿,并对每页PPT进行要点总结,形成一份图文并茂的大纲,帮助用户解决培训、网课学习等场景“求PPT难”的问题。
而Chrome和Edge浏览器插件则可帮助用户全程录制会议、网课、直播、视频等内容,并实时生成双语字幕。在移动端,通义听悟钉钉和微信小程序不仅支持PC端的基础功能,还可一键转写手机和聊天记录的音视频文件,用户仅需一部手机即可记录、回顾和整理音视频内容。
值得一提的是,为了让更多用户体验到这些功能,此次新功能上线期间,阿里云方面将继续联合各大平台和社区推出定制口令码,用户根据口令码可随机抽取20h、30h、66h、88h、100h的免费转写时长。
对此阿里云方面表示,作为集成该公司先进的语音、语言和视觉AI技术的产品,通义听悟未来还将陆续上线适用于更多场景的新功能。通义听悟产品及研发负责人鄢志杰则表示,“继语音AI与大语言模型碰撞出火花后,我们持续将视觉AI引入通义听悟这一创新产品,围绕人们工作和学习中的音视频内容,希望通过全新的体验成为大家的AI助手”。
【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】
延伸阅读:
- 阿里云参与起草数据中心液冷行业标准 发布液冷一体化解决方案
- 阿里云联合NVIDIA举办TensorRT模型优化赛 探索AI加速推理方式
未经允许不得转载:零时古怪 - 中国第一时事资讯综合门户 » 阿里云通义听悟日前迎来升级,新增三项功能