日前,阿里巴巴旗下大模型产品通义听悟宣布上线多项新功能,包括音视频问答助手“小悟”、一键AI改写、思维导图生成等。其中,“小悟”通过多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现了对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。
目前用户可在单一记录页唤起“小悟”,针对最高6小时、6G大小的音视频提问任何相关话题,或直接要求“小悟”整理金句、梳理结论、写会议纪要。同时“小悟”还支持一次性扫描理解上百条音视频内容,并可将英文视频内容直接翻译、总结为中文内容。
而一键AI改写功能可将口语转为书面表达、尤其适合整理采访,思维导图自动生成功能则最多支持五级xmind脑图,适用于播客摘要等。此外,通义听悟的产品细节体验也进一步升级,包括笔记支持一键插入视频时间戳及截图、音视频文件语种自动识别等。
值得一提的是,针对学习科研场景对AI工具的强烈需求,日前通义听悟方面还推出了“高校公益计划”,向所有中国大陆高校师生直接赠送价值数千元的500小时音视频转写时长。据悉,高校师生通过后缀edu.cn的教育邮箱进行认证后,均可直接获赠500小时转写时长,存储空间从20G拓展至200G。
据通义听悟产品负责人杨帆透露,作为国内首个开放公测的大模型产品,自2023年6月发布以来,通义听悟累计已有上百万用户,包括学生、老师、白领、记者、律师、金融分析师等群体,活跃用户日均转写音视频3次以上,平台每天处理字符数约20亿字。此外他还进一步指出,团队在调研中发现通义听悟用户中学生群体占比达近5成,并且“他们活跃度相当高,后台每天收到大量私信‘求时长’”。
对于“AI+教育”是否将成为通义听悟在通义家族内部实现差异化竞争优势的破圈发力点这一问题,阿里云智能公关总监朱迅垚回应称,通义听悟是通义系列的拳头产品,团队目前主要还是立足服务好垂类教育群体的需求。杨帆也对此表示,目前通义听悟的“高校公益计划”已面向多家科研院所、高校陆续铺开视频公开课等方面合作,未来听悟也将借助阿里云平台的整体运营力量,向覆盖院校范围更广、服务教研人数更多的“AI+教育”场景迈进。
此外需要注意的是,日前杨帆还透露,“目前我们没有任何对C端收费的计划,C端的应用承载的使命,更多是向所有用户展现阿里技术的研究方向。通过API(应用程序编程接口)的方式在B(企业)端实现商业化,是我们的产品策略”。
【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】
延伸阅读:
- 阿里云AI新品“通义听悟”开放公测
- 继安卓版本后,通义千问App上架苹果App Store
未经允许不得转载:零时古怪 - 中国第一时事资讯综合门户 » 通义听悟上线多项新功能,并推出高校公益计划