日前,腾讯云方面正式发布国内首个AI原生(AI Native)向量数据库“腾讯云向量数据库”(Tencent Cloud VectorDB)。据悉,向量数据库专门用于存储和查询向量数据,业界称之为大模型的“海马体”,可解决大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题,并突破大模型在时间和空间上的限制,加速大模型落地行业场景。
对此,腾讯云数据库副总经理罗云表示,“如果你看好AI大模型,就应该看好向量数据库”。并且他还指出,随着大模型的不断发展和普及,AI原生向量数据库将成为企业数据处理的标配。
据了解,腾讯云向量数据库预计将于今年8月上线腾讯云官网,其将能够被广泛应用于大模型的训练、推理和知识库补充等场景,例如支撑训练阶段海量数据的分类、去重和清洗,给大模型的训练降本增效;通过新数据的带入,帮助大模型提升处理新问题的能力,突破预训练带来的知识时间限制,避免大模型出现幻觉等。
据腾讯云方面介绍,将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗,相比传统方式可实现10倍效率的提升,如将其作为外部知识库用于模型推理,则可将成本降低2-4个数量级。
值得一提的是,腾讯云还重新定义了AI原生的开发范式,提供了接入层、计算层、存储层的全面AI化解决方案,腾讯云向量数据库也是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库,使得用户在使用向量数据库的全生命周期都能应用到AI能力。
其中在接入层,腾讯云向量数据库支持自然语言文本的输入,同时采用“标量+向量”的查询方式,支持全内存索引;在计算层,AI原生开发范式能实现全量数据AI计算,一站解决企业在搭建私域知识库时的文本切分(segment)、向量化(embedding)等难题;在存储层,腾讯云向量数据库支持数据智能存储分布,让企业存储成本降低50%。
据官方公布的相关数据显示,腾讯云向量数据库最高支持业界领先的10亿级向量检索规模,并可将延迟控制在毫秒级,相比传统单机插件式数据库检索规模提升10倍,同时还具备百万级每秒查询(QPS)的峰值能力。据悉,使用腾讯云向量数据库后,企业接入大模型需要花费的时间能从一个月降低至三天左右。
目前,腾讯云向量数据库已经历腾讯内部业务的长期锤炼,覆盖了腾讯视频、QQ浏览器、QQ音乐等上百个业务场景,每日调用量超千亿次,并且该数据库能有效助力产品提升运营效率。据官方公布的相关数据显示,使用腾讯云向量数据库后,QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低37.9%。
而关于腾讯云向量数据库的商业化,罗云表示,目前该数据库可以单独对外提供,未来也不排除将其和其它相关产品打包售卖的可能性。
【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】
延伸阅读:
- 腾讯云披露行业大模型进展,以及MaaS能力全景图
- 高分通过!腾讯云TCE获得商用密码应用安全性评估认证
未经允许不得转载:零时古怪 - 中国第一时事资讯综合门户 » 面向大模型,腾讯云发布首个AI原生向量数据库