零时古怪 - 中国第一时事资讯综合门户

零时古怪资讯网
提供最新的热点新闻资讯
首页 > 科技

腾讯混元大模型迎来升级,正式开放文生图功能

日前,腾讯方面宣布腾讯混元大模型迎来升级,并正式开放“文生图”功能。据官方透露,升级后的腾讯混元中文能力整体超过ChatGPT3.5,其代码能力大幅提升20%、达到业界领先水平。腾讯混元大模型文生图技术负责人芦清林对此表示,腾讯文生图从去年8月份开始着手,最早在广告场景进行探索,今年被作为重点项目正式大力度投入,现正在探索生成3D和视频的形式。

据悉,文生图是AIGC领域的核心技术之一,对模型算法、训练平台、算力设施较高的要求。针对语义理解、内容合理性,以及画面质感这三个技术难点,腾讯方面也均进行了优化。其中在语义理解方面,腾讯混元采用中英文双语细粒度模型,通过同时建模中英文实现双语理解,并通过优化算法提升了模型对细节的感知能力与生成效果。在内容合理性方面,混元文生图通过增强算法模型的图像二维空间位置感知能力,让生成的图像结构更合理,减少错误率。而在画面质感方面,混元文生图则是基于多模型融合的方法,来提升生成质感。

芦清林表示,腾讯混元的文生图应用的特点是更在意真实与美的统一,因此经过模型算法的优化之后,混元文生图的人像模型,包含发丝、皱纹等细节的效果提升了30%,场景模型包含草木、波纹等细节的效果提升了25%。据悉,目前腾讯混元文生图能力已经被用于素材创作、商品合成、游戏出图等多项业务中,在多轮测评中,其案例优秀率和广告主采纳率分别达到了86%和26%。

在商业化方面,芦清林表示其体量“非常大”,而且未来不会仅面向广告业务,后续还会面向其他业务开放。目前腾讯内部已有多个开发平台接入了腾讯混元大模型,有超过180个内部业务接入,包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。对此芦清林强调,腾讯其他产品团队是从产品的视角考虑用户更需要什么,并提出技术方面的需求,混元再来配合。

公开资料显示,混元大语言模型于9月7日在2023腾讯全球数字生态大会上正式亮相,并宣布通过腾讯云对外开放,其具备中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。值得注意的是,其拥有超千亿参数规模,预训练语料超2万亿tokens,当时已经接入腾讯50多个业务并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。

【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】

 

延伸阅读:

  • 腾讯混元大模型通过备案,将陆续对公众开放
  • 腾讯混元大模型已通过备案,即将正式对公众开放

 

未经允许不得转载:零时古怪 - 中国第一时事资讯综合门户 » 腾讯混元大模型迎来升级,正式开放文生图功能

分享到:更多 ()
来源: 编辑:cxr4186

评论

留言/评论 共有条点评
昵称:
验证码:
匿名发表