零一万物开源新模型，同系列代码、数学能力最强--零时古怪为您提供最新的热点新闻资讯

继此前在今年1月开源多模态模型 Yi-VL-34B后，日前零一万物方面再次宣布开源旗下大模型Yi-9B。据了解，Yi-9B实际参数规模为8.8B，是在Yi-6B（使用了3.1T tokens训练）的基础上使用0.8T tokens继续训练，训练数据截至时间为2023年6月，上下文长度则与零一万物Yi系列其他模型一样、默认为4K tokens。

据悉在训练Yi-9B的过程中，零一万物预训练团队在Yi-6B和Yi-34B的训练方法基础上，进行了更深入的模型结构和训练过程分析，采用模型深度扩增和多阶段增量训练相结合的方式，并取得了显着效果。

目前，Yi-9B还是Yi系列模型中代码和数学能力最强的模型。其中在代码能力方面（Mean-Code），Yi-9B的性能仅次于DeepSeek-Coder-7B，超越了Yi-34B、SOLAR-10.7B、Mistral-7B和Gemma-7B。而在数学能力方面（Mean-Math），Yi-9B的性能仅次于DeepSeek-Math-7B，超越了SOLAR-10.7B、Mistral-7B和Gemma-7B。

此外在综合能力方面（Mean-All），Yi-9B的性能在尺寸相近的开源模型中最好，超越了DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B。在常识和推理能力方面（Mean-Text），Yi-9B的性能与Mistral-7B、SOLAR-10.7B和Gemma-7B不相上下。

对此零一万物方面表示，“一直以来，Yi系列模型的中英文能力很强，但在代码和数学方面还有提升空间。Yi-9B补足了这一短板，增强了Yi系列模型全方位的能力”。值得一提的是，据零一万物方面透露，Yi-9B（BF16）及其量化版Yi-9B（Int8）均能够在消费级显卡上轻松部署，使用成本较低，对开发者更友好。

【以上内容转自“三易生活网”，不代表本网站观点。如需转载请取得三易生活网许可，如有侵权请联系删除。】

未经允许不得转载：零时古怪 - 中国第一时事资讯综合门户 » 零一万物开源新模型，同系列代码、数学能力最强

	亮剑AWE2023 夏普尖端电视产品彰显品牌百年底蕴
	IDC一季度国内智能手机市场排名来了！OPPO重回第一
	价格涨飞了专业相机市场正式复苏交易单价稳步上涨
	高通面向移动和XR设备推出全新游戏画面增强技术
	官方解释来了!李小龙回应华为P60 Pro充电器设计争议
	AWE 2023聚焦：创维全新壁纸电视A7D系列首发亮相
	演员严宽：拥有问界M5快一年了我的评价是遥遥领先！
	3500搞定？诺基亚XR30渲染图曝光搭载4600mAh电池
	对抗特斯拉！雷诺联手高通和谷歌打造全新软件架构
	联发科技官宣天玑9200+旗舰芯！5月10日强悍来袭

零时古怪 - 中国第一时事资讯综合门户

零一万物开源新模型，同系列代码、数学能力最强

相关推荐

亮剑AWE2023 夏普尖端电视产品彰显品牌百年底蕴

IDC一季度国内智能手机市场排名来了！OPPO重回第一

价格涨飞了专业相机市场正式复苏交易单价稳步上涨

高通面向移动和XR设备推出全新游戏画面增强技术

官方解释来了!李小龙回应华为P60 Pro充电器设计争议

AWE 2023聚焦：创维全新壁纸电视A7D系列首发亮相

演员严宽：拥有问界M5快一年了我的评价是遥遥领先！

3500搞定？诺基亚XR30渲染图曝光搭载4600mAh电池

对抗特斯拉！雷诺联手高通和谷歌打造全新软件架构

联发科技官宣天玑9200+旗舰芯！5月10日强悍来袭

评论