零时古怪 - 中国第一时事资讯综合门户

零时古怪资讯网
提供最新的热点新闻资讯
首页 > 更多 > 百家星谈

大模型在线PK,扣子平台日前上线“模型广场”

日前字节跳动旗下一站式AI开发平台“扣子Coze”方面宣布上线“模型广场”功能。据悉其主要包含两方面的能力,分别是是模型集市,目前已接入包括豆包、通义千问、智谱、MiniMax、Moonshot、Baichuan等多个国内头部大语言模型,其二则是提供模型竞技场,类似搭建了一个大模型匿名PK的擂台,可帮助用户挑选出最适合自己的大语言模型。

据了解,模型竞技场的“PK”类似进行“A/B测试”,能够给予大模型真实的人类反馈,进而促进大模型快速升级迭代,为Bot应用开发提供更好的底层技术能力支持,目前其所提供的对战模式包括“随机Bot对战”、“指定Bot对战”和“纯模型对战”三种。

在随机Bot对战中,可随机选择一个Bot,并随机选择两个匿名模型,基于Bot的Promt、工作流、知识库等能力配置回答用户的问题。主要适用于评测模型在任意业务场景下的文本生成、技能和知识调用等能力。在指定Bot对战中,用户可以选择一个Bot,扣子将随机选取两个匿名模型,主要适用于评测模型在指定细分领域的文本生成、技能和知识调用等能力。而在纯模型对战中将不指定任何Bot,随机选择两个匿名模型展开对决,模型回答不受Promt、工作流等配置的限制和影响,适用于评测模型本身的文本生成等能力。

但无论何种类型的对战竞技,都需要用户对模型提问,然后基于模型回答问题所生成的内容进行AB选择、并投票,结果则将会影响模型的评分。投票完成后页面将揭晓胜负方、模型真实名称、详细配置等信息,以便用户评估大模型的能力,此外还支持用户分享对战结果。

通过这种简单的“A/B测试”游戏,用户、特别是没有相关编程经验的普通用户将能够以极低的成本广泛参与模型广场的PK对决。但有观点认为,开发者和大模型厂商将从该功能上线获得更多收益。对于开发者而言,通过大模型对战可用更简单、便捷的方式选择合适的大模型搭建Bot应用,而对大模型厂商来说,该功能由于带来了真实的人类反馈,因此这也是极为针对性的数据。

同时为激励开发者使用大模型开发Bot,扣子还联合Intel推出了“Coze AI Factory”主题Bot征集活动,重点覆盖图文创作、实用工具和互动创意等不同赛道。目前字节跳动方面或正以扣子、豆包大模型全家桶为基础,尝试搭建能够吸引开发者与用户、覆盖各领域的AI应用生态。

火山引擎总裁谭待此前曾表示,应用生态的构建不是一天两天就能形成的,反而是一堆人的群体智慧,扣子必须要构建低代码生态,能够让很多人用低门槛做更多事情,才能形成AI时代的创新。因此有观点认为,这或是暗示扣子上线模型广场是鼓励更多大模型进行合作,收集真实的应用场景数据,为优化模型提供参考。

【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】

 

延伸阅读:

  • 大模型+AI,Smartbi对话式分析再创新高度!
  • Smartbi对话式分析大模型版本发布,AI+BI颠覆产品力

 

未经允许不得转载:零时古怪 - 中国第一时事资讯综合门户 » 大模型在线PK,扣子平台日前上线“模型广场”

分享到:更多 ()
来源: 编辑:吉熟

评论

留言/评论 共有条点评
昵称:
验证码:
匿名发表