字节跳动豆包大模型团队正式开源首个多语言类SWE数据集

钛媒体App 4月10日消息,字节跳动豆包大模型团队正式开源首个多语言类SWE数据集——Multi-SWE-bench,可用于评估和提升大模型“自动修 Bug”能力。在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言,是真正面向“全栈工程”的评测基准。其数据均来自GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。

本文内容仅供参考,不构成投资建议,请谨慎对待。

评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报右侧

投资日历
更多
Baidu
map