欢迎光临浙江地方网!

今天是 2024年05月02日 星期四

关注社会热点

一起实现我们的中国梦

当前位置: 首页 > 科技

昆仑万维宣布开源百亿级大语言模型“天工”:0门槛商用

快科技10月30日消息,今天,昆仑万维官方宣布,开源百亿级大语言模型“天工”Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。

根据官方介绍,昆仑万维“天工”Skywork-13B系列包括Skywork-13B-Base、Skywork-13B-Math两大模型及150B Tokens高质量中文数据集。

其中Skywork-13B-Base模型是Skywork-13B的基础模型,其经由3.2万亿个多语言高质量数据训练,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。

Skywork-13B-Math模型经过专门的数学能力强化训练,在GSM8K等数据集上取得了同等规模模型的最佳效果。

本次开源的数据集大小约为600GB,总token数量约为150B,是目前开源最大的高质量中文数据集之一。

此外,昆仑万维还公开了模型中使用的评估方法、数据配比研究和训练基础设施调优方案等,助力对于大型模型预训练的认知,推动人工智能通用智能的实现。

目前开源社区中的中文大模型多数并非是完全可商用,通常需要进行复杂的商用授权申请流程,甚至设定限制不给予商业授权。

此次Skywork-13B系列大模型将全面开放商用许可,无需再次申请授权即可将大模型进行商业用途,帮助更多对中文大模型感兴趣的用户和企业在行业中不断探索和进步。

附Skywork-13B下载地址:

https://modelscope.cn/organization/skywork

https://github.com/SkyworkAI/Skywork

新浪众测 新浪众测 新浪科技公众号 新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

相关新闻
本文来源于网络,不代表浙江地方网立场,转载请注明出处
我要收藏
0个赞
转发到:
推荐阅读
  • 本报讯 世界卫生组织(WHO)日前改变了对通过空气传播的病原体的分类方式,重新定义了病毒等病原体如何通过空气传播。据《自然》报道,这次重新定义酝酿了两年,旨在为未来的流行病提供明确信息。但一些研究人员仍对新定义存在质疑。现在,病毒学家承认,[全文]
    2024-05-01 03:37
  • 大模型的这股风为微软、谷歌加强了底气,却将Meta打回了“原型”。本周美股陆续发布新一财季数据。其中,谷歌母公司Alphabet2024财年第一季度营收805.4亿美元,超过市场预期的790.4亿美元,同比增长15%,每股收益1.89美元,[全文]
    2024-05-01 03:34
  • 运营商财经网 实习生姜依冉/文近日,软件企业上市公司普元信息公告去年亏损,引发股民关注。运营商财经网由此注意到其背后高管团队,并试图揭秘副总经理杨玉宝的过往经历。杨玉宝1965年出生,根据计算今年59岁,已临近法定退休年龄。他的第一学历普元[全文]
    2024-05-01 03:34
  • 近日,“零元学剪辑”欺诈老年人骗局引发广泛关注。此类欺诈行为中,骗子打着“零元学剪辑”的幌子吸引老年用户,以承诺学会便可持续获利为诱饵,诱骗其充值,对老年用户进行一轮轮“收割”。在最新公布的抖音打击诱骗老年用户内容的治理公告中,平台对此类违[全文]
    2024-05-01 03:27
腾讯云秒杀
阿里云服务器

Copyright 2003-2024 by 浙江地方网 zj.xwxzx.cn All Right Reserved.   版权所有

未经授权请勿转载 | 网站所有内容来源于网络,如有侵权联系我们删除。