欢迎光临浙江地方网!

今天是 2024年05月02日 星期四

关注社会热点

一起实现我们的中国梦

当前位置: 首页 > 科技

阿里云换帅后祭出杀手锏:升级通义千问大模型,做AI浪潮下的“卖铲人”

同时拥有云计算和大模型的阿里云对自身的定位更像是卖铲人,重视AI发展的基础设施,把云计算的能力开发到极致。

图源:阿里云官方图源:阿里云官方

一个多月前,阿里云进行了一场人事调整,张勇卸任阿里云董事长与CEO职务,由阿里巴巴集团CEO吴泳铭兼任。

把时间维度拉长一些,可以发现,开年以来,阿里云的变革非常频繁,先是率先打响云服务降价的第一枪,接着开启分拆上市倒计时,随后又推出“通义千问”大模型,AI绘画创作大模型“通义万相”。

“我们要打造AI时代最开放的云。”10月30日,在2023年云栖大会上,阿里巴巴集团董事会主席蔡崇信开场演讲中表示,目前中国80%的科技企业,一半的大模型公司都跑在阿里云之上。

在现场,阿里云CTO周靖人公布了云计算基础能力的最新进展,升级了人工智能平台,并发布千亿级参数规模的大模型通义千问2.0,以及一站式模型应用开发平台阿里云百炼,阿里云已初步建成AI时代全栈的云计算体系。

云计算和大模型,谁优先?

自从ChatGPT在全球范围内爆火,大模型的混战持续了大半年,一众科技大佬纷纷下场,各行各业也争先恐后地蹭上大模型的热度。

作为国内最早布局云计算的厂商,阿里云站在了行业的风口。大模型的不断优化对算力有了更高的要求,庞大的训练规模也需要稳定的云服务设备承接。

以ChatGPT为例,2018年Open AI在训练GPT-1时,所用到的参数数量和数据训练量分别为1.17亿和5GB,到了GPT-4,训练参数量则出现了爆发式的增长,达到了1.6万亿。

“云计算和GPT的关系就像电和电机一样。”阿里云创始人王坚在会上表示。他认为,人工智能和云计算的结合,是云计算的第三次浪潮。它不会在一年、两年完成的,可能要几十年才能达到高峰。

同时拥有云计算和大模型的阿里云对自身的定位更像是卖铲人,重视AI发展的基础设施,把云计算的能力开发到极致。

以全新升级的人工智能平台PAI为例,PAI底层采用HPN 7.0新一代AI集群网络架构,支持高达10万卡量级的集群可扩展规模,超大规模分布式训练加速比高达96%;在大模型训练任务中,可节省超过50%算力资源。

“通过阿里云多层技术的能力,不管是AI的基础设施、模型的能力,还是像百炼的平台,能够让开发者、创业公司获得最好的支持,帮助他们去解决创业上的挑战以及创新上的加速等等。”周靖人在接受时代财经等媒体群访时说道。

百川智能成立仅半年就发布了7款大模型,快速迭代背后离不开云计算的支持。百川智能与阿里云进行了深入合作,并且完成了千卡大模型训练任务,有效降低了模型推理成本,提升了模型部署的能力。

截至目前,中国众多头部主流大模型都已通过阿里云对外提供API服务,包括通义系列、Baichuan系列、智谱AI ChatGLM系列、姜子牙通用大模型等。

通义千问升级,性能超过GPT-3.5

云栖大会首日,阿里云正式发布了千亿级参数大模型通义千问2.0,相比今年4月推出的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上有明显提升。目前,通义千问的综合性能已经超过GPT3.5,正在加速追赶GPT-4。

通义大模型家族全面升级 图源:阿里云通义大模型家族全面升级 图源:阿里云

不过,无论是推出大模型应用的大厂,还是独角兽企业都达成了某种共识:通用大模型不是行业发展的终极目标,做好垂直领域的落地才能让大模型发挥出应有的价值。比如科大讯飞将星火认知大模型升级至V3.0,发布了12个行业大模型,腾讯混元大模型也进行了一次升级。

一位大模型行业从业者曾经向时代财经表示,大部分行业用户都有一个明确的要求:想要产品实现一站式服务,并且能够实现个性化的定制。

周靖人表示,阿里云并不打算做C端产品,而是会把模型能力开放出来,以API的形式,让开发者集成模型的能力来解决自身需求。

截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。

基于通义千问大模型训练的8大行业模型组团上线,他们分别是智能编码助手通义灵码、AI阅读助手通义智文、工作学习AI助手通义听悟、个性化角色创作平台通义星尘、智能投研助手通义点金、智能客服通义晓蜜、个人专属健康助手通义仁心、AI法律顾问通义法睿。

8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。其中,通义星尘、通义点金、通义智文等是首次亮相;通义灵码已在阿里云内部大规模采用;通义听悟每天处理5万余个音视频,目前已累积用户超100万。

周靖人透露,阿里云计划于近期开源通义千问72B版本,此前,阿里云已先后开源7B和14B版本模型。

除了与开发者共享自研新技术,阿里云还大力支持三方大模型发展。在阿里云魔搭社区上,百川智能、智谱AI、上海人工智能实验室、IDEA研究院等业界顶级玩家,都开源首发他们的核心大模型,阿里云则为开发者们“尝鲜”大模型提供免费GPU算力,截至目前已超3000万小时。

据了解,去年云栖大会发布的魔搭社区现已聚集2300多款AI模型,吸引280万名AI开发者,AI模型下载量突破1亿,成为中国规模最大、开发者最活跃的AI社区。

阿里云AI云计算浪潮 新浪众测 新浪众测 新浪科技公众号 新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

相关新闻
本文来源于网络,不代表浙江地方网立场,转载请注明出处
我要收藏
0个赞
转发到:
推荐阅读
  • 本报讯 世界卫生组织(WHO)日前改变了对通过空气传播的病原体的分类方式,重新定义了病毒等病原体如何通过空气传播。据《自然》报道,这次重新定义酝酿了两年,旨在为未来的流行病提供明确信息。但一些研究人员仍对新定义存在质疑。现在,病毒学家承认,[全文]
    2024-05-01 03:37
  • 大模型的这股风为微软、谷歌加强了底气,却将Meta打回了“原型”。本周美股陆续发布新一财季数据。其中,谷歌母公司Alphabet2024财年第一季度营收805.4亿美元,超过市场预期的790.4亿美元,同比增长15%,每股收益1.89美元,[全文]
    2024-05-01 03:34
  • 运营商财经网 实习生姜依冉/文近日,软件企业上市公司普元信息公告去年亏损,引发股民关注。运营商财经网由此注意到其背后高管团队,并试图揭秘副总经理杨玉宝的过往经历。杨玉宝1965年出生,根据计算今年59岁,已临近法定退休年龄。他的第一学历普元[全文]
    2024-05-01 03:34
  • 近日,“零元学剪辑”欺诈老年人骗局引发广泛关注。此类欺诈行为中,骗子打着“零元学剪辑”的幌子吸引老年用户,以承诺学会便可持续获利为诱饵,诱骗其充值,对老年用户进行一轮轮“收割”。在最新公布的抖音打击诱骗老年用户内容的治理公告中,平台对此类违[全文]
    2024-05-01 03:27
腾讯云秒杀
阿里云服务器

Copyright 2003-2024 by 浙江地方网 zj.xwxzx.cn All Right Reserved.   版权所有

未经授权请勿转载 | 网站所有内容来源于网络,如有侵权联系我们删除。