阿里云为什么对大模型持续乐观?

来源: 现场实拍:加沙一座高楼被炸一秒倒塌人们尖叫着逃跑

责任编辑: 支伟

发布时间: 2024-09-21 11:23:59

0

0

在大模型行业集体迷茫之际,阿里云却在2024云栖大会上释放了诸多积极信号。

大模型走红快两年,目前的发展状态和此前业界的预期还有较大差距,一些大模型公司开始出现战略摇摆。但阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在演讲中表示,过去22个月,AI发展的速度超过任何历史时期。

一方面是大模型技术快速迭代以及技术可用性大幅提升。去年,大模型还只能帮助程序员写简单的代码,今天已经能直接理解需求,完成复杂的编程任务。去年,大模型的数学能力还只有中学生水平,今天已达到国际奥赛金牌水平,并在物理、化学、生物等多方面学科接近博士水平。

另一方面,模型推理成本指数级下降,已经远远超过摩尔定律。以通义千问为例,一年来,通义千问API在阿里云百炼上的调用价格下降了97%以上,百万Tokens调用花费最低已经降到了3毛钱,未来还有继续下降的趋势。

吴泳铭给当下大模型发展状态的定义是“AGI变革的早期阶段”,要实现真正的AGI,下一代模型需要具备更大规模、更通用、更泛化的知识体系,同时也将具备更复杂更多层次的逻辑推理能力。在他看来,全世界先进模型竞争的投入门槛,将达到数十亿、数百亿美金的级别。

从2024云栖大会上的一系列发布来看,阿里云对大模型的乐观不只停留在口号上,而是要继续实打实投入。

阿里云和同行态度的强烈反差,背后是彼此对大模型应用落地前景认知的差异导致的。

大模型的想象空间不只在手机屏幕

大模型太多,应用却太少是当下整个行业面临的问题,大模型要跑起来、更要用起来,需要走好落地应用“最后一公里”。

从各家基础模型公司和应用层公司的探索来看,目前大模型的落地应用分为B端和C端两个方向。

在B端场景中,大模型目前已经在金融、工业、教育、医疗、政务等行业中得到应用,对研发设计、生产制造、经营管理、营销服务业务环节带来一些助力。但整体来看,很多企业对大模型的应用还在探索阶段,大模型依然面临落地难、落地成本高的问题。

C端场景的边际成本更低,被大模型从业者寄予了更多期待。AI助理被认为是大模型时代的超级应用,无论是以月之暗面为代表的大模型创业公司,还是腾讯、字节跳动、百度等互联网大厂,都相继推出了AI助理类应用。但豆包、Kimi等多个AI助手应用的表现还没达到人们的高预期,产品形态依然在演进,暂时看不到移动互联网时代超级应用爆发的势头。

很多从业者对大模型的落地应用感到迷茫,一个重要的原因是他们把对大模型应用落地的场景局限在手机屏幕上。

吴泳铭在2024云栖大会上给出了不一样的答案。在他看来,AI最大的想象力绝对不是在手机屏幕上,AI最大的想象力是在通过渗透数字世界、接管数字世界,并改变物理世界。

过去三十年,互联网浪潮的本质是连接,互联网连接了人、信息、商业和工厂,通过连接提高了世界的协作效率,创造了巨大的价值,改变了人们的生活方式。但生成式AI是通过生产力的供给创造了新的价值,从而为世界创造了更大的内在价值,也就是总体提高了整个世界的生产力水平。这种价值创造,可能是移动互联网连接价值的十倍、几十倍。

正因为如此,我们更应该跳出移动互联网的视角来看AI大模型的未来。很长一段时间,AI的焦点主要集中在模拟人类的感知能力,比如自然语言理解、语音识别、视觉识别。但是生成式AI的崛起,带来了质的飞跃,AI不再仅仅局限于感知,而是首次展现了思考推理和创造的力量。

吴泳铭表示,AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面,比如人类行走、奔跑、驾驶车辆、使用工具,绘画、作曲、写作、表达、教学、编程的技巧,甚至是开公司创业。理解之后,AI就可以模仿人类去执行物理世界的任务,这将带来新的产业革命。

这样的变革已经在一些行业发生,比如汽车行业。之前的自动驾驶技术,是靠人来写算法规则,几十万行代码,仍然无法穷尽所有的驾驶场景。采用“端到端”的大模型技术训练后,AI模型直接学习海量人类驾驶视觉数据,让汽车具备了超越大部分司机的驾驶能力。

在吴泳铭看来,机器人将是下一个迎来巨变的行业。未来,所有能移动的物体都会变成智能机器人。它可以是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员、包括家庭里的宠物狗、保姆、助理。工厂里会有很多机器人,在AI大模型的指挥下,生产机器人。现在每个城市家庭里有一辆或者两辆车,未来每个家庭可能会有两三个机器人,帮助人们提升生活当中的效率。

从这个角度来看,AI驱动的数字世界连接着具备AI能力的物理世界,将会大幅提升整个世界的生产力,对物理世界的运行效率产生革命性的影响。AI大模型的价值也不仅仅局限在商业领域,更重要的是将给社会生活带来巨大改变。

这是一个更大的历史机遇,也值得更多从业者积极投入、提前布局。能够抓住这个历史机遇的企业,将释放出比移动互联网高速增长时代更大的价值。

强大的基建才能催生AI新未来

在颠覆式的新浪潮下,坚定的技术乐观派才会真正走在时代前面,引领变革的发生。

在吴泳铭看来,人们对新技术革命,往往对短期高估,又对长期低估。因为在新技术应用早期,渗透率还比较低,人们经验没有发生过此类事件,大部分人的本能会产生怀疑,这很正常。但新技术革命会在人们的怀疑中成长,很多人会在迟疑中错过。

不同于传统IT时代,AI时代对基础设施的性能、效率要求更高。业界先进的模型参数规模和数据规模仍在持续增长,巨头之争已经从千亿模型向万亿模型发展。

比如,GPT-4模型具有1.8万亿参数,在约 13万亿个Token上进行了训练,算力需求相当于在大约2.5万张A100加速卡上运行90~100天。Meta在原有1.6万张A100卡集群基础上又建设两个具有约2.5万张H100加速卡集群,用来加速LLaMA3的训练。由此可见,万卡已经成为未来先进大模型训练的新起点。

尽管先进模型的门槛提升至几十上百亿美金,但头部大厂在投入上未曾迟疑。在海外,谷歌、微软、亚马逊、英伟达、Meta、苹果和xAI,每年在前沿技术上的投资高达 4000 亿美元,大部分资金都投向大模型和AI基础设施。

国内大厂中,阿里云投入压强最高,AI基础设施、基础模型、对外投资全覆盖。本届云栖上,吴泳铭表示,“阿里云正在以前所未有的强度投入AI技术研发和基础设施建设。”

过去一年,阿里云从以CPU为主导的传统计算体系,加速向以GPU为主导的AI计算体系演进,新增算力超50%都是AI算力。阿里云CTO周靖人在演讲中表示,阿里云正在围绕AI时代树立AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。

周靖人在2024云栖大会现场展示了阿里云全系列产品家族面向AI的升级:最新上线的磐久AI服务器,并提供AI算法预测GPU故障,准确率达92%;为AI设计的高性能网络架构HPN7.0,可稳定连接超过10万个GPU ,模型端到端训练性能提升10%以上;人工智能平台PAI,已实现万卡级别的训练推理一体化弹性调度,AI算力有效利用率超90%。

在模型层,阿里云也持续饱和式投入,几乎保持以月为周期迭代基础模型。大会现场,阿里云宣布通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o,同时还发布了开源模型Qwen2.5系列,成为仅次于美国Llama的世界级模型群。

其中,Qwen2.5全系列模型都在18T tokens数据上进行预训练,相比Qwen2,整体性能提升18%以上,拥有更多的知识、更强的编程和数学能力。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。

今年,大部分大模型厂商都试图通过降低大模型的使用门槛来推动大模型在更多行业落地。得益于基础设施的强大,阿里云在降低企业和开发者使用成本方面也是最积极也是最激进的厂商之一。

今年5月,阿里云抛出重磅炸弹,通义千问GPT-4级主力模型Qwen-Long价格直降97%,1块钱即可买200万tokens,相当于5本《新华字典》的文字量。降价后,Qwen-Long价格约为GPT-4价格的1/400,击穿全球底价。

本次云栖大会上,阿里云再次宣布百炼平台上的三款通义千问主力模型大幅降价。Qwen-Turbo价格直降85%,低至百万tokens0.3元,Qwen-Plus和Qwen-Max分别再降价80%和50%。其中,Qwen-Plus推理能力追平GPT4,是效果、速度及成本均衡的最优选择,降价后,Qwen-Plus同等规模较行业价格低84%。

同时,阿里云还在持续坚持开源模型路线。通义大模型一年多来坚持全尺寸、全模态开源,多次登上HuggingFace开源榜首,同时,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,受到开源社区众多开发者的追捧。

从模型服务到AI云服务,阿里云持续投入的强度堪称“中国卷王”,无论行业如何争论,反正开源闭源全覆盖,从底层基础设施到上层的大模型平台和模型社区全栈建设,布局的广度和深度,甚至全球无出其右。

阿里云的乐观和信心来自坚定的信念。少有人知道的是,阿里云从2018年便投入大模型研发,因此能够在ChatGPT掀起新一轮AI浪潮后迅速站稳国内基模第一的身位,而在前年云栖大会上,阿里云即提出MaaS模型即服务的理念,此后引领了全球云厂商面向AI时代的MaaS变革。

如今,阿里云看到的路是,只有提前布局,打造更强的基建,才能让所有人都能用上最先进的大模型,让企业和开发者以最低的成本使用AI,让整个行业更快拨云见日。

新闻热榜

1

甘肃两地发布最新人事

2

宗馥莉接手母亲公司

3

泽连斯基赌输了,谁也没料到局势反转如此之快,乌克兰已没有退路

4

李再勇受贿4.32亿

5

临沂3名干部拟任新职,其中2位“80后”

6

8月16日波兰总理图斯克宣布,波兰将正"

7

加沙地带确认一例脊髓灰质炎病例

8

2050年,中国还剩多少人口?联合国做出的大胆预测,实在难以置信

9

网格通讯员媒体新力量太原市第二期网格通讯员培训举办

10

澜沧江-湄公河合作第九次外长会在泰国举行

11

全红婵家成打卡地

12

台媒:台湾民众党“一人政党”的定位,应该趁机彻底改变了

13

日本客轮带重病行驶三个月运5.5万人,没沉是运气,这国没有未来

14

洛杉矶12分钟

15

沙特王储惊天警告!推动和平恐遭暗杀,中东局势再添变数

16

无故挨打反杀被判刑

17

热点分析,全红婵事件反映出记者的道德水平需要提高

18

中国帮助柬埔寨修运河,越南为何破大防?越南网民

19

忍住别笑:印度PK巴基斯坦拳赛名场面,王八拳重现江湖

20

山东舰再入西太平洋

21

巴拿马运河管理局再次提高运河通行能力

22

37岁贝东丹成他信家族第四位泰国总理祖籍广东曾挺着8个月孕肚参与大选

23

法国两战机相撞坠毁

24

国乒男团冲五连冠

25

雅安雨城:全力开展绿美雅安·环保攻坚专项行动

26

欧洲距离最近的两个首都,以及唯一一个同时与两个国家接壤首都地处奥地利和匈牙利边境的斯洛伐克首都布拉迪斯拉发,是世界上唯一一个同时与两个国家接壤的首都

27

腹部抽脂无生育能力

28

那么,以色列几十年"

29

商务部:一视同仁支持内外资企业参与大规模设备更新、政府采购

30

男子挖地窖囚禁6名女子,最终被判死刑,受害女子却说:我自愿的

31

美国、卡塔尔和埃及就新一轮加沙停火谈判发布联合声明

32

“山水工程”累计治理面积超1亿亩

33

8月16日,朝鲜半岛风云突变,金正恩一声令下,朝军铁骑"

34

朝鲜平壤市加强提高教育水平的工作

35

赖清德彻底坐不住?“整顿台立法机构”突响,韩国瑜大动作上演,民进党猝不及防

36

辉县市市长郭奇深入重点领域调研督导安全生产工作

37

美以两国防长通电话讨论中东地区局势

38

中巴友城点亮地标共庆两国建交50周年:居庸关长城上演绚丽灯光秀

39

泽连斯基最不愿看到的一幕:普京不上当,西方看笑话,战线将崩盘

40

20

联合国呼吁加沙短暂停火以便启动脊髓灰质炎疫苗接种

20

美跳高选手加赛丢金

20

#世界局势#国际局势分析#邱震海#震海会

20

晋中市副市长张拥军在介休市调研

20

辟谣久躺更伤身体

20

失败了,不要紧,美国人该死!

20

无人机表演反诈宣传

20

青年要自觉践行党对青年的根本要求

20

小伙地铁遭老人暴打

热门攻略

1

国台办:台公布的恶性撞船事件“调查结论”推卸责任不能接受

2

在全市重点工作调度推进会议上的讲话——公文写作参考素材

3

伊拉克拟婚龄为9岁

4

广东省首个行政执法监督码深圳上线为330万商事主体赋予“保护码”

5

高新区召开传染病监测预警工作推进会

6

有中国公民受到不法侵害!中国驻南非使馆发布提醒

7

00后奥运明星崛起

8

国台办:台公布的恶性撞船事件“调查结论”推卸责任不能接受

9

中国电信圆满完成全国生态日主场活动通信保障任务

10

张之臻孩子叫张奥运

11

俄罗斯罗斯托夫州一商场发生火灾约百人被疏散

12

美国总统大选辩论将于9月10日在费城举行

13

河北海兴:84支驻村团队心系百姓精准施策解难题

14

美国发布涉台民调,60%美国人支持“台独”,但拒绝支持出兵保台

15

德国的豪华监狱,坐牢想渡假一样

16

澳门特区政府集体学习中共二十届三中全会精神

17

中央赠港大熊猫“盈盈”诞下龙凤胎

18

在长城上也能订外卖了!北京首条无人机物流配送航线投入运行

19

唐山市原副市长曹全民被查!或与烧烤打人案相关,离退休仅2个月

20

巴拿马运河管理局再次提高运河通行能力

20

美不看好泽连斯基,美欲逼其辞职,谁当乌总统差别不大

20

德州市委宣传部一行到中心(集团)进行学习考察

20

王自如疑从格力离职

20

贺锦丽问鼎白宫,经济失速是大问题

20

美国超一半的州7月失业率上升,就业市场降温不能只怪飓风来袭

20

台湾花莲近海发生4.2级地震

20

孙杨回应美国游泳运动员脸紫

20

美国共和党副总统候选人万斯所乘飞机出现紧急情况迫降

20

中国外长访缅,力促地区和平稳定

20

打造“敏捷服务”,江苏部署实施29项“高效办成一件事”

20

湖南发生重大刑案

20

张若昀抽烟偷感

20

[企业动态]中顺洁柔新增1件法院诉讼,案由为不正当竞争纠纷

20

台媒:台湾民众党“一人政党”的定位,应该趁机彻底改变了

20

外媒:博雷利提议制裁“煽动”定居者暴力行为的以色列官员

20

突发!建设银行邵茂丰被查,年内建行已有多名干部落马

20

俄罗斯法院再次延长4名音乐厅恐袭案嫌疑人羁押期限

20

味蕾游成暑期新选择

20

台媒:岸田给战犯供玉串惹怒大陆,日乒众将拜战犯,大陆乒坛取关

20

兜牢民生保障底线持续深化精准救助

20

《南方日报》记者朱小龙,你被除名不当记者以后就是一个白痴!

20

国家市场监管总局:今年以来实施汽车召回667.8万辆

20

当西方试图在科技领域给我们设限时,我国果断"

20

我省创新出台重点人才“蓄水池”政策,助力引进留得住的紧缺人才

20

普京与俄联邦安全会议成员召开会议

20

厦门率先全省完成管廊运维员职业技能等级认定

20

六台:被刺伤入院的亚马尔父亲已出院

20

俄罗斯在库尔斯克乱了分寸,俄媒想起中俄曾有个约定

热门游戏

  • 1
    南通市审计局机关干部积极参加市级机关体育锻炼达标赛

    射击枪战 /热度:35103

    点击下载

    "惊爆全球!

  • 2
    特朗普飞机故障一周后共和党副总统候选人万斯乘波音737又遇紧急迫降

    射击枪战 /热度:54502

    点击下载

  • 3
    美媒:伊朗就是否大规模打击以色列进行内部讨论

    射击枪战 /热度:65120

    点击下载

    美以两国防长通电话讨论中东地区局势

  • 4
    崩坏3 “台独”迎来大限之日?大陆连甩三把“利剑”,赖清德彻底坐不住

    射击枪战 /热度:83929

    点击下载

    城市24小时|广西湖南联手,离“圆梦”还有多远?

  • 5
    原神 北京15区雷电预警,今起三天雨水频繁

    射击枪战 /热度:77912

    点击下载

    中医建议三伏吃火锅

  • 6
    出发吧麦芬 撞一下的威力就是这么大

    射击枪战 /热度:45474

    点击下载

    黑龙江省牡丹江市政府原副市长齐忠彦被“双开”

  • 7
    永劫无间手游 民政部有关司局负责人解读《婚姻登记条例(修订草案征求意见稿)》

    射击枪战 /热度:13033

    点击下载

    主播说联播丨让作弊者站出来、把违规者揪出来

  • 8
    向僵尸开炮 又要反思了?英国奥运冠军回医院上班,真相远比想象的精彩

    射击枪战 /热度:66947

    点击下载

    "美国挑拨离间失败!俄称中越联手发出信号,让菲律宾无比失望。

  • 9
    鸣潮 银昆高速太彭段建成通车

    射击枪战 /热度:86238

    点击下载

    澳门2024上半年会展活动同比增长34.5%

  • 10
    艾塔纪元 精准有效打击财务造假最高检解答司法实践难点

    射击枪战 /热度:59392

    点击下载

    孙颖莎撤回一个陈梦

关于我们 | 联系我们 | 加入我们 | 网站地图 | 自助投稿 | 在线举报 | 玩家心声 | 最新咨询 | 玩家风采展示 | 每日游戏推荐 | 玩家自定义地图 |