产品一类

接棒DeepSeek,baidu智能云再给大模子降贬价

作者:[db:作者] 时间:2025/02/07 点击:

2025年02月06日 19:04:27起源 / 节点财经    文 / 一灯 近期,DeepSeek的火爆出圈,直接撬动了资源市场对AI+工业链的投资热忱。不只在2月5日动工第一天,DeepSeek观点指数年夜涨14.73%,AI利用端跟科技全线拉升,2月6日早盘仍表现,A股TMT科技板块连续强势,DeepSeek、AI算力观点持续活泼。而就在新年动工、DeepSeek观点指数年夜涨的统一天,中国年夜模子市场又传出重磅消息:百度智能云胜利点亮昆仑芯三代万卡集群,成为海内首个正式点亮的自研万卡集群。模子上线首日,已有超1.5万家客户经由过程千帆平台停止模子挪用。这不只标记着百度在自研芯片与年夜范围AI算力规划上的又一次严重冲破,也预示着AI模子的练习本钱将迎来新一轮下调,全部行业的开展再次被注入新动能。那么,在各年夜科技巨子都减速推动AI算力基建确当下,万卡集群毕竟是什么?为何各人都在踊跃推动自研、自建万卡集群?国产万卡集群的一直演进,又将给智算工业带来怎么的转变?01  国产万卡集群,中国AI新冲破比年来,跟着AI年夜模子的一直出现,模子范围跟数据参数都浮现出指数级增加。比方在后期练习,据懂得,2018年OpenAI宣布的GPT-1模子参数目为1.17亿;到2020年,GPT-3的参数目已到达1750亿;2023年,GPT-4的参数目进一步增加到约1.8万亿。参数目的疾速增加推进了AI模子机能的年夜幅晋升,使其在天然言语处置、图像辨认等范畴的表示越来越好。但同时,模子参数目的增加也让AI 模子练习的算力需要每3.5个月翻一番,每年所需算力增幅高达10倍,增速远远超越了芯片工业临时存在的摩尔定律(机能每18个月翻一番)。图源:国金证券研讨所以领有16个专家模子、约1.8万亿参数的GPT-4为例,其练习约应用了 25000个英伟达(NVIDIA )的A100 GPU ,连续时光长达90至100天,对算力的耗费十分年夜。而且,除了练习时的算力需要,跟着年夜模子及利用越来越多地安排到企业现实营业场景中,前期推理的算力需要也水涨船高。因而,年夜范围 GPU 算力集群成为必定抉择。这也是为什么比年来海内外科技厂商纷纭规划 AI 算力基本设备,逝世磕万卡乃至10万卡集群。而“万卡集群”,望文生义,是指由超越一万张减速卡(如GPU、TPU或其余公用AI减速芯片)构成的高机能盘算体系,用以减速人工智能模子的练习跟推理进程。    图源:百度比拟于练习周期长、本钱高的传统千亿参数模子,万卡集群起首在盘算才能、数据处置速率跟存储容量等方面都有着质的奔腾。它可能经由过程并行盘算跟散布式处置,将宏大的数据跟模子无效地构造起来,明显收缩模子的练习周期,进步研发效力。其次,作为一种机动的盘算基本设备,万卡集群可能依据差别的利用需要停止定制化的设置跟优化,同时支撑更年夜范围模子跟更庞杂的多模态义务,比方智能医疗诊断、主动驾驶技巧、天然言语处置等范畴。这既为AI技巧的翻新跟开展供给了更辽阔的空间跟可能,也为企业在AI范畴的竞争中博得先机。别的,万卡集群经由过程晋升算力应用率、简化用户安排流程,也下降了AI技巧的应用门槛,进而推进其在各个范畴的普遍利用。但在《节点财经》看来,万卡集群虽好,但想要胜利搭建也不是易事。据懂得,要想建立万卡集群范围的算力核心,平日要面对多少年夜挑衅:● 算力应用效力:集群范围晋升不即是算力线性晋升,要害在于互联收集跟软硬件适配调优。需应用体系工程方式,精致化计划收集跟软硬件整合优化,以晋升集群算力应用效力。● 海量数据处置:将来万亿模子的练习对checkpoint的读写吞吐机能更是请求高达10TB/s,需经由过程协定融会、主动分级等技巧手腕晋升数据共享跟处置才能。● 多芯混训困难:受限于芯片厂商的产能,AI企业常常采取差别型号、差别厂商的芯片来组建算力集群。这些芯片在机能、架构、指令集等方面都存在差别,怎样让它们在统一个集群中协同任务,而且保障混部练习的效力,是一个亟待处理的成绩。● 智算核心计划:高能耗、高密度的智算核心对空间跟动力的需要,远远超越了传统机房安排方法的承载才能。这就请求在建立之初,提前对智算核心的供电制冷、承重等停止配套计划,以便更好支持超万卡集群的疾速建立、便捷安排。● 稳固性与运维:万卡集群中的盘算卡数目宏大,收集衔接庞杂,且当单卡牢靠性为99.99%时,万卡集群团体牢靠性仅36.7%。一旦呈现毛病或耽误,将直接影响全部集群的盘算效力跟稳固性。图源:百度正如斯前中国工程院院士、清华年夜学盘算机系教学郑纬平易近所言,当下构开国产自立万卡体系充斥挑衅,但“至关主要”。02 百舸平台赋能,让中国AI工业率先“跑”起来现在,海内智算核心的搭建有海内外芯片“混搭”跟全体国产化两种集群形式,然后者关乎一国在迈向通用智能征程中的中心竞争力。恰是认识到如许的主要性,百度始终摸索用自研芯片搭建自立可控的算力生态体系,一直将助力实现 AI 基本设备国产化作为中心目的。据懂得,此次万卡集群的胜利点亮,得益于百度在硬件跟软件方面的技巧翻新。在硬件层面,自研芯片保证了在天生式AI时期的技巧主权。此次支持万卡集群高效运转的昆仑芯三代,连续并优化了前代产物的计划,在算力、能效、稳固性等方面片面进级。同时,百度也冲破了卡间互联拓扑限度,防止通讯带宽成为瓶颈,并采取翻新性散热计划,无效处理了能效与散热成绩,以确保集群高效、稳固地运转。而在软件层面,百舸AI异构盘算平台4.0则在构建高机能收集、优化散布式练习、多芯混训、毛病诊断手腕等方面施展了至关主要的感化:● 在散布式练习优化上,百舸4.0采取高效并行化义务切分战略,将练习主流开源模子的集群MFU晋升至58%,年夜幅晋升模子练习速率跟资本应用率;● 针对机间通讯带宽需要,百舸4.0构建超年夜范围 HPN 高机能收集并优化拓扑构造,明显下降了通讯瓶颈,使带宽无效性到达90%以上;● 在多芯混训方面,百舸4.0可主动停止芯片选型,根据集群残余资本抉择性价比最高的芯片运转义务,实现高达 95% 的万卡多芯混杂练习效力。● 在集群稳固性上,百舸4.0供给片面毛病诊断手腕,能疾速主动侦测节点毛病,并将毛病规复时光从小时级收缩到分钟级,防止因为单卡毛病率随范围指数回升而形成的万卡集群无效性年夜幅降落,保证无效练习率到达98%。图源:百度由此,《节点财经》以为,构建万卡集群不只是芯片的堆砌整合,更要依靠强盛的AI盘算平台来支持全部集群的分配计划。而百度智能云依靠百舸AI异构盘算平台4.0,实现了从集群创立到开辟试验,再到模子练习、推理的全链路优化。不只晋升了本身的智算气力,也为智算行业供给新的开展思绪。值得一提的是,凭仗着自研昆仑芯的技巧上风以及百舸平台的无力加持,百度智能云已为浩繁企业供给了“多、快、稳、省”的AI基本设备。比方,生数科技依靠百度百舸高效、稳固、混杂多芯的才能,得以在短时光内实现了Vidu年夜模子的上线跟开放API,其素材衬着减速效力晋升3倍,数据拉取效力晋升51倍;长安汽车经由过程与百度智能云的深度配合,让主动驾驶模子练习的算力总体均匀应用率晋升到90%以上,综合伙源应用率晋升了50%;教导场景先行者好将来教导团体则借助百舸平台自研出“九章年夜模子(MathGPT)”,现在曾经普遍利用于好将来的智能硬件、学而思旗舰进修机及多个营业场景中......图源:百度智能云能够预感,将来一年,将是种种AI原生利用暴发的黄金时代。而百度智能云自研万卡集群的建成,不只带来了强盛的算力支撑,让中国工业率先“跑”起来,也推进了模子降本的趋向,为各行各业的AI利用跟翻新供给了实切实在的代价。02 花小钱办年夜事,中国AI再引寰球注视百度智能云自研万卡集群的胜利点亮,不只在海内激发普遍存眷,也在国际市场掀起热议。日前,花旗银行在研报中指出,百度、DeepSeek等中国模子展示出高效跟低本钱上风,将有助于减速寰球AI利用开辟,并在寰球激发更多技巧翻新,推进2025年人工智能利用的拐点。而资源市场上,百度在港股、美股的双双上涨,仿佛也印证了这一点。图源:百度《节点财经》以为,对科技公司来说,领有强盛的万卡集群象征着在AI时期奠基了坚固的基本跟竞争力。一方面,万卡集群可能为公司外部的各种AI名目跟营业供给稳固且高效的盘算支撑;另一方面,万卡集群的建立不只反应了企业在技巧程度、资金投入跟策略计划上的决议跟才能,还能晋升其外行业中的名誉跟影响力,吸引更多的人才、配合搭档跟资金,进而构成一个精良的工业生态,为企业的连续开展供给坚固的支撑。而从寰球AI比赛来看,继DeepSeek从算法优化角度“偷袭”年夜模子本钱后,百度智能云再次证实了中国科技“花小钱办年夜事”的聪明。国产万卡集群的呈现,不只再显中国硬科技气力,也能处理从前价钱高跟无奈稳固利用等成绩,进一步下降企业停止利用开辟与工业翻新的门槛。据懂得,百度智能云还打算点亮3万卡集群,摸索更高机能与扩大性的算力界限。能够预感,跟着3万卡集群的进一步落地,百度智能云以致中国AI工业,都将在寰球范畴内博得更年夜的市场话语权。总之,在天生式AI海潮下,中国科技企业正在重新技巧的跟随者向新航线的开拓者迈进。而跟着智算需要的一直增加跟算力核心的范围演进,万卡集群将成为将来智能算力范畴的新赛场。当下,百度智能云在AI算力赛道上的连续领跑,无望界说新一代集群架构,重构寰球AI算力格式,同时催化新质出产力,充足开释AI在各行业场景落地,助力中国工业跑出真正的开展减速度。

澳门新银河app

客服热线:400-123-4567

邮箱:[email protected]
地址:广东省广州市天河区88号

首页
电话
短信
联系