智东西
作者 | 程茜
编辑 | 李水青
3月14日,智东西报道,今天,智东西等媒体探访了百度阳泉智算中心。在该中心,百度展示了其最新的生成式AI产品“文心一言”,并吸引了众多媒体的关注。
据百度智能云方面透露,“文心一言”背后的算力基础设施均由百度智算中心支持。后续,百度智算中心将有多个智算中心为“文心一言”面向产业的规模化落地提供底层支撑。在百度阳泉智算中心内部,支撑“文心一言”的机房正在全力运转、测试,全力备战“文心一言”的发布。
百度阳泉智算中心OCU
百度阳泉智算中心于2021年4月正式投入使用,2022年12月对外开放服务。该智算中心搭载了百度自主研发的AI基础设施“AI大底座”,作为亚洲最大单体智算中心,每秒可以完成4EFLOPS(400亿亿次浮点运算)。
百度智能云在去年年底开始全面升级云服务能力。具体来说,去年12月,百度智能云发布了国内首个全栈自研AI基础设施“AI大底座”,今年2月,百度智能云升级了AI研发运营一体化(MLOps)能力,而在今年3月,百度阳泉智算中心也完成了升级。这些升级不仅让百度智能云的云服务能力更加强大,也为公司的业务发展提供了坚实的基础。
参观百度阳泉智算中心后,百度智能云云计算产品解决方案和运营部总经理宋飞、昆仑芯科技战略负责人宋春晓与智东西等媒体进行了深入交流。
一、智力“涌现”背后,生成式AI产品落地有三大挑战
生成式AI热潮爆发,超大规模的预训练模型的出现能够激发出大模型的更多能力。
当模型参数达到一定量级后,大量的智能能力具备一定的泛化、推理和逻辑能力。从图表可以看出,智力表现不是随着模型参数线性增长的,而是会出现突增,也就是说当模型规模达到一定程度后,大量的智能能力才具备“涌现”的基础。预训练大语言模型就是AI走向AGI(通用人工智能)的“船帆”,大模型可以帮助企业增强使用AI落地场景的能力。
预训练大模型已经成为AI发展的新方向。大模型可以结合无监督数据去训练,不需要人工对细节场景做很多标注,同时自监督学习能力也能够大大减少基础模型训练的复杂度。研发人员再对少量任务数据做一定的迁移学习,就可以解决一定的问题。
生成式AI热潮爆发背后,云计算对于企业的价值也发生了根本质变,从提供基础设施转变为提供智能服务。
面对这种变革,生成式AI产品在产业规模化落地上对于智能算力、AI基础设施以及AI工程化水平提出了多重挑战。宋飞说:“大模型对算力需求不同,必然在基础设施打造上会有较大的升级。行业场景落地形态不一样、带宽的不同等,都相比于传统数据中心会有很大不同。”
生成式AI产品的数据量巨大,对于AI算力提出了更高要求,这也对现有计算机体系结构提出挑战;文心一言等生成式AI产品的计算场景复杂、计算架构多维,企业进行AI开发需要集芯片、框架、模型及应用为一体的全栈基础设施,端到端的智能化闭环AI开发的全流程;最后是生成式AI产品落地实践时,需要基于具体业务场景进行二次适配开发。
宋飞说:“这些潜移默化的变化使得现在企业构建一个数据中心和之前思考的问题不一样了。”企业在构建智能计算基础设施时往往面临两大痛点,分别是系统性能低和研发成本高。企业需要花费大量时间、精力去构建云基础设施,但往往这些基础设施的搭建组合不能发挥其最佳性能和效率;再加上,基础设施的运营和维护需要企业投入大量的资金。因此,企业在构建智能计算基础设施时需要仔细考虑其成本和效率,寻找最佳的解决方案。
二、助推生成式AI落地普及,百度智能云升级三大配套云服务
百度智能云提升了其三大配套云服务,基于其“云智一体”优势提出了解决方案。在文心一言发布前夕,这一难点得到了解决。
首先是为企业提供巨量高性能智能算力。百度目前已在山西阳泉、江苏盐城等地建设了智算中心,其中,百度阳泉智算中心是亚洲最大单体智算中心,建设规模为4EFLOPSAI算力。昆仑芯科技战略负责人宋春晓透露:“昆仑芯2代已在百度文心大模型的应用中广泛落地,并为各行各业的智能化升级提供AI算力支持。”
并且,昆仑芯3代将于2024年初量产,采用XPU-R架构,通用性和性能显著提升。
在宋春晓看来,大模型时代对算力提出了更高的挑战。为了应对这一挑战,昆仑芯将在架构、设计上进行创新,以提高算力。同时,昆仑芯还将加强芯片本身的互联,并降低成本,以满足大模型时代的算力需求。
此外,百度数据中心在技术架构、建设管控和运维保障层面的创新,实现了PUE低至1.08,实现了高效节能的运行,从而降低客户的电费和运维成本。
百度阳泉智算中心配电站
其次,为企业提供新型AI基础设施。百度推出国内首个全栈自研的AI基础设施百度AI大底座,其核心特征为全要素、端到端优化以及极致效能。
百度AI大底座将算力、框架、模型和AI应用进行了封装,实现了端到端智能化闭环。通过昆仑芯、飞桨深度学习框架和文心预训练大模型的组合,企业可以大大降低开发成本,提高效率。宋飞表示,百度AI大底座可根据实际业务数据进行不断调优,将资源利用率提升至70%,企业开发效率提升100%。
飞桨(FCP)作为产业级深度学习平台,也被称为AI时代的操作系统,连接算力和算法层,为开发者提供了便捷的深度学习框架,让深度学习的开发变得更加高效。
文心大模型是全球首个知识增强千亿大模型,能够通过数据增强技术实现标注数据更少、模型效果更优、创造能力更强,并且可以灵活定制场景。
百度沉淀的行业语料库会对预训练模型进行知识图谱的格式标注,快速将这些语料变成高质量的训练数据。未来,文心大模型将通过百度智能云更多的赋能行业。
最后,百度智能云还会为企业提供AI研发运营一体化(MLOps )能力。相关企业在接入文心一言后,可低成本、便捷地完成与业务成精的适配与二次开发。
三、城市大脑、智能制造……百度AI大底座促进AI普惠
企业可以通过百度AI大底座构建全新一代智算中心解决方案,应用于城市大脑、智能制造、自动驾驶、绿色能源和智能超算等领域。
百度智能云和吉利合作打造“1 6 N”吉利混合云平台,该平台通过计算资源服务和存储资源服务等基础设施服务,将吉利的管理运维成本降低了30%,资源利用效率提高了20%。
宜昌点军区创建了百度智能云-昆仑芯智能生态中心,该中心包括人工智能算力中心、城市级视频中台、数据中台系统等。
海淀城市大脑是基于AI中台构建的城市AI基础设施,其覆盖渣土车综合治理、城市管理时间识别、路面事件检测等领域。
此外,国家电网与百度智能云联合打造了相应人工智能基础平台。百度智能云还与某全国性股份制商业银行合作,软硬一体环境投产运行已经超过一年半。
结语:升级云服务,为生成式AI普及提供助力
生成式AI热潮涌起,其引发的海量数据计算、算力需求激增都对企业提出了新的挑战。作为国内搜索引擎巨头玩家,百度在中文语料领域拥有大量的积累,在算力基础设施等层面也拥有大量优势,其技术优势对于生成式AI产业在国内的落地具有推动作用。
百度生成式AI产品“文心一言”发布之际,百度提升了三大配套云服务,为企业快速布局、应用生成式AI产品搭载了助推器,有望看到生成式AI在更广泛的领域迸发更多的应用场景,促进AI普惠。
生成式AI的爆发,引发的海量数据等为算力需求提出了新的挑战。
关键词:智东西,百度阳泉智算中心,百度智能云,云智一体,百度阳泉智算中心,计算资源服务,存储资源服务,飞桨深度学习框架,文心预训练大模型,知识图谱,标注数据,自监督学习能力,大语言模型,AGI(通用人工智能),算力需求,基础设施,企业开发效率,智能计算基础设施,系统性能,研发成本,PUE(平均每个用户贡献的能源),能源效率,城市大脑,自动驾驶,绿色能源,智能超算,智慧生态中心,AI中台,生成式AI,海量数据计算,算力需求,企业应用,生成式AI产品,文心一言,AI大底座,飞桨深度学习框架,知识图谱,标注数据,自监督学习能力,智能驾驶,智慧能源,智能超算,智慧生态中心,AI中台,计算资源服务,存储资源服务,飞桨深度学习框架,文心预训练大模型,知识图谱,标注数据,自监督学习能力,大语言模型,AGI(通用人工智能),算力需求,基础设施,企业开发效率,智能计算基础设施,系统性能,研发成本,PUE(平均每个用户贡献的能源),能源效率,城市大脑,自动驾驶,绿色能源,智能超算,智慧生态中心,AI中台,计算资源服务,存储资源服务,飞桨深度学习框架,文心预训练大模型,知识图谱,标注数据,自监督学习能力,智能驾驶,智慧能源,智能超算,智慧生态中心,AI中台,计算资源服务,存储资源服务,飞桨深度学习框架,文心预训练大模型,知识图谱,标注数据,自监督学习能力,智能驾驶,智慧能源,智能超算,智慧生态中心,AI中台,计算资源服务,存储资源服务,飞桨深度学习框架,文心预训练大模型,知识图谱,标注数据,自监督学习能力,智能驾驶,智慧能源,智能超算,智慧生态中心,AI中台,计算资源服务,存储资源服务,飞桨深度学习框架,文心预训练大模型,知识图谱,标注数据,自监督学习能力,智能驾驶,智慧能源,智能超算,智慧生态中心,AI中台,计算资源服务,存储资源服务,飞桨深度学习框架,文心预训练大模型,知识图谱,标注数据,自监督学习能力,智能驾驶,智慧能源,智能超算,智慧生态中心,AI中台,计算资源服务,存储资源服务,飞桨深度学习框架,文心预训练大模型,知识图谱,标注数据,自监督学习能力,智能驾驶,智慧能源,智能超算,智慧生态中心,AI中台,计算资源服务,存储资源服务,飞桨深度学习框架,