全球IT需求大爆发的机会,Intel才不会浪费
应对危机的最好方法一直是求变。
5月18日,联合国发布了对世界经济形势的最新预测,将全球经济2022年的增长率从今年1月预测的4%下调至3.1%,同时预计全球通胀率将升至6.7%,两倍于2010-2020年平均水平。这两年来疫情的肆虐,正在不可避免地将全球经济拖入下行周期。
全面劣化的经济环境给全球企业以巨大的压力,无论C端还是B端客户的“钱袋子”都更紧了,通货膨胀还将令一大批企业面临自身成本快速上涨的挑战。也让许多企业不得不停下发展的脚步,反过来审视和优化自身,包括今年经常传出的裁员新闻。
但在“减法”之外,企业们实际上也不约而同地做起了“加法”:根据企业数据和网络公司Equinix去年的一份调查,全球47%的被调查企业加速了数字化转型计划的实施,超过40%的企业直接增加了自身的IT(信息技术)预算,超过一半的企业已经彻底修改了自己的IT战略。
企业再次燃起的数字化热情也体现在了半导体行业的发展上。根据美国半导体产业协会(SIA)上个月底的统计,2022年一季度全球半导体销售总额再创新高,达到1517亿美元,同比增长达23%。与初现的2020年对比,半导体行业的销售额在两年时间里就增长了近40%。
“如何让自己的IT适应后疫情时代”,正在成为绝大部分企业和产业必须面对的数字化挑战。
例如最为直接也影响最大的远程办公模式,正在成为越来越多企业长期的选择。知名民宿短租平台爱彼迎CEO上个月底就公开发声:“办公室已过时,员工可永久远程办公”。为了保障线上远程办公的效率和可靠性,企业的IT基础架构必须在原来的基础上进行调整。
其次是行业和服务在后疫情时代发生的突然性转变。以金融行业为例,过去发达国家如美国的金融数字化推行并不顺利,消费者更偏爱线下使用实体的信用卡,但在疫情的影响下,大量的客户被迫转向了网上银行服务,造成网上银行和电话服务中心业务量激增,金融企业必须快速而灵活地将过去用于线下的IT资源重新“调配”到线上。未来疫情最终被控制住了,客户可能再次转向线下,到时候金融企业必须再次随之“转变”,变相对企业的IT基础设施提出了很高的灵活性需求。
从相对固定的自有IT架构转向对云计算更大比例的利用,一直都是推进数字化进程的重要手段。虽然云计算计算力强且先天比较灵活,但跟自有IT架构的更新一样,云端也需要越来越以更强大芯片和硬件为核心的基础设施,以及越来越创新的软件优化予以支撑。
云计算领域最典型的挑战在于日益增长的数据量,根据权威咨询机构IDC的统计,2021年全球至少创建了接近70ZB的数据量,相比疫情之前2019年的45ZB有了大幅的上涨。这些多出来的数据量,足够填满1000亿台256GB容量的手机。
创造如此庞大数据的关键是由线下转向线上创造出来的海量网络访问需求。以广东省自己的政务平台“粤省事”为例,因为提供了健康码和核酸检测在内的一系列服务,日访问人数都高达4000-5000万,实际访问次数更是达到数亿次,单看数字已经接近很多市值400-500亿美元的搜索引擎访问量。
很多过去只要简单处理和传递的数据,现如今还已经成为了人工智能发展的养料,通过强大的AI计算力将它们变成人类程序员无法直接编写出来的神经模型,并且运用到最终的推理当中。单是为了还没能解决的自然语言(NLP),神经模型的参数数量已经来到了1500亿(OpenAI GPT-3),对于AI算力的需求上涨呈现出指数级的趋势。
疫情所导致的社会运转和结构上的改变,还在持续改变着各行各业的商业运转,新增的数字化处理能力需求与应对不确定性的灵活性需求交织在一起,既要抓住新的机遇,充分利用新的技术,也要考虑成本规模,上市速度等,这些都让企业业务管理者和技术管理者们面临前所未有的复杂挑战。
他们必须从要解决的现在和未来实际问题出发,以全新的视角,考虑IT基础设施的建设,包括领先技术,解决方案,规模,资源,生态系统支持等等,规划出未来技术路线,放大创新技术的价值,加速企业的数字化转型,从而保证企业业绩增长和行业领先。这就是上周2022英特尔On产业创新峰会上英特尔和业界共同探讨的话题。
应对改变,远见必须先行
正如我们熟悉的“把大象放进冰箱”笑话,后疫情时代的IT需求路径同样是“两步走”:打造出一整套性能更强、覆盖多场景多应用需求的IT基础设施;让客户和产业可以灵活地将这套设施充分利用起来。
为全球IT基础设施提供芯片和技术的领导者英特尔在美国时间5月10日-11日在美国达拉斯线下召开了IDF回归后的ON系列大会的第一届英特尔On产业创新峰会(Intel® Vision),而中文版内容也在上周三上线。在这个名字就带有“远见”(Vision)意义的会上,英特尔集中分享了自己在拓展芯片深度和广度,提供包括硬件,软件和服务等全新技术上的最新想法和成果,并且分享了全球领先企业数字化转型的创新案例以及新的可能用例。
首先是推进数字化转型的技术方向,英特尔现任CEO帕特·基辛格将它们概括为四大“超级力量”:无所不在的计算,无处不在的连接,从云到边缘的基础设施和人工智能。而英特尔也依据这四大超级力量来制定自己的战略。
其中“无所不在的计算”的重点放在产品的覆盖上,以英特尔自己为例,XPU战略的推进让英特尔可以提供包括CPU, GPU, IPU以及各种加速计算芯片在内的完整产品组合;然后是“从云到边缘的基础设施”,基础设施需要更高性能的客户端,更智能的终端,边缘计算,各种网络,更强大的数据中心和更加灵活的云等;“无处不在的连接支持客户随时随地收集、存储、访问和分析数据,并充分利用相关服务,即万众互联和万物互联。“人工智能”借助深度学习和推理,机器学习等在内的技术,让万物智能化,从中更轻松的获取洞察,最终解决实际问题,同时也要保证AI向善。
这四大力量并不“新”,他们本身在持续发展,拥有巨大的能量,但英特尔在本次峰会上继续还强调了这四大力量相互作用,共同放大可以解决更为复杂和规模化的问题,可以同时为这四大力量提供产品和解决方案正是英特尔的优势所在,这次英特尔更是拿出一系列发挥四大超级力量合力的新产品和解决方案,足以证明英特尔技术创新的实力。
除了发布针对商用客户端,为CAD, 动画和视觉特效等专业负载提供迅猛性能的全新第12代英特尔® 酷睿™ HX处理器外,其余4款产品都来自于数据中心与人工智能事业部。
分别是:
1、专用于高性能深度学习AI训练的Habana Gaudi2处理器和Greco AI加速器;
2、英特尔数据中心显卡(代号Arctic Sound-M);
3、第四代英特尔® 至强® 可扩展处理器(代号Sapphire Rapids)的部分细节;
4、以及英特尔基础设施处理器(IPU)的路线图(发展规划)。
这4种硬件,覆盖了IPU、CPU、GPU、AI处理器;应用场景也覆盖了从云到边缘再到终端。
英特尔Habana Gaudi2深度学习训练处理器
首先是可用于数据中心和云的两款AI产品“Habana Gaudi2 AI深度学习训练处理器”和Greco AI加速器,Habana Gaudi 2在处理器本身规格升级的基础上,通过应用更先进的7nm制程和配置96GB高速存储,同时板载SRAM从24MB增加到48MB,相比上一代产品性能提升十分明显,可针对计算机视觉与自然语言处理的模型训练与推理提供更高效能,并解决客户最关注的两个问题:降低服务器处理成本,还能减少训练模型所需时间。
此前英特尔就曾和宾夕法尼亚大学医学院联合开发了一项技术,通过应用联邦学习算法,帮助包括宾夕法尼亚大学在内的29个国际医疗机构在保护患者隐私的情况下,利用各方拥有的脑瘤数据共同训练神经模型。随着Gaudi2的加入,人工智能在医疗方面的应用也必然会进一步加速,从而帮助人们解决更多实际医疗需求。
Greco AI加速器的亮点则在于对于AI推理应用场景的专门优化,通过应用更先进的半导体制程,将功耗降到了75W,让搭载Greco AI加速器的加速卡更利于在服务器中进行使用。纵观目前全球的AI处理器发展进度,英特尔这两款处理器的计算能力与能效表现,在整个行业中都是非常出色的。
然后是全新的数据中心CPU和GPU。代号为Sapphire Rapids的第四代英特尔® 至强® 可扩展处理器已经正式开始出货。通过支持DDR5、PCIe 5.0和CXL 1.1,并凭借全新的集成加速器以及对AI工作负载的软硬件优化,第四代英特尔® 至强® 可扩展处理器相较上一代实现了显著的性能提升。例如,它集成的英特尔通信加速技术,有助于提升吞吐量;采用的英特尔数据流加速器,能够支持更高效的数据移动,包括从云平台到边缘的移动。
Sapphire Rapids还针对电信网络做了专门的优化,可以为虚拟无线接入网(vRAN)部署提供高达2倍的容量增益。同时,其内置高宽带内存(HBM),将显著提高处理器的可用内存带宽,为高性能计算提供强劲动力。
美国阿贡国家实验室超级计算机“Aurora”
英特尔通过合作,帮助企业充分利用至强处理器及软硬件产品组合,构建优化的解决方案。如大会上的展示,第四代英特尔® 至强® 可扩展处理器还与英特尔此前发布的数据中心显卡Ponte Vecchio一起,成为了美国阿贡国家实验室超级计算机“Aurora”(极光)的核心架构。通过强劲的CPU和GPU组合,后者整体算力已经超过2Eflop。
数据中心GPU显卡“Arctic Sound-M”
全新的面向多媒体转码、视觉图形处理和云端推理的英特尔数据中心GPU显卡“Arctic Sound-M”,能够提供每秒150万亿次运算,将包含两种不同的配置,150W功率版本和75W功率版本,分别封装了32个和16个Xe内核。这两种配置均配备了4个Xe媒体引擎、英特尔首款面向数据中心的AV1硬件编码器和加速器、GDDR6内存、光线追踪单元和内置XMX AI加速。可以实现处理多达8路4K视频流或超过30路1080p视频流转码,支持40路以上高清分辨率游戏,62个远程桌面,从而支持包括直播推流、云游戏、虚拟机、AI加速在内的多种用途应用。
兼顾多种使用场景的设计从根源上保证了用户使用过程中的灵活性。未来通过与英特尔自己本就十分灵活的CPU组合,数据中心显卡将会在多种场景中发挥出自己最高的效能。
最后是IPU(基础设施处理器),谷歌和Facebook自身的研究表明,碎片化的处理需求实际上会占到CPU使用率的22-80%。这些碎片化的请求占用了CPU的“时间”,影响CPU发挥出最大的处理能力。
为了解决现实中的性能浪费与处理请求,英特尔联合Google等大型客户,共同开发IPU(基础设施处理器)。核心思路就是把存储虚拟化、网络虚拟化、安全协议加速器、日常存储和网络功能剥离出来,交给更适合碎片化处理需求的专用处理器来完成。英特尔为此也给出了自己的发展计划,将在 2024年交付400GB 版本的产品,最终要在2025-2026年实现800GB处理能力的产品。
全力打造驱动下一次变革的生态
如果说在“传统”的CPU产品之外的众多硬件更新已经可以说明创新的决心,那么英特尔在生态上的规划和投入就是帮助产业和客户享受到半导体创新推动力的关键。
就以英特尔此次峰会上发布的AI处理器、GPU、CPU为例,这些新产品实际上都可以通过英特尔面向异构计算的统一编程架构oneAPI进行开发,比如英特尔数据中心GPU Arctic Sound-M,就可以利用oneAPI工具包和其中的开放软件堆栈,包括面向全堆栈流媒体编解码和分析、云游戏、云端推理、全堆栈虚拟桌面基础架构支持的多种开源软件,借由一套完整、可靠的工具包来完善现有编程语言和并行计算模型,在英特尔® 至强® 处理器和英特尔数据中心GPU之间无缝运行,从而释放各种处理器的全部性能潜力。
在基础的编程体系基础上,英特尔在本次峰会上还公布了一个全新的“阿波罗计划”,通过与埃森哲合作,这个计划将为企业提供30多个开源人工智能参考套件,这些解决方案经过专门的优化设计,使人工智能更容易被在本地、云和边缘环境中落地应用。第一批阿波罗计划工具包将在未来几个月内发布。
此外,英特尔首次进行了其软件基础设施计划Endgame项目的概念演示。应用程序可以充分利用这个软件基础设施层,使设备能利用网络中其他设备的计算资源,从而提供始终可用、低时延、连续的计算服务。例如,在一台设备上运行要求苛刻的GPU工作负载时,可以感知并利用来自更高性能计算设备上的额外图形处理算力,以增强用户体验。
英特尔还宣布推出Intel On Demand服务,可以满足企业不断变化的工作负载需求,实现产品可持续发展,并把握在靠近数据的地方扩展系统的机会。目前,英特尔推出了一种新型消费商业模式,以使客户能将其基础设施与业务需求相匹配,并通过包括如HPE GreenLake、联想TruScale和PhoenixNAP的裸机云在内的精选合作伙伴提供服务。
从硬件跨越式创新基础上还在软件配套与生态建设积极跟进的势头来看,提供数字化转型中IT设施创新所必需的软件和开放生态系统支持,对于拥有17000名软件工程师的英特尔来说,显然不是什么难事。
加速前行的英特尔
作为全球IT与半导体发展的历史领导者,英特尔在过去几年里因为制程的原因饱受争议。去年年初随着新CEO帕特·基辛格等一众技术型高管的回归,英特尔再度展现出了当年锐意创新的气势。
帕特·基辛格上任第一个月就提出的IDM2.0计划,不仅重拾了英特尔发展芯片制造的决心,同时也给出了英特尔在全球半导体行业中的出路:在制造自己产品的同时,也为外界代工,也找外界为自己代工。再次全力推进的半导体制程更新,让英特尔再次回到了能够与台积电、三星掰手腕的台面上。
而在此次On产业创新峰会上,帕特和一众高管都是跑步上台,英特尔内部说这是“Torrid Pace”,英特尔更是展示了其整体的IT战略布局,尤其是对全球进一步数字化、IT变革机遇下的野心,诸多再次指明未来IT行业发展方向的新产品,以及与一众伙伴一同展示的方案和案例,都在展现着这家老牌半导体巨头的技术实力与底蕴。
新常态所改变和创造的IT需求,让数字转型进入了新一轮的创新,正在成为英特尔重新发力的最好舞台。