加速器微处理器主要用于genAI的两个目的:训练和推理。处理AI训练的芯片使用大量数据来训练神经网络算法,进而期望其做出准确的预测,例如句子中的下一个词或短语,或下一个图像。因此,芯片需要快速推断出对提示(查询)的答案。

英特尔宣布其最新的x86处理器系列已上市,并希望该系列处理器及其之前发布的Gaudi系列能够帮助其从行业领头羊Nvidia手中夺取AI市场份额。

尽管英特尔的新一代X86处理器实际上不会运行AI工作负载,但其目标是面向人工智能(AI)任务。

在本周的Computex上,英特尔宣布了其Xeon 6处理器系列,并介绍了其所谓的高效核心(E核),据称其性能将比Xeon 5处理器提升至4.2倍。首款Xeon 6 CPU是Sierra Forest版本(6700系列),而更注重性能的Granite Rapids(具有性能核心,即P核或6900系列)将于下季度发布。

据英特尔称,升级后的Xeon处理器在提供相同性能的同时,实现了3:1的数据中心机架整合,并在每瓦性能上提升了2.6倍。ABI Research的首席分析师Reece Hayden表示:“数据中心AI市场高度关注AI功耗的影响,并且对环境影响和电网负荷的担忧日益增加。英特尔Xeon 6将作为Gaudi驱动的AI系统中的CPU头节点。改进的每瓦性能和密度将减少AI系统的功耗,这将有助于AI的整体能源足迹。”

更高的机架密度允许数据中心整合,释放空间以部署支持训练或推理的AI硬件,Hayden说。英特尔还发布了其面向AI PC行业的Lunar Lake客户端处理器系列。根据英特尔的数据,这些x86芯片的系统级芯片(SoC)功耗比上一代降低了多达40%。

Lunar Lake Core Ultra处理器系列预计将在今年第三季度上市;这些芯片配备了神经处理单元(NPU),其平台每秒超过100万亿次操作(TOPS),NPU每秒超过45万亿次操作(TOPS),目标是支持新一代的生成AI(genAI)任务的PC。

英特尔最近详细介绍了其芯片战略,概述了从数据中心到边缘设备运行AI的处理器系列计划。根据IDC的数据,两年内100%的企业PC采购将是AI计算机。

英特尔CEO Pat Gelsinger在本周的台湾Computex会议上发表声明称:“英特尔是世界上少数几家在整个AI市场机会中进行创新的公司之一,从半导体制造到PC、网络、边缘和数据中心系统。”

英特尔还公布了其Gaudi 2和Intel Gaudi 3 AI加速器套件的价格——这些深度学习加速器旨在支持训练和推理大型语言模型(LLM)。包含八个AI芯片的Gaudi 3加速器套件售价约为125,000美元;前一代Gaudi 2的标价为65,000美元。

加速器微处理器主要用于genAI的两个目的:训练和推理。处理AI训练的芯片使用大量数据来训练神经网络算法,进而期望其做出准确的预测,例如句子中的下一个词或短语,或下一个图像。因此,芯片需要快速推断出对提示(查询)的答案。

但LLM在开始推断出有用的答案之前必须先进行训练。最受欢迎的LLM基于从互联网摄取的大量数据提供答案,但有时会不准确或给出完全离奇的结果,这就是生成AI幻觉的情况。

IDC计算半导体研究副总裁Shane Rau表示,英特尔推出的带有P核和E核的Xeon 6承认最终用户的工作负载在不断多样化,根据用户的具体工作负载,他们可能主要需要性能(P核)或平衡性能和功耗(E核)。

Rau说:“例如,主要在核心数据中心运行的工作负载,由于电力约束较少且更需要原始性能,可以使用更多的P核。相比之下,主要在边缘系统(如边缘服务器)中运行的工作负载需要在更受限的环境中工作,在这些环境中必须限制功耗和热输出,因此受益于E核。”

“如果你认为AI是模拟人类行为,而人类做很多不同的任务需要不同的能力组合,那么可以推断,AI将根据任务的不同需要不同的能力,”Rau继续说道。“此外,并非每个任务都需要最大性能,因此需要最大加速(例如服务器GPU),许多任务只需在微处理器上运行,或者在其他类型的专用加速器上运行。这样,AI就像一个新市场,在成熟的过程中不断细分。”

© 版权声明

相关文章

返回顶部