导语:性能够用,价格友好,至强是智能化转型的实用首选。
正如新药研发在临床前鲜有人问津,却能在上市后挽救无数生命。
医院的智能化升级鲜为人知,却悄然重塑着每一位患者的就医体验。
从面向大众的智能问诊、家庭健康助手,到赋能医护的AI导诊、临床辅助诊疗,再到加速影像分析、提升疑难疾病早筛率的AI阅片技术——医疗行业正悄然发生变化。
这种变革的背后,依靠的不是技术本身有多“炫”,而是让先进技术普及落地。
作为最普及的计算芯片,CPU在将尖端创新转化为日常应用中,始终扮演着至关重要的角色。
无论是智慧医疗、数字化工厂,还是精准农业、未来教育,英特尔至强CPU以持续进化的性能和高性价比,为千行百业提供了稳定的算力底座。
那么,为什么越来越多行业转型升级都不约而同地选择了英特尔至强CPU?
医疗大模型落地,首选至强
提升医生的诊断效率,以及出院记录自动生成,能够大幅提升患者和医生的体验,这离不开医疗大模型。
基于惠每科技医疗大模型构建的鉴别诊断应用工作流程
实际场景中,医生接诊病人的时,打开病程记录并填写患者主诉及病例特点后,后台的三个医疗大模型就会迅速执行推理,数秒后即可生成鉴别诊断结果,医生再根据自身的专业意见选择最优结果,选择“一键回填”或复制粘贴到病历相应的位置,大幅提升接诊效率,患者等待时间明显缩短。
出院记录的自动生成也是患者和医生都期待的体验。传统流程需要医院多个部门汇总多类数据并形成摘要,过程耗时长且容易出现信息遗漏。
借助医疗大模型,医生打开或保存出院记录时,会立即触发大模型后台计算,几秒钟内生成包含出院诊断、入院情况、诊疗经过、出院情况及医嘱等内容的报告。医生可一键回填,极大提升工作效率,也显著改善患者体验。
集成大模型的惠每新一代 AI 大数据处理平台架构
这是领先的医疗人工智能解决方案提供商北京惠每云科技有限公司 (简称惠每科技)的临床决策支持系统(CDSS)已经实现的功能,并且可以部署到既有的英特尔架构处理器平台。
这意味着医疗机构无需采购昂贵的专用加速芯片或服务器,仅用英特尔至强处理器即可部署医疗大模型,实现私有化部署,且成本可控,这也是医疗机构首选至强CPU的主要原因。
成本可控,效果可以保证吗?答案是肯定的。
大模型通常拥有数百亿至千亿参数,对算力和内存要求严苛。为了用更少算力实现理想效果,量化成为常用方法。通过将训练好的模型权重、激活值等从高精度数据格式(如FP32)转换为低精度格式(如INT4/INT8),能同时降低算力和内存需求。
作为英特尔开源AI框架IPEX的一部分,IPEX-LLM不仅支持多种低精度格式的优化,还能基于处理器内置指令集(如英特尔AVX-512_VNNI、英特尔AMX)及配套软件加速推理,大幅提升英特尔架构平台上大模型的推理效率。
惠每科技就使用英特尔AVX-512_VNNI指令集,显著加速了其医疗大模型在INT4低精度数据格式上的推理。
除了量化优化方案,英特尔还借助面向AI推理及部署优化的软件工具套件OpenVINO,为惠每科技打造了非量化优化方案。
非量化方案对算力和内存要求更高,落地难度大。惠每科技率先利用了第四代英特尔至强可扩展处理器首次内置的英特尔AMX指令集,在保证精度的同时,提高运算效率、加速推理。
经过英特尔与惠每科技的协同优化,无论是医疗大模型的量化优化,还是非量化优化方
案,都能在保证精度的前提下有效提升医疗大模型的推理速度,同时基于英特尔架构处理器的部署方案也能帮助医疗机构有效地节约成本。
惠每科技CDSS在多家合作医疗机构部署后,临床应用优势和价值迅速显现。
惠每科技的统计数据显示,在某合作医院的某科室上线1个月后,鉴别诊断应用的使用率已达23%以上,出院记录自动生成应用的使用率达到15%以上,基于第四代英特尔至强可扩展处理器优化的医疗大模型的AI应用已获得医生的初步认可。
疾病诊疗全流程,为什么不选GPU?
与惠每科技类似,东软融入AI技术,能够为医学影像提供智能诊断、质量控制、结构化报告等能力的支撑的PACS/RIS系统,也首选了至强可扩展处理器进行部署,而非性能虽强但成本较高的GPU。
这是因为在医疗这类成本敏感的场景中,面向AI推理进行优化的英特尔至强处理器有助于降低成本。同时,部分PACS/RIS场景的AI推理具备批处理特性,对AI推理时延性能不敏感,适合采用CPU进行推理。
与惠美科技不同,东软选择的是更先进的第五代英特尔至强可扩展处理器。
相较上一代,第五代英特尔至强可扩展处理器可在相同功耗范围内提供更高的算力和更快的内存,整体性能提升21%,推理性能提升42%,内存速度提升16%,三级缓存提升2.7倍,每瓦性能提升10倍,在满足性能需求的同时提升系统灵活性并降低总体拥有成本(TCO)。
第五代英特尔至强可扩展处理器具备更强大性能
研发中,东软智慧医学影像信息系统PACS/RIS在执行三维可视化任务时,发现其产品在部分应用中的性能明显不足。东软通过Intel VTune Profiler定位瓶颈函数并优化代码,提升了三维可视化性能,充分发挥了第五代至强可扩展处理器软硬件协同优化的能力。
测试数据显示,在处理器开通4并发8线程时,英特尔至强铂金8592+处理器(第五代)的性能相较于英特尔至强金牌6430处理器(第四代)和英特尔至强银牌4210R处理器(第二代)均有明显提升,其中相比第二代的提升幅度高达2.45倍。
PACS/RIS 系统的三维重建应用运行效率比较
此外,东软智慧医学影像信息系统PACS/RIS借助内置的英特尔AMX加速器以及OpenVINO工具套件,提升了融合的广泛AI算法的推理效率。
测试结果显示,以BF16精度异步推理参数量较小模型(342,978)及较大模型(31,185,568)时,第五代至强铂金8592+处理器性能相较第二代银牌4210R分别提升2.55倍和8.49倍。
BF16 精度下的异步推理性能比较
这充分说明,英特尔至强可扩展处理器一直紧跟市场需求,持续迭代,保证其在满足更高性能以及AI推理需求的同时,还具备更高部署灵活性和更优成本控制能力,能够承担更广泛负载。
相较之下,人工智能辅助药物开发 (AIDD)选择英特尔至强CPU而非GPU,还有生态层面的考虑。
对传统制药领域“双十定律”的突破,是AIDD为人津津乐道的优势之一,即它能以短至十数月的耗时,及低至以百万美元计的费用,击穿过去动辄十年用时加10亿美元成本起步的新药研发天花板。
AIDD是此前已经广为应用的计算机辅助药物发现 (CADD)的演进与补充,两者对算力的渴求也都在与日俱增。再考虑到新药研发各环节的计算特点,它们对算力的需求还有周期性强、峰值需求量高等特点。
虽然目前科学计算与AI都开始出现通用计算平台与专用加速芯片并行演进的局面,但应用历程更久的CPU平台相比专用加速芯片,不仅有部署和应用基础更为广泛的特点,还在总拥有成本 (TCO)、性价比、易用性和易获取方面有更强的优势,能帮助更多用户缓解算力紧张的局面。
英特尔与隶属于美国麻省理工学院和哈佛大学的博德研究所,双方合作聚焦于能从药物研发源头加速的“基因组分析工具包”,即GATK (Genomics Analytics Toolkit)。
此前,英特尔已经基于第五代至强可扩展处理器进行了针对GATK的优化,目标是让该工具包能充分利用该处理器微架构上的提升,如相比前一代产品 1.5 倍的内核数量、 更高的主频 (2.3GHz对比2.0GHz)、更强的内存子系统 (5,600MT/s对比4,800MT/s) 以 及更大的末级缓存容量,并进一步释放其专攻科学计算加速的指令集— —英特尔AVX-512带来的性能增益。
至强平台的持续革新为GATK带来持续的性能优化
测试结果显示,第五代英特尔至强可扩展处理器实现了比上一代平台高出61%的吞吐量。
在药物分子发现与筛选环节,英特尔至强处理器也发挥着重要作用。
第三代英特尔至强可扩展处理器就对AlphaFold2提供了算力支持与优化,第四代英特尔至强可扩展处理器发布后得到进一步提升,特别是充分利用了这一代产品内置的AI加速技术——英特尔高级矩阵扩展(AMX)。
并且已经形成了一套基于第四代英特尔至强可扩展处理器、至强 CPU Max 系列处理器,以及一系列软硬协作的优化的完整、易获取的AlphaFold2端到端解决方案。在一项基于某公有云服务的测试中,这一方案不但在性能上获得了远优于某高端 GPU 平台的表现,同时优于由CPU与GPU混合构建的方案。
英特尔至强不仅能加速药物的前期设计与发现阶段,还解决成药阶的挑战,比如晶型预测。
某药物研发企业基于C++开发的晶体结构预测类应用,在至强平台上实现了软硬协同优化。在低难度 (LC)、中难度 (MC)、高难度 (HC) 和极高难度 (EC) 四个用例的测试中,多种工具优化效果在至强平台上累加,最高可以换来2.32倍的性能提升,提高研发效率和投资回报率。
CPU为智能化变革提供强大支持
从加速药物研发流程,到提升医院的智能化体验,英特尔至强处理器不仅为生命科学研发助力,也是患者就医和医生接诊数字化体验的基石。
但英特尔在数据中心领域的软硬件强大能力远不止于此。
在传媒行业,北京中科大洋科技发展股份有限公司基于第五代英特尔至强可扩展处理器出色的算力密度,满足超高清视频处理的苛刻要求的同时,无需专门的AI推理服务器即可实现AI超分、降噪等任务,高效利用现有服务器资源,节省总体拥有成本(TCO),降低运维门槛。
在智能制造领域,TCL华星光电充分利用英特尔的端边技术能力,构建了从设备端图像采集到结果反馈的完整闭环方案。在生产线检测和智慧物流方面,TCL华星光电也利用英特尔的硬件产品和云边端架构,有效降低了运营成本,并显著提高了良品率。
在可持续农业领域,Nature Fresh Farms部署的超过2000个传感器和摄像头,实现对每株植物从播种到出厂的全程监控。英特尔至强处理器硬件强大的数据处理能力,结合OpenVINO工具套件,利用内置加速器进行高效AI推理,将原本需两三小时完成的温室数据收集、处理和分析缩短至30分钟。
另外,在教育发展、生态保护等领域,英特尔至强也凭借其高效AI算力和软硬件技术的解决方案,推动数字化与智能化普及。
就像是从大型计算机到个人电脑,靠的是便宜又好用的微处理器,从互联网时代再到移动互联网时代,变革靠的是技术成熟、用户体验优异和硬件成本降低。
如今的生成式AI和数字化转型时代,同样需要易于获得且高性价比的软硬件解决方案,性能不断强大的英特尔至强依旧能够为智能化和数字化浪潮提供强大助力。