『公司动态』PG电子(中国官方网站)在半导体领域的最新动态,包括技术突破、产品发布及公司活动,见证我们如何推动行业发展。

从CPU到NPU英特尔芯片到底快了多少?开发者实测:AI性能飞跃15倍!

2025-02-16  

  【CSDN 编者按】在 AI 技术快速发展的今天,计算硬件的进步正成为推动 AI 应用落地的关键力量之一。英特尔最新芯片搭载的神经处理单元(NPU),以其高效的 AI 任务处理能力,为开发者带来了全新的性能体验。相较于传统CPU,NPU 可以显著提升 AI 模型的运行速度,但具体能提升到什么程度呢?为了解答这个问题,本文作者通过实际测试和深入解析,最终确认:NPU 大概能带来 15 倍的性能提升。

  目前,英特尔最新的芯片配备了一个神经处理单元(NPU),其设计目标是比普通 CPU 更高效地处理 AI 和机器学习任务。理论上来pg电子官方网站 PG平台说,NPU 可以更快地运行 AI 工作负载,并且功耗更低——这非常好,因为你可以将 CPU 释放出来执行其他通用任务。

  但我想知道,与 CPU 相比,NPU 在运行模型时到底能快多少。根据我的测试结果:NPU 大概能带来 15 倍的性能提升,这实在是令人惊讶。

从CPU到NPU英特尔芯片到底快了多少?开发者实测:AI性能飞跃15倍!(图1)

  如果你正在考虑购买一款带有 NPU 的边缘设备,我可以推荐 Khadas Mind 2 迷你 PC。它非常小巧,但性能强大,还配备了一个小型电池作为 UPS(不间断电源),你可以随意更换 USB 电源而不会断电。好的,现在让我们看看我是如何得出标题中提到的那个数字的。

  在实时计算机视觉中,吞吐量和延迟是影响系统效率和响应速度的两个基本性能指标。吞吐量指的是每秒处理的帧数(FPS),决定了系统在一段时间内能处理多少数据,这基本上就是你问“处理这段视频需要多长时间”时所指的内容。另一方面,延迟是指从输入到输出处理单帧所需的时间,它会影响系统对新数据的响应速度。在增强现实和自动驾驶等实时应用中,低延迟至关重要。当你操作一个系统时,如果感觉它“卡顿”,那就是因为它的延迟很高。通常来说,一般人都希望保持低延迟和高吞吐量。

  接下来,假设你已经在系统上安装了 OpenVINO,且设备中有一个带有 NPU 的英特尔芯片。如果你自己也不太确定,可以通过运行以下命令快速检查这两点是否属实:

  你应该会看到类似 [CPU, GPU, NPU] 的回复,这些是 OpenVINO 中可用的设备。如果你没有看到你的设备,请确保你正确安装了驱动程序,并在继续之前进行故障排除。

  接下来,我们需要一个模型。我将使用 ResNet-50,这是最著名的卷积神经网络架构之一,由微软在 2015 年的论文《Deeppg电子官方网站 PG平台 Residual Learning for Image Recognition》中首次被提出。该模型在 ImageNet-1K 数据集上以 224×224 的分辨率进行了训练,这意味着你可以输入一张该尺寸的图像,模型将预测 1000 个不同物体类别的概率。

  经过 OpenVINO 优化的 ResNet-50,可以前往这个地址:。只需这两个文件:resnet50_fp16.xml 和 resnet50_fp16.bin,并将它们放在你的工作文件夹中。如果你想尝试其他模型,也可以这样做。请确保对你的模型运行 OpenVINO 优化器以获得最佳性能。我还将用 OpenCV 来加载和调整图像大小,因此我们先安装它,并确保 numpy 也已安装:

  现在,让我们用这个模型对图像进行分类。将以下代码写入一个文件并保存为 classify.py:

从CPU到NPU英特尔芯片到底快了多少?开发者实测:AI性能飞跃15倍!(图2)

  现在我们已经确认模型在 OpenVINO 上可以正常工作,接下来我们可以使用一个方便的工具——benchmark_,来对不同设备上的模型性能进行基准测试。这个工具可以帮助你快速检查不同设备在运行不同模型时的性能表现。你可以通过以下命令调用它:

从CPU到NPU英特尔芯片到底快了多少?开发者实测:AI性能飞跃15倍!(图3)

  这些结果清楚地表明,在延迟和吞吐量方面,英特尔的 NPU 相比 CPU 都有显著的性能提升,特别是在这个特定的 ResNet-50 模型中,性能提升了大约 15 倍。

  DeepSeek 到底做了什么?所谓的“DeepSeek时刻”或者“国运级创新”到底意味着什么?今晚 8:00-9:30,CSDN 视频号推出“DeepSeek 暨 AI 进化论十日谈”系列第一讲精彩为您呈现,欢迎预约关注!

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  单位里出现怪现象:领导上午办完退休手续,下午就退出所有工作群,谁也不打招呼就走了

上一篇:PassMark:2025年PC CPU性能自2004年来首
上一篇:骁龙SM8845处理器已在路上:3nm+全自研架构或替代骁龙

猜你喜欢

  • 2025年革命性处理器芯片引领AI与智能设备新时代

    2025年革命性处理器芯片引领AI与智能设备新时代

      在如今人工智能与高速计算日益成为科技发展的重要驱动力的背景下,业内最新推出的处理器芯片引起了广泛关注。这款由知名公司设计的新型处理器,不仅配备了一流的计算能力,还采用了适应AI应用的架构,可以极大提高智能设备的处理效率,为用户提供前所未有的体验。推动这一变革的不仅是技术进步,更是对处理器设计理念的全新理解,未来的芯...
  • 四年提升15倍!Intel至强6仍是唯一MLPerf测试CP

    四年提升15倍!Intel至强6仍是唯一MLPerf测试CP

      快科技4月3日消息,MLCommons公布了最新的MLPerf推理v5.0基准测试结果,Intel至强作为通用处理器的代表,再次表现出色,最新的至强6性能核在六个关键项目中都很抢眼,AI性能比上代提升多达1.9倍!  迄今为止,Intel仍是唯一一家持续向MLPerf提交服务器CPU测试结果的厂商。  最新的一轮中...
  • 轻薄本支棱起来了!Intel酷睿Ultra 200H处理器D

    轻薄本支棱起来了!Intel酷睿Ultra 200H处理器D

      第三页 通过浏览器插件使用图形化界面:Page Assist插件简单方便  第五页 LM Studio部署工具:更方便易用的工具 但效率不如Ollama  第六页 本地AI应用1:配合沉浸式翻译插件 使用本地AI大模型翻译网页  第七页 本地AI应用2:建立本地知识库 通过AI大模型快速处理海量数据  Intel酷...
  • 【秒懂知识库】2023 年手机 CPU 综合性能天梯图

    【秒懂知识库】2023 年手机 CPU 综合性能天梯图

      处理器的学名是 SOC,全称「System On Chip」,包含了 CPU、GPU、NPU(不一定有)、ISP、调制解调器(基带),协处理器(不一定有)和 DSP。  总有人对处理器有误解,觉得自己对手机的性能要求不高,够用就好,觉得自己不玩游戏,不需要顶级的处理器,但处理器几乎负责了手机中需要运算的所有工作。 ...
微信

手机扫一扫添加微信