产品概述
加速 AI 设计的 IP

可扩展至边缘设备与数据中心的 AI 加速器知识产权(IP)
AI 系统的设计需要在性能、功耗、芯片面积(PPA)和延迟之间实现精妙的平衡。Origin™ Evolution™ NPU IP 能够高效应对从边缘设备到汽车解决方案再到数据中心等多种应用场景中独特的工作负载与内存需求。该 IP 可针对特定用例进行定制优化,在支持大型语言模型(LLMs)、卷积神经网络(CNNs)、循环神经网络(RNNs)等多种模型的同时,实现最佳的 PPA 表现。
架构针对训练好的网络进行优化
Origin Evolution 提供无与伦比的精度和可预测的性能,无需任何硬件专属优化或对已训练模型的修改。其专利的基于数据包的执行架构,在单核条件下可实现高达 128 TFLOPS 的性能,并维持 70% 至 90% 的利用率。这些指标均基于在实际芯片上运行如 Llama 和 YOLO 等典型 AI 工作负载时测得。如此卓越的性能与效率,使用户能够在远低于其他方案的功耗下运行 LLM、CNN 以及其他 AI 模型。
已通过硅验证并获得第三方测试,Expedera 的架构极具能效,每瓦性能可达 18 TOPS。Origin Evolution NPU 提供可预测的性能、最小的内存占用,并具备完全可扩展性。这使其非常适用于几乎没有 DRAM 带宽的边缘解决方案,或诸如自动驾驶等高性能应用。Origin Evolution 通过 ASIL-B 认证,是工程师寻找一种单一 NPU 架构以轻松运行 LLM、CNN、RNN 及其他网络类型,同时在处理性能、功耗和面积方面实现最优表现的理想选择。
完整软件栈
"Expedera 的 Origin Evolution IP 平台包含一个完整的基于 TVM 和 Relax 的软件栈,使开发人员在将网络部署到目标硬件时能够高效工作。它支持 HuggingFace、Llama.cpp、PyTorch、ONNX、TensorFlow、TVM 等主流框架,用户可以直接部署已训练的模型,无需重新训练或牺牲精度。
该软件栈可自动处理如打包(packetization)和调试等任务,同时提供易于使用的选项,如混合精度(整数与浮点)量化(可使用您的工具或我们的工具)、自定义层和自定义网络支持,以及多任务 API。"
产品
Origin E1
神经引擎针对家用电器、智能手机和边缘节点中始终在线的应用程序的通用网络进行了优化,这些应用需要大约 1 TOPS 的算力性能。这款 E1 LittleNPU 处理器实施了进一步的精简,是大多数成本和面积敏感型应用的理想之选。
Origin E2
Origin E2 NPU 核心经过了功耗和面积优化,可节省智能手机、边缘节点和其他消费类和工业设备的系统功耗。通过精心考量处理器利用率和内存要求,E2 NPU 能够以最低的延迟实现最佳的性能。E2 配置性高,可提供 1 至 20 TOPS 的算力性能,支持常见的 RNN、LSTM、CNN、DNN 等网络类型。
Origin E6
Origin E6 NPU IP 核心性能经过优化,适用于智能手机、AR/VR 头盔和其他需要图像变换器、稳定扩散和点云相关 AI 的设备应用。通过精心考量处理器利用率和外部内存使用情况,E6 NPU 提高了功耗效率,并且最大程度降低了延迟。单核性能为 16 至 32 TOPS。
了解详情
Origin E8
Origin E8 NPU IP 核心专为汽车/ADAS 和数据中心等性能密集型应用而设计,擅长处理复杂的 AI 任务,包括计算机视觉、大语言模型、变形、点云、网格采样、图像分类和目标检测等任务。单核性能为 32 至 128 TOPS。
TimbreAI T3
TimbreAI T3 是一款超低功耗人工智能 (AI) 推理引擎,专为耳机等功率受限设备中的降噪用例而设计。TimbreAI 不需要外部内存访问,在提高性能和减小芯片尺寸的同时节省了系统功耗。
Origin Evolution 汽车版
专为高性能汽车/高级驾驶辅助系统(ADAS)应用设计,Origin Evolution 汽车版 NPU IP 核在复杂的人工智能任务中表现卓越,包括计算机视觉、大型语言模型(LLMs)、图像变换、点云处理、网格采样、图像分类和目标检测。单核性能可扩展至 96 TFLOPS,多核性能可达 PetaFLOPS 级别。
Origin Evolution 数据中心版
Origin Evolution 数据中心版能够支持大量且多样化的神经网络,提供最节能高效的 AI 推理解决方案。其 NPU IP 单核性能可达 128 TFLOPS,多核性能可扩展至 PetaFLOPs。
Origin Evolution 边缘版
Origin Evolution 边缘版开箱即用,兼容流行的大型语言模型(LLM)和卷积神经网络(CNN),在多种网络和表示形式中提供最佳的 AI 性能。其高度优化的 NPU IP 解决方案可定制,单核性能可扩展至 32 TFLOPS,以满足最先进的边缘推理需求。
Origin Evolution 移动版
支持大型语言模型(LLM),Origin Evolution 移动版为智能手机制造商提供高效的 AI 推理解决方案,助力实现用户所需的高级功能。其经过实战验证的 NPU IP 解决方案可定制,单核性能可扩展至 64 TFLOPS。