体验 AI 推理
重塑神经网络加速器 IP
体验 AI 加速器超出所有预期的能力,以及优于竞争对手的性能。艾伯德神经处理器经过精调,
支持在 PPA 受限的设备上部署日益复杂的 AI 网络
完美适配边缘设备的 PPA
至精至简的 AI 机器
我们采用基于数据包的特殊架构,提供业内最为高效的 NPU IP
解决方案。这种架构完全可扩展,能够实现超高效的工作负荷调度和内存管理,处理器使用率达 90%
产品量身定制,可发挥最佳性能
恰到好处
艾伯德根据客户的 PPA 和模型要求,为其量身定制精确满足应用需求的解决方案。所产生的 NPU
大小合适,可满足当下和未来的网络支持需求,杜绝芯片面积浪费,并将内存开销降至最低。
释放 AI 性能
Origin Evolution™ 是一种在神经引擎知识产权(IP)方面的突破性进展,面向 AI 推理任务,在智能手机、汽车和数据中心等多种应用中提供最佳性能。它内建对主流的大型语言模型(LLM)和卷积神经网络(CNN)的支持,基于 Expedera 独有的基于数据包的架构,进一步提升了 Origin NPU IP 的成功基础。这种架构将内存需求降至最低,大幅削减处理开销,远比常见的基于层的架构更高效
通过将每一层细分为可独立执行的自包含片段,它实现了多层并行执行、更优的资源利用率以及可预测的性能表现。这种设计还消除了对硬件专属优化的依赖,使客户能够在不改变模型的前提下,直接部署训练好的神经网络,并保持原有的准确性不变。
效率
体验行业领先的
18 TOPS/W (TOPS/mm²)
可扩展性
单核性能高达 128 TOPS / 128
TFLOPS,可扩展至 PetaOps / PetaFLOPS。
灵活性
原生支持主流
网络和数据类型
可预测性
每个工作负载有确定的性能
和延迟
可配置性
尺寸适合当下和
未来的网络
可靠性
在 1000 多万台
消费类设备中得到了现场验证
应用
产品
Origin E1
神经引擎针对家用电器、智能手机和边缘节点中始终在线的应用程序的通用网络进行了优化,这些应用需要大约 1 TOPS 的算力性能。这款 E1 LittleNPU 处理器实施了进一步的精简,是大多数成本和面积敏感型应用的理想之选。
Origin E2
Origin E2 NPU 核心经过了功耗和面积优化,可节省智能手机、边缘节点和其他消费类和工业设备的系统功耗。通过精心考量处理器利用率和内存要求,E2 NPU 能够以最低的延迟实现最佳的性能。E2 配置性高,可提供 1 至 20 TOPS 的算力性能,支持常见的 RNN、LSTM、CNN、DNN 等网络类型。
Origin E6
Origin E6 NPU IP 核心性能经过优化,适用于智能手机、AR/VR 头盔和其他需要图像变换器、稳定扩散和点云相关 AI 的设备应用。通过精心考量处理器利用率和外部内存使用情况,E6 NPU 提高了功耗效率,并且最大程度降低了延迟。单核性能为 16 至 32 TOPS。
了解详情
Origin E8
Origin E8 NPU IP 核心专为汽车/ADAS 和数据中心等性能密集型应用而设计,擅长处理复杂的 AI 任务,包括计算机视觉、大语言模型、变形、点云、网格采样、图像分类和目标检测等任务。单核性能为 32 至 128 TOPS。
TimbreAI T3
TimbreAI T3 是一款超低功耗人工智能 (AI) 推理引擎,专为耳机等功率受限设备中的降噪用例而设计。TimbreAI 不需要外部内存访问,在提高性能和减小芯片尺寸的同时节省了系统功耗。
Origin Evolution 汽车版
专为高性能汽车/高级驾驶辅助系统(ADAS)应用设计,Origin Evolution 汽车版 NPU IP 核在复杂的人工智能任务中表现卓越,包括计算机视觉、大型语言模型(LLMs)、图像变换、点云处理、网格采样、图像分类和目标检测。单核性能可扩展至 96 TFLOPS,多核性能可达 PetaFLOPS 级别。
Origin Evolution 数据中心版
Origin Evolution 数据中心版能够支持大量且多样化的神经网络,提供最节能高效的 AI 推理解决方案。其 NPU IP 单核性能可达 128 TFLOPS,多核性能可扩展至 PetaFLOPs。
Origin Evolution 边缘版
Origin Evolution 边缘版开箱即用,兼容流行的大型语言模型(LLM)和卷积神经网络(CNN),在多种网络和表示形式中提供最佳的 AI 性能。其高度优化的 NPU IP 解决方案可定制,单核性能可扩展至 32 TFLOPS,以满足最先进的边缘推理需求。
Origin Evolution 移动版
支持大型语言模型(LLM),Origin Evolution 移动版为智能手机制造商提供高效的 AI 推理解决方案,助力实现用户所需的高级功能。其经过实战验证的 NPU IP 解决方案可定制,单核性能可扩展至 64 TFLOPS。