Origin E8

顶级性能产品

Origin E8 是专为性能密集程度最高的应用设计的系列 NPU IP 推理核心，包括汽车和数据中心应用。E8 可以同时运行多个网络而上下文切换损耗为零，其在需要高性能、低延迟和高效利用处理器时表现出色。与依靠平铺技术来扩展性能的其他 IP 不同，E8 单核性能高达 128 TOPS，可以为最先进的 LLM 和 ADAS 实现提供所需的计算能力，平铺技术会带来相关的功耗、内存共享和面积损失。

可定制

节能

可持续性能

易于部署

经过现场验证

选择您需要的功能

定制带来诸多好处，包括提高了性能，降低了延迟，减小了功耗，以及杜绝了芯片面积浪费。艾伯德在设计阶段与客户合作，了解其用例、PPA 目标和部署需求。借助于上述信息，我们将 Origin IP 配置成一种完美适配具体应用的定制解决方案。

一家电动车 OEM 制造商准备开发自己的 ADAS 处理器，经过优化后，这款处理器需要同时运行标准神经网络和内部开发的神经网络，并且可以在流片后灵活部署新的网络。在测试了来自多家供应商的十几个不同平台之后，这家制造商称艾伯德的 Origin IP 为“市场一流产品”。测试包括高达 8K 的输入分辨率以及 100 至 500 TOPS 的计算能力，主要关注最低的确定延迟和最低的 DDR 内存带宽。

特征

规格

计算能力	16K 至 64K INT8 MAC
多任务	同时运行超过 10 项作业
功耗效率	性能效率达 18 TOPS/W；无需剪枝、稀疏化或压缩（尽管支持）
支持的网络示例	Llama2-7B、YOLO v3、YOLO V5、RetinaNet、Panoptix Deeplab、PlainLite、ResNext、ResNet 50、Inception V3、RNN-T、MobileNet V1、MobileNet SSD、BERT、EfficientNet、FSR CNN、CPN、CenterNet、Unet、ShuffleNet2、Swin、SSD-ResNet34、DETR 等
性能示例	YOLO v3 (608 x 608)：626 IPS，115.6 IPS/W（N7 制程，1GHz，未应用稀疏化/剪枝/压缩技术）
层支持	标准神经网络功能，包括卷积、反卷积、全连通、激活函数、Reshape、Concat、Elementwise、池化、Softmax 等。可编程通用浮点函数，包括 Sigmoid、Tanh、Sine、Cosine、Exp 等。
数据类型	INT4/INT8/INT10/INT12/INT16 激活值/权重
量化	Channel-wise 量化（TFLite 规格）软件工具链支持艾伯德、客户提供或第三方进行的量化
延迟	确定性能保证，无背压
框架	支持 TensorFlow、TFlite、ONNX 等

性能为 32-128 TOPS，多核性能可达 PetaOps 及以上	输入分辨率可达 8K 及以上
性能效率高达 18 TOPS/W	支持标准、定制和专有神经网络
Runs LLM, CNN, RNN, DNN, LSTM, and other network types	提供完整的软件栈，包括编译器、估算器、调度器和量化器
支持变换器、稳定扩散、大语言模型 (LLM) 等	以软 IP (RTL) 或 GDS 形式提供

Search

用于打造最高性能系统的 AI 推理

从数据中心到自动驾驶汽车，最严苛的 AI 应用需要高性能的 NPU，同时延迟也要保持最低。Origin™ E8 采用高度可定制的架构，单核性能可以扩展到 128 TOPS，而多核性能可扩展至 PetaOps。

顶级性能产品

创新架构

选择您需要的功能

市场领先的 18 TOPS/W

高效的资源利用率

基于 TVM 的完整软件栈

成功部署在 1000 万台设备上

用例

汽车定制网络部署

下载白皮书

联系我们

Origin E8

用于打造最高性能系统的 AI 推理

从数据中心到自动驾驶汽车，最严苛的 AI 应用需要高性能的 NPU，同时延迟也要保持最低。Origin™ E8 采用高度可定制的架构，单核性能可以扩展到 128 TOPS，而多核性能可扩展至 PetaOps。

顶级性能产品

创新架构

选择您需要的功能

用例

汽车定制网络部署

下载白皮书

联系我们

持续关注

订阅我们的新闻