
用于 AI 设计的
加速器 IP
可为任何应用进行扩展的
AI 加速器平台
艾伯德的统一计算流水线架构 IP 支持高效的硬件调度和高级内存管理,从而实现优秀的端到端低延迟性能。该架构已在数学上被证明,为神经网络 (NN) 执行使用的内存最少。我们的 Origin™ 深度学习加速器 IP 使系统设计人员能够满足一系列低延迟、节能和高性能要求。这将大幅降低芯片面积,减少 DRAM 访问,提高带宽,节省功耗,并显著提高性能。由于神经网络会生成大量中间数据,因此,通过尽量减少内存,可以在片上实时运行高分辨率神经网络处理,如 4K/8K 视频。艾伯德 Origin 以理想的 IP 大小提供卓越性能,易于集成和扩展,并可根据您的独特需求进行定制。对于功率受限的应用,如耳机和智能扬声器,我们提供 TimbreAI T3,这是一款超低功率 AI 推理引擎,专为音频降噪而设计。
艾伯德的 Origin 架构允许设计人员在无需改变的情况下运行训练好的神经网络,而不需要针对硬件进行特定的优化。
Origin 使 AI 硬件和软件工程师能够实现更高的精度和可预测的性能。原生数据包执行架构可实现简化的软件环境,从而降低设计复杂性并简化集成工作。
Origin 可实现高达 128 TOPS 的持续性能,典型利用率达到 70 至 90%(在运行诸如 ResNet 之类常见 AI 工作负载的硅中测量)。其性能和利用率处于业内一流水平,让用户能够以比其他解决方案更低的功耗运行 AI 模型。在第三方测试中,艾伯德的架构已经过硅验证,可以达到 18 TOPS/W 的效率。Origin 在图像相关的任务方面表现出色,如计算机视觉、图像分类和目标检测。此外,它还能够执行与 NLP(自然语言处理)相关的任务,如机器翻译、句子分类和生成。Origin 以非常小的内存占用提供确定的性能和可扩展的片上执行能力,并可从 DRAM 带宽很少或没有 DRAM 带宽的边缘解决方案扩展到高性能应用,如自动驾驶和云应用,而不需要其他解决方案所需的软件膨胀。简单而言,Origin 产品系列为寻求单一 DLA 架构的工程师提供理想的解决方案,该架构可以根据各种应用要求轻松扩展,同时保持理想的处理能力、功耗和面积。
艾伯德的 4 个 Origin 神经网络引擎 IP 产品系列可以进行调整,以满足任何人工智能应用的需求。 在下文了解有关艾伯德 Origin E1, Origin E2, Origin E6, 和 Origin E8 的详情。
Origin 产品系列

Origin E1
艾伯德 OriginTM E1 NPU(神经处理单元)是一系列人工智能处理核心,每一个核心都针对边缘、智能手机、消费类设备等常用的一类具体神经网络进行过单独优化。艾伯德针对具体的神经网络量身打造 Origin E1 IP,推出的 NPU 不仅消耗尽可能少的硅面积和外部带宽,而且能够提供最佳的性能和利用率。
- 架构可满足多种计算需求
- 无需片外 DRAM

Origin E2
Origin E2 专为手机和边缘节点等功耗敏感型设备中的单作业 AI 应用而设计。Origin E2 仅使用片上内存,消除了对外部 DRAM 访问的需求,在提高性能的同时节省了系统功耗,降低了延迟,并缩减了系统 BOM 成本。Origin E2 可针对特定工作负载进行调整,从而为独特的应用要求提供理想的性能配置文件
- 无需外部 DRAM 访问要求的运行时处理
- 为应用工作负载量身定制,支持高达 20 TOPS
- 高效引擎,功耗不到 1W

Origin E6
Origin E6 针对功耗和性能进行了优化。它为智能手机、平板电脑和边缘服务器中的 AI 应用运行广泛的神经网络 (NN) 模型。高级内存管理可确保持续的 DRAM 带宽和理想的总体系统性能。
- 运行神经网络模型,包括卷积、反卷积、全连通、最大池化、平均池化、全局池化、Reshape
- 在运行时期间启用 L3 缓存或 DRAM 访问,从而大幅减少传输
- 双作业支持,拥有高达 32 TOPS 的性能
- 高效引擎,功耗不到 2W

Origin E8
Origin E8 是一款高性能深度学习加速器,面向汽车/ADAS 和数据中心等高 TOPS 应用。Origin E8 提供多任务支持,能够更好地利用硬件资源并降低系统成本。该加速器具备高效神经网络引擎,使设计人员可以开发采用被动散热的产品,从而进一步降低系统成本。
- 运行神经网络模型,包括卷积、反卷积、全连通、最大池化、平均池化、全局池化、Reshape 等
- 大幅减少 DRAM 要求,降低 BOM 成本
- 高效的引擎,可扩展到高达 128 TOPS

TimbreAI T3
TimbreAI T3 是一款超低功耗 AI 推理引擎,专为耳机和智能扬声器等功率受限应用的音频降噪而设计
- 运行神经网络模型,包括 RNN、LSTM、GRU
- 不到 300μW 的超低功耗,延长电池寿命
- 适用于穿戴应用的 3.2 GOPS,如耳机主动降噪
- 微小硅占用,实现更小、更具成本效益的设计
持续关注
订阅我们的新闻
立即注册,即可收到直接发送到收件箱的有用资源。