汽车
AI 走进主驾驶座
无论是部署在车内,用于检测驾驶员注意力分散情况的应用,还是部署在高级辅助驾驶系统 (ADAS) 堆栈中,用于物体识别和点云处理,AI 技术已成为未来更安全、更智能汽车的重要支柱。
更快的节能处理
有时,在旧金山、奥斯汀或凤凰城的街道上看到无人驾驶出租车还是有点惊讶,但这并不罕见。但大多数专家都认为,我们距离自动驾驶汽车替代人类驾驶员还有数年的时间。将行业提升到 L3 级自动驾驶的许多技术,无法在性能、内存使用、互连、芯片面积和功耗等所有必要维度上扩展到 L5,而 L5 不需要人工干预。而可扩展性问题在车载人工智能 (AI) 处理领域也尤为凸显。汽车变得越来越以数据为中心,AI 技术正在引领着数据处理趋势。神经处理单元 (NPU) 提供了一种专为汽车应用定制的可扩展、节能 AI 处理解决方案。
扩展性能——我需要多大的 TOPS?
完全自动驾驶需要的性能可以说已经超出了当下的能力。但业界对需要增加多少处理能力还没有达成共识。在技术讨论中,需要考虑的是自动驾驶汽车可能需要来自 6 到 8 个 8K 摄像头的图像数据,以及来自激光雷达、雷达、超声波和其他传感器的数据。ADAS 不断推高对 TOPS(每秒万亿次操作)的需求。目前仍不清楚要额外使用多大的处理能力。几年前,人们估计 L3 需要 24 TOPS——如今的汽车制造商已经超越了该数字,新算力估计达到 150 至 200 TOPS。考虑 L4 和 L5 呈指数级增长的处理需求,对当今主流架构的粗略研究表明,汽车行业需要新的 AI 处理范式。车载芯片的主动冷却系统既没有理想效果,也不具有商业可行性。此外,在采用多个大型领先节点半导体产品的情况下,其高昂的成本不适用于大多数汽车制造商的经济预算。
通过传感器融合感知世界
自动驾驶汽车使用传感器融合感知世界。自动驾驶汽车对环境状况进行集中解读,吸收来自雷达、激光雷达、摄像头和超声波传感器的数据,从更宏观的角度,为自动驾驶汽车提供安全行车所需的信息。传感器融合处理需要高效并行多个独特的神经网络 (NN),此类高要求在其他市场非常罕见。例如,小型消费类设备可能运行一个分辨率较小的神经网络,比如 ResNet50 (224 x 224)。相反,汽车 NPU 必须同时运行多个高分辨率网络,比如 ResNext (1920 x 1080 x 3)、Swin Transformer (2880 x 1860) 和 DETR (1824 x 940)。此外,许多 OEM 厂商开发了定制和专有 NN。
为汽车打造的 AI 计算
汽车应用需要新的处理能力,包括支持各种不同的神经网络,可同时运行多个网络,具有极致的功耗效率,并且处理器利用率高,从而避免芯片面积浪费。
艾伯德满足了一切要求。我们的 Origin™ E6 和 E8 系列产品可同时运行多个网络,单核心性能高达 128 TOPS(多核可扩展到 PetaOps)。此外,凭借行业领先的 18 TOPS/W 功耗,艾伯德的产品在满足汽车驾驶和 ADAS 需求的同时无需主动冷却系统。艾伯德支持标准化和定制型的 NN,包括未来出现的未知 NN,从而使其成为汽车芯片设计的理想 IP 合作伙伴
适合汽车的理想架构
Origin E8 神经引擎采用艾伯德基于数据包的独特架构,其效率远超基于层的通用架构。这款架构可以跨层并行执行任务,优化资源利用率,带来确定的性能。此外还不需要针对特定硬件进行优化,客户无需更改就可以运行其训练好的神经网络,而不牺牲模型准确度。这种创新的方法大大提升了性能,同时降低了功耗、面积和延迟。
跨应用扩展的 NPU
从车内应用到 L3、L4 和 L5 级 ADAS 系统,汽车 AI 性能需求从几 TOPS 增加到几百 TOPS。Origin IP 单核性能可以从 GOPS 扩展到 128 TOPS。这款架构没有低性能平铺式 AI 加速器引擎面临的内存共享、安全和面积损耗问题。
选择您需要的网络
新的 AI 网络正迅速浮现出来。不论是传统的 CNN 和 RNN、变换器、LLM、网格采样、稳定扩散,还是全新或专有技术,艾伯德的灵活架构都能通过高度优化的功耗和成本敏感型 NPU 解决方案应对当下和未来的网络需求。
针对模型准确度进行优化
艾伯德基于数据包的架构不需要针对特定硬件进行优化,客户无需更改就可以运行其训练好的神经网络,而不牺牲模型准确度。Origin IP 和软件栈支持训练好的原始标准、定制和专有神经网络,为客户节省了通常为优化硬件或软件而需要的时间和精力