NXP斥资3.07亿美金收购美国边缘AI芯片公司 Kinara

来源: 芯视点 作者:知芯人 2025-02-11 11:15:30
恩智浦半导体将以 3.07 亿美元现金收购美国边缘 AI 芯片初创公司 Kinara。

恩智浦半导体将以 3.07 亿美元现金收购美国边缘 AI 芯片初创公司 Kinara。

 

Kinara 是 2014 年从斯坦福大学分拆出来的公司,名为Deep Vision,开发了低功耗神经网络处理器,可以在网络末端运行多种类型的 AI 模型,包括多模态生成 AI 模型。

 

Tracxn 称,Kinara 已筹集 5400 万美元,还不到Hailo等竞争对手筹集资金的一半。

 

NXP 是 Kinara 的现有合作伙伴,旨在将其微控制器和连接芯片与 Ara-1 和 Ara-2 独立 NPU 连接起来,用于视觉、语音和手势识别应用,从智能摄像头开始。这两种设备都是可编程的,将推理图映射到专有神经处理单元上,以最大限度地提高边缘 AI 性能。这使得芯片能够运行一系列 AI 模型,从卷积神经网络到基于变压器的生成 AI 模型以及未来的代理 AI。

 

Kinara 正在与印度的 Mirasys合作开发使用第一代 Ara-1 的智能相机等视觉应用,而Ara-2 则在 6W 的功率范围内为具有高达70 亿个参数的生成式 AI 模型提供了 40 TOPS 的更高性能。Kinara 还为设计人员提供了软件开发套件,以优化 AI 模型性能并简化部署,以及模型库和模型优化工具。这些都将集成到 NXP 的 eIQ AI/ML 软件开发环境中。

 

恩智浦执行副总裁兼安全互联边缘总经理 Rafael Sotomayor 表示:“工业市场正在经历一场变革,生成式人工智能等创新技术有助于大幅提高效率、可持续性、安全性和可预测性,并且在许多情况下,还能解锁新的用例和功能。将 Kinara 的人工智能功能添加到我们广泛的智能边缘产品组合中,可以为新型人工智能系统创建一个可扩展的平台。在客户创建变革性人工智能系统时,我们可以共同帮助他们简化复杂性并加快上市时间。”

 

根据预计,该收购将于 2025 年上半年完成,但须遵守包括监管部门批准在内的惯例成交条件。

为何收购NPU? 

NXP认为,智能系统的未来将需要安全、经济高效且节能的边缘 AI 处理。因此,边缘 AI 处理市场正在快速增长。先进的边缘 AI 使关键决策可以在本地独立于云端进行,从而加快响应速度、改善数据隐私并降低成本。

 

Kinara 的创新 NPU 和全面的软件支持可为一系列神经网络(包括传统 AI 和生成 AI)提供节能的 AI 性能,以满足工业和汽车市场快速增长的 AI 需求。此次收购将增强和加强恩智浦提供完整且可扩展的 AI 平台(从 TinyML 到生成 AI)的能力,将独立的 NPU 和强大的 AI 软件引入恩智浦的处理器、连接、安全和高级模拟解决方案产品组合。

 

作为现有合作伙伴,Kinara 和 NXP 可轻松将 Kinara 的 NPU 与 NXP 业界领先的工业和物联网处理器产品组合配对。两家公司将携手打造更紧密的解决方案集成,为各种工业和汽车 AI 推理需求提供可扩展的 AI 平台。

 

Kinara 的独立 NPU(包括 Ara-1 和 Ara-2)在性能和能效方面处于行业领先地位。这使它们成为视觉、语音、手势和各种其他生成式 AI 驱动的多模式实现中新兴 AI 应用的首选解决方案。这两款设备都具有创新架构,可以映射推理图,以便在 Kinara 的可编程专有神经处理单元上高效执行,从而最大限度地提高边缘 AI 性能。随着 AI 算法继续从 CNN 发展到生成式 AI 以及未来的代理式 AI 等新方法,这种可编程性可确保适应性。

 

Ara-1 是第一代独立 NPU,能够在边缘进行高级 AI 推理。第二代 NPU Ara-2 能够实现高达 40 TOPS(每秒万亿次运算),经过优化,可实现生成 AI 的系统级高性能。Ara-1 和 Ara-2 NPU 可以轻松与嵌入式系统集成,以增强其 AI 功能,包括升级现有的现场系统。

 

具体而言, Kinara Ara-2 生成式 AI 处理器是一款专为边缘 AI 应用而设计的先进芯片,注重效率、性能和多功能性。该芯片采用 17 毫米 × 17 毫米的微型 EHS-FCBGA 封装,围绕 8 个第二代神经核心设计。这些核心是完全可编程的计算引擎,具有神经优化的指令集。这些芯片的主要设计考虑因素是功率效率。

 

因此,Kinara 为 Ara-2 添加了一项新功能,支持新的数据类型,包括Integer 4和MSFP16。通过支持这些新数据类型,Ara-2 增加了对 TensorFlow Lite 和 PyTorch 预量化网络的支持,从而扩大了芯片在各种 AI 模型中的适用性,从而实现了更灵活、更高效的数据处理。

 

此外,Ara-2 的内存容量也得到了大幅提升,每块芯片最高可达 16 GB LPDDR4/DDR4X。这对边缘处理具有重大意义。Annavajjhala 表示:“凭借 16 GB LPDDR4 DRAM,单个 Ara-2 可以支持多达 300 亿个 int4 参数,这意味着它可以在边缘运行整个大型语言模型。”

 

在性能方面,该芯片也比其前代产品更具优势。新芯片能够在每张图像约 10 秒内生成稳定的扩散图像,其生成 AI 性能比Ara-1高出 5 到 8 倍。对于视觉模型,Ara-2 能够以 2 毫秒的延迟运行 Resnet50。

 

Kinara 还提供完整的软件开发套件,使客户能够优化 AI 模型性能并简化部署。Kinara 的 AI 软件产品组合包括广泛的模型库和模型优化工具,这些工具将集成到 NXP 的 eIQ AI/ML 软件开发环境中,使客户能够快速轻松地创建端到端 AI 系统。

 

据介绍,Kinara NPU 效率的部分原因在于两个主要的架构壮举:专用的数据流引擎和独特的 AI 编译器。专用数据流引擎支持软件定义的 Tensor 分区和数据流的优化路由。这可以为任何类型的网络架构提供更高效的数据流,从而降低功耗并减少延迟。另一方面,编译器会自动确定任何 AI 图形中最有效的数据和计算流程。这会为给定模型创建最优的执行计划,确保性能和功耗达到最佳。

 

Annavajjhala 在解释该架构时表示,它完全由软件控制。“数据引擎能够以非常灵活的方式获取任何 n 维张量分区并将其路由到计算单元,”他说。“这也意味着编译器成为解决方案中非常重要的一部分,因为将任何神经问题映射到芯片上的方法实际上有数千种。”

 

“我们的编译器会进行优化,评估整个搜索空间,并找到对神经图中每个子计算进行分区并将其映射到计算单元的最佳方法。它会确定数据传输需要什么,并创建整个计划,同时确保最大限度地重复使用数据,并最大限度地减少数据移动的需求。”通过这种方式,Kinara 可以确保其硬件以最高的性能和功率效率运行 AI 模型。

 

NXP频频收购,求变 

今天的交易是在恩智浦斥资 6.25 亿美元收购自动驾驶汽车软件公司 TTTech Auto AG 的一个多月前宣布的,而就在三周前,恩智浦刚刚斥资2.425 亿美元收购了汽车连接系统制造商 Aviva Links Inc.

 

前两次收购显然是为了增强恩智浦最大的汽车芯片业务部门,但今天的交易更多是为了扩大其工业和物联网集团,其中包括边缘计算机芯片。

 

尽管恩智浦在很大程度上错过了帮助英伟达公司成为全球最有价值公司之一的人工智能机会,但在网络边缘,情况可能有所不同。Kinara 等 NPU 被视为在网络边缘运行的智能相机和无人机等设备中人工智能工作负载的关键。恩智浦的业务确实需要提振。

 

本次收购是在NXP公布第四季度财务业绩一周后进行的,该公司四大业务部门(包括汽车、移动、工业和物联网)以及通信、基础设施和其他产品部门的收入均出现下滑。更糟糕的是,恩智浦还预测第一季度收入将在 27.25 亿美元至 29.25 亿美元之间,这一中间值远低于华尔街 29.2 亿美元的目标糟糕的业绩延续了一系列不尽人意的季度,这让人们对恩智浦芯片业务多元化的努力产生了质疑,有消息称,恩智浦可能即将裁员多达 1,800 人。

 

Kinara 将对 NXP 的盈利产生何种影响还有待观察,但这笔交易至少让该公司获得了一些可行的边缘 AI 产品。Kinara 的旗舰处理器包括Ara-1 NPU,旨在处理边缘的高级 AI 推理,以及Ara-2 NPU,这是该芯片的更快版本,最高每秒可执行 40 万亿次运算。Kinara 恰好也是 NXP 的现有合作伙伴,因此一旦收购完成(可能在今年上半年),Kinara 的芯片将与 NXP 的平台快速整合。

 

两家公司表示,他们将于下个月在德国纽伦堡举行的 Embedded World 2025 上展示他们的首款集成产品。

0
收藏
0