你的位置:首頁 > 互連技術 > 正文

使用瑞薩電子 RA8M1 MCU 快速部署強大而高效的機器學習

發(fā)布時間:2024-04-09 責任編輯:lina

【導讀】人工智能 (AI)、機器學習 (ML) 和物聯(lián)網(wǎng) (IoT) 網(wǎng)絡邊緣的其他計算密集型工作負載的興起給微控制器 (MCU) 帶來了額外的處理負載。 即使設計人員被要求最大限度地降低功耗并加快上市時間,處理這些新的工作負載也會增加功耗。


人工智能 (AI)、機器學習 (ML) 和物聯(lián)網(wǎng) (IoT) 網(wǎng)絡邊緣的其他計算密集型工作負載的興起給微控制器 (MCU) 帶來了額外的處理負載。 即使設計人員被要求最大限度地降低功耗并加快上市時間,處理這些新的工作負載也會增加功耗。

設計人員需要一種計算選項,既能保持 MCU 的效率,又能添加專門針對低功耗用例定制的高性能功能。 此選項還應保留與傳統(tǒng) MCU 相關的簡單部署模型,同時添加足夠的功能來支持 AI 和 ML 啟用的復雜應用程序,例如語音控制和預測性維護。

本文討論了推動人工智能和機器學習需求的因素,并解釋了為什么需要新的處理器架構來有效地提供這些功能。 然后介紹瑞薩電子的 RA8M1 MCU 系列,并展示如何使用它來滿足這些要求。

邊緣AI和ML的要求

從樓宇自動化、工業(yè)設備到家用電器,邊緣物聯(lián)網(wǎng)應用對人工智能和機器學習的需求不斷增加。 即使是相對較小的低功耗嵌入式系統(tǒng)現(xiàn)在也承擔著關鍵字識別、語音命令控制和音頻/圖像處理等工作負載。 目標應用包括傳感器集線器、無人機導航和控制、增強現(xiàn)實 (AR)、虛擬現(xiàn)實 (VR) 和通信設備。

為了最大限度地減少能源使用、開銷和延遲,同時確保隱私,通常首選在邊緣處理數(shù)據(jù),而不是將其發(fā)送到云端。 這對設計人員來說是一個挑戰(zhàn),因為邊緣設備通常資源有限,特別是在電池供電時。

用于邊緣計算的增強型 MCU

AI 和 ML 工作負載通常涉及在大型數(shù)據(jù)集中重復執(zhí)行相同的數(shù)學運算。 這些工作負載可以使用單指令、多數(shù)據(jù) (SIMD) 處理進行加速。 SIMD 并行執(zhí)行多項數(shù)學運算,與傳統(tǒng)處理相比,可提供更高的吞吐量和更高的能效。

由于傳統(tǒng) MCU 缺乏 SIMD 功能,因此它們需要幫助執(zhí)行 AI 和 ML 工作負載。 一種解決方案是與 MCU 一起使用數(shù)字信號處理器 (DSP) 或其他 SIMD 加速器。 然而,這種多處理器方法使系統(tǒng)設計變得復雜。

另一種選擇是改用配備 SIMD 功能的更高性能微處理器單元 (MPU)。 這可以在單處理器設置中提供必要的性能,但 MPU 在功耗和功能集方面需要權衡。 例如,并非所有 MPU 都旨在提供面向 MCU 的應用程序所需的確定性、低延遲計算。

在 MCU 中啟用 AI 和 ML

瑞薩電子認識到需要一套優(yōu)化的 MCU 來支持 AI 和 ML 工作負載,因此推出了 RA8M1 MCU 系列(圖 1)。 該系列基于配備 Helium 和 TrustZone 的 Arm Cortex-M85 架構,運行頻率為 480 兆赫 (MHz),典型功耗為 225μA/MHz。


使用瑞薩電子 RA8M1 MCU 快速部署強大而高效的機器學習圖 1:Renesas RA8M1 MCU 基于 Arm Cortex-M85,并采用 Helium 技術來加速 AI 和 ML 處理。 (圖片來源:瑞薩)


RA8M1 MCU 專為高性能和低功耗而設計,具有確定性、短中斷時間和最先進的電源管理支持等功能。 該處理器的性能效率達到 6.39 CoreMark/MHz。

Helium 是一種 SIMD M-Profile 矢量擴展 (MVE),可顯著加速信號處理和 ML。 它添加了 150 個標量和向量指令,并支持 128 位寄存器的處理(圖 2)。 它針對資源受限、低功耗的微控制器進行了優(yōu)化。 例如,Helium 重用浮點單元 (FPU) 寄存器,而不是引入新的 SIMD 寄存器。 這有助于降低處理器的功耗并降低設計復雜性。


使用瑞薩電子 RA8M1 MCU 快速部署強大而高效的機器學習圖 2:Helium 重用 FPU 寄存器組進行矢量處理。 (圖片來源:Arm)


如圖 3 所示,RA8M1 的 Cortex-M85 包含 Arm 的 TrustZone 技術。 TrustZone 為關鍵固件、資產和私人信息提供硬件隔離。 Cortex-M85 還添加了新的安全保障功能,例如指針身份驗證和分支目標識別 (PACBTI) 擴展。 這些安全功能在設備可能與個人數(shù)據(jù)交互的人工智能環(huán)境中特別有價值。


使用瑞薩電子 RA8M1 MCU 快速部署強大而高效的機器學習圖 3:Cortex-M85 的 TrustZone 為關鍵固件、資產和私人信息提供硬件隔離。 (圖片來源:Arm)


支持 AI 的 MCU 需要具備的硬件功能

一個MCU 應將高效性能與強大的功能集結合起來,以支持人工智能應用。 RA8M1 配備齊全,適用于電機控制、可編程邏輯控制 (PLC)、計量以及其他工業(yè)和物聯(lián)網(wǎng)應用。

例如,人工智能算法需要大量內存。 RA8M1 系統(tǒng)存儲器包括高達 2 兆字節(jié) (Mbytes) 的閃存和 1 MB 的 SRAM。其中SRAM 包括 128 KB 的緊耦合存儲器 (TCM),可實現(xiàn)快速存儲器訪問以實現(xiàn)高性能計算。

為了確??煽窟\行,384 KB 的用戶 SRAM 和整個 128 KB TCM 被配置為糾錯碼 (ECC) 存儲器。 32 KB 指令和數(shù)據(jù)高速緩存也受 ECC 保護。

除了 Arm 內核中包含的功能之外,RA8M1 還包含多種安全功能。 其中包括用于安全數(shù)據(jù)處理的可重編程安全知識產權 (RSIP) 加密引擎、用于關鍵數(shù)據(jù)保護的不可變存儲以及篡改保護機制。

對于通信接口,MCU 配備了用于網(wǎng)絡連接的以太網(wǎng)、用于汽車和工業(yè)應用的控制器局域網(wǎng)靈活數(shù)據(jù)速率 (CAN FD) 以及用于一般連接的 USB 高速/全速。 它還集成了一個攝像頭接口和一個八進制串行外設接口 (SPI),可對外部存儲器進行動態(tài)解密。

模擬接口包括 12 位模數(shù)轉換器 (ADC) 和數(shù)模轉換器 (DAC)、高速模擬比較器以及三個采樣保持電路。 對于串行通信,RA8M1 支持多種協(xié)議,包括帶 SPI 的串行通信接口 (SCI)、通用異步接收器/發(fā)送器 (UART) 和I2C。 該 MCU 還提供改進的I3C,以提高數(shù)據(jù)傳輸速率和效率。

需要完全訪問這些輸入/輸出 (I/O) 功能的開發(fā)人員,可以使用球柵陣列 (BGA) 封裝,例如 224 引腳 R7FA8M1AHECBD#UC0。 尋求更簡化的印刷電路板 (PC 板) 設計和組裝流程的用戶可以考慮使用薄型四方扁平封裝 (LQFP) 選項,例如 144 引腳 R7FA8M1AHECFB#AA0。

AI應用程序的開發(fā)環(huán)境

有興趣嘗試 RA8M1 系列的設計人員可以從 EK-RA8M1 R7FA8M 評估板開始(圖 4)。 該板包括一個 RJ45 RMII 以太網(wǎng)接口、一個 USB 高速主機和設備接口以及一個三引腳 CAN FD 接頭。 對于存儲器,它具有 64 MB 八進制 SPI 閃存。


使用瑞薩電子 RA8M1 MCU 快速部署強大而高效的機器學習圖 4:EK-RA8M1 評估板具有強大的 I/O 支持來測試 RA8M1 MCU。 (圖片來源:瑞薩)


RA8M1 由瑞薩FSP支持,這是一個綜合框架,旨在為嵌入式系統(tǒng)設計提供用戶友好、可擴展且高質量的軟件基礎。

該軟件包提供了開發(fā)工具,包括基于流行的 Eclipse IDE 的 e2 studio 集成開發(fā)環(huán)境 (IDE)。 它還包含兩個著名的免版稅實時操作系統(tǒng):Azure RTOS 和 FreeRTOS。

該軟件包包括輕量級、生產就緒的驅動程序,支持嵌入式系統(tǒng)中的常見用例。 這些驅動程序與評估板相結合,為開發(fā)人員提供了快速試驗 RA8M1 I/O 的途徑。

結論

RA8M1 為開發(fā)人員提供了在邊緣物聯(lián)網(wǎng)應用中實施 AI 和 ML 工作負載的新選擇,從而節(jié)省功耗、增強性能、降低復雜性并縮短上市時間。


免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯(lián)系小編進行處理。


推薦閱讀:

實現(xiàn)不間斷能源的智能備用電池第一部分:電氣和機械設計

在智能樓宇設計中提升效率和可持續(xù)性的關鍵技術

電源管理芯片怎么測好壞電源芯片內部結構

濕度傳感器的類型與設計技巧

如何設計與現(xiàn)場總線無關的智能工廠傳感器



特別推薦
技術文章更多>>
技術白皮書下載更多>>
熱門搜索
?

關閉

?

關閉