Rask implementering av kraftig og effektiv AI og ML ved å bruke Renesas RA8M1-mikrokontrollere

Av Kenton Williston

Bidrag fra DigiKeys nordamerikanske redaktører

Utbredelsen av kunstig intelligens (AI), maskinlæring (ML) og andre beregningsintensive arbeidsbelastninger på nettverkets inngangspunkt (edge) for tingenes Internett (IoT – Internet of Things) bidrar til ytterligere belastning på mikrokontrollere (MCU – microcontroller unit). Håndtering av disse nye arbeidsbelastningene øker strømforbruket, men konstruktører fortsetter å bli bedt om å minimere strømforbruket og akselerere tiden det tar å få det endelige produktet ut på markedet.

Konstruktører trenger et databehandlingsalternativ som ivaretar yteevnen til en mikrokontroller, samtidig som det legges til funksjoner med høy ytelse som er skreddersydd spesielt for tilfeller med lavt strømforbruk. Dette alternativet bør også bevare de enkle distribusjonsmodellene som er knyttet til tradisjonelle mikrokontrollere, samtidig som det legges til tilstrekkelige funksjoner for å støtte de avanserte utrustningene som muliggjøres av AI og ML, for eksempel talestyring og prediktivt vedlikehold.

Denne artikkelen tar for seg faktorene som driver etterspørselen etter AI og ML, og forklarer hvorfor det er behov for nye prosessorarkitekturer som kan levere disse funksjonene på en effektiv måte. Deretter introduseres mikrokontrollerfamilien RA8M1 fra Renesas, og det vises hvordan de kan brukes til å oppfylle disse kravene.

Kravene til kunstig intelligens på inngangspunktet (Edge AI) og maskinlæring (ML)

Etterspørselen etter AI og ML øker for IoT-konstruksjoner på inngangspunktet, som spenner fra bygningsautomatisering og industrielle enheter til husholdningsapparater. Selv relativt små integrerte systemer med lavt strømforbruk har nå som oppgave håndtere arbeidsoppgaver som søkeorddeteksjon, talekommandostyring og lyd-/bildebehandling. Målkonstruksjoner inkluderer sensorhubber, dronenavigasjon og -styring, utvidet virkelighet (AR – augmented reality), virtuell virkelighet (VR – virtual reality) og kommunikasjonsutstyr.

For å minimere energiforbruk, responstid før utførelse av instruksjon (overhead) og latenstid, samtidig som personvernet ivaretas, foretrekkes det ofte at data behandles på inngangspunktet istedenfor å sende dem til skyen. Dette er utfordrende for konstruktører, ettersom edge-enheter (inngangspunktenheter) ofte er ressursbegrenset, spesielt når de er batteridrevne.

Forbedrede mikrokontrollere for databehandling på inngangspunktet, også kalt «edge computing»

AI- og ML-arbeidsbelastninger innebærer vanligvis å utføre den samme matematiske handlingen gjentatte ganger på tvers av et stort datasett. Disse arbeidsbelastningene kan akselereres ved hjelp av SIMD-behandling (SIMD – single instruction, multiple data). SIMD utfører flere matematiske handlinger parallelt, noe som gir betydelig høyere gjennomstrømning og bedre energiyteevne sammenlignet med konvensjonell behandling.

Fordi tradisjonelle mikrokontrollere mangler SIMD-funksjonalitet, trenger de hjelp til å utføre AI- og ML-arbeidsoppgaver. En løsning er å bruke en digital signalprosessor (DSP) eller andre SIMD-akseleratorer sammen med mikrokontrolleren. Denne multi-prosessortilnærmingen kompliserer imidlertid systemkonstruksjonen.

Et annet alternativ er å bytte til en mikroprosessor (MPU – microprocessor unit) med høyere ytelse utstyrt med SIMD-funksjoner. Dette kan levere den nødvendige ytelsen i et oppsett med én prosessor, men MPU-er har kompromisser når det gjelder strømforbruk og funksjonssett. For eksempel er ikke alle MPU-er utviklet for å levere den deterministiske databehandlingen med lav latenstid som kreves i MCU-orienterte konstruksjoner.

Muliggjøre AI og ML i mikrokontrollere

Renesas så behovet for en optimalisert pakke med mikrokontrollere for å støtte AI- og ML-arbeidsbelastninger, og introduserte derfor mikrokontrollerne i RA8M1-serien (figur 1). Serien er basert på en Arm® Cortex®-M85-arkitektur med Helium og TrustZone, og de kan kjøre på 480 megahertz (MHz) med et typisk strømforbruk på 225 mikroampere per megahertz (µA/MHz).

Skjema over Renesas RA8M1-mikrokontroller (klikk på for å forstørre)Figur 1: Renesas RA8M1-mikrokontrolleren er basert på en Arm Cortex-M85 og inkluderer Helium-teknologi for å akselerere AI- og ML-behandling. (Bildekilde: Renesas)

RA8M1-mikrokontrolleren er utviklet for effektiv ytelse og lavt strømforbruk, og har funksjoner som determinisme, kort avbruddstid og avansert strømstyringsstøtte. Prosessoren oppnår en ytelse på 6,39 CoreMark per megahertz (CoreMark/MHz).

Helium er en SIMD MVE (M-Profile Vector Extension) som kraftig akselererer signalbehandling og ML. Den legger til 150 skalar- og vektorinstruksjoner og muliggjør behandling av 128-bits registre (figur 2). Den er optimalisert for ressursbegrensede mikrokontrollere med lavere effekt. Helium gjenbruker f.eks. flytetallsprosessorens (FPU – floating-point unit) registre i stedet for å introdusere nye SIMD-registre. Dette bidrar til å senke prosessorens strømforbruk og redusere konstruksjonskompleksiteten.

Skjema over Helium gjenbruker FPU-registerbanken for vektorbehandlingFigur 2: Helium gjenbruker FPU-registerbanken for vektorbehandling. (Bildekilde: Arm)

Som vist i figur 3, inkluderes Arm TrustZone-teknologien i Cortex-M85 fra RA8M1. TrustZone tilbyr maskinvareisolering for kritisk fastvare, ressurser og privatinformasjon. Cortex-M85 legger også til nye sikkerhets- og trygghetsfunksjoner, for eksempel PACBTI (pointer authentication and branch target identification). Disse sikkerhetsfunksjonene er spesielt verdifulle i en AI-kontekst, der en enhet kan samhandle med personopplysninger.

Bilde av Arm Cortex-M85 sin TrustZoneFigur 3: TrustZone i Cortex-M85 tilbyr maskinvareisolering for kritisk fastvare, ressurser og privatinformasjon. (Bildekilde: Arm)

Maskinvarefunksjoner å se etter i en AI-kompatibel mikrokontroller

En mikrokontroller bør kombinere effektiv ytelse med et robust funksjonssett for å støtte AI-konstruksjoner. RA8M1 er godt utstyrt for motorstyring, programmerbar logisk styring (PLS), måling og andre industrielle og IoT-relaterte konstruksjoner.

For eksempel krever AI-algoritmer mye minne. RA8M1-systemminnet inkluderer opptil 2 megabyte (MB) flash og 1 MB SRAM. SRAM inkluderer 128 kilobyte (kB) tett koplet minne (TCM – tightly coupled memory), som muliggjør rask minnetilgang for beregninger med høy ytelse.

For å sikre pålitelig drift, konfigureres 384 kB av brukerens SRAM og hele 128 kB med TCM som ECC-minne (ECC – error correction code). De 32 kB med instruksjoner og databufferne er også ECC-beskyttede.

RA8M1 har flere sikkerhetsfunksjoner i tillegg til de som er inkludert i Arm-kjernen. Disse inkluderer RSIP-motoren (RSIP – Reprogrammable Secure Intellectual Property) for sikker databehandling, uforanderlig lagring for kritisk databeskyttelse og beskyttelsesmekanismer som hindrer sabotasje.

For kommunikasjonsgrensesnitt er mikrokontrollere utstyrt med Ethernet for nettverkskonnektivitet, CAN FD (Controller Area Network Flexible Data Rate) for kjøretøy og industrielle konstruksjoner og USB med høy hastighet/full hastighet (High-Speed/Full-Speed) for generell konnektivitet. Den har også et kameragrensesnitt og et oktalt serielt periferigrensesnitt (SPI – Serial Peripheral Interface) med dekryptering på farten for eksternt minne.

Analoge grensesnitt inkluderer 12-bits analog-til-digital-omformere (ADC-er) og digital-til-analog-omformere (DAC-er), høyhastighets analoge komparatorer og tre avsøkings- og holdekretser (sample-and-hold circuits). For seriell kommunikasjon støtter RA8M1 flere protokoller, inkludert et serielt kommunikasjonsgrensesnitt (SCI – Serial Communication Interface) med SPI, en universell asynkron mottaker/sender (UART – Universal Asynchronous Receiver/Transmitter) og moduser med interintegrert krets (I²C – Inter-Integrated Circuit). Mikrokontrolleren tilbyr også den forbedrede interintegrerte kretsen (I3C) for forbedret dataoverføringshastighet og virkningsgrad.

Utviklere som trenger full tilgang til disse inngangs-/utgangsfunksjonene (I/O-funksjonene), kan bruke en kapsling med kulegitteroppstilling (BGA-kapsling), for eksempel den 224-pinners R7FA8M1AHECBD#UC0. De som ønsker en mer strømlinjeformet kretskortkonstruksjon og monteringsprosess, kan vurdere å bruke et lavprofils LQFP-alternativ (LQFP – low-profile quad flat package), for eksempel den 144-pinners R7FA8M1AHECFB#AA0.

Utviklingsmiljøer for AI-konstruksjoner

Konstruktører som er interessert i å eksperimentere med RA8M1-serien, kan begynne med EK-RA8M1 R7FA8M-evalueringskortet (figur 4). Dette kortet inkluderer et RJ45 RMII Ethernet-grensesnitt, et USB verts- og enhetsgrensesnitt med høy hastighet og en tre-pinners CAN FD-pinnelist. Den har 64 MB oktal SPI-flash som minne.

Bilde av Renesas sitt EK-RA8M1-evalueringskort (klikk for å forstørre)Figur 4: EK-RA8M1-evalueringskortet har robust I/O-støtte for å trene opp RA8M1-mikrokontrolleren. (Bildekilde: Renesas)

RA8M1 støttes av Renesas Flexible Software Package (FSP), et omfattende rammeverk som er utviklet for å gi en brukervennlig, skalerbar og høykvalitets programvarebase for integrerte systemkonstruksjoner.

Pakken tilbyr utviklingsverktøy, inkludert det integrerte utviklingsmiljøet (IDE – integrated development environment) e² studio, som er basert på det populære Eclipse IDE-et. Den inneholder også to fremtredende, avgiftsfrie, sanntidsoperativsystemer: Azure RTOS og FreeRTOS.

Pakken inneholder lette, produksjonsklare drivere som støtter vanlige bruksmønster i integrerte systemer. Kombinert med evalueringskortet, gir disse driverne utviklere en rask måte å eksperimentere med RA8M1 I/O på.

Konklusjon

RA8M1 gir utviklere et nytt alternativ for å implementere AI- og ML-arbeidsbelastninger i Edge IoT-konstruksjoner som sparer strøm, forbedrer ytelsen, reduserer kompleksitet og forkorter tiden det tar å få det endelige produktet ut på markedet.

DigiKey logo

Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.

Om skribenten

Image of Kenton Williston

Kenton Williston

Kenton Williston tok sin bachelorgrad i elektroteknikk i 2000 og startet sin karriere som benchmarkanalytiker for prosessorer. Siden da har han jobbet som redaktør i EE Times-gruppen og bidratt til å lansere og lede flere publikasjoner og konferanser innen elektronikkbransjen.

Om denne utgiveren

DigiKeys nordamerikanske redaktører