Slimmere verwerking van spraakgegevens zorgt voor een langere batterijduur
Apparaten die altijd luisteren hebben het oneindig veel gemakkelijker gemaakt om muziek af te spelen, de smart-tv aan te zetten, de thermostaat lager te zetten en ons zelfs te waarschuwen wanneer iemand inbreekt in huis. Maar ze laten ons ze maar al te vaak op netstroom aansluiten of batterijen vervangen.
Hoewel het soms voelt alsof stemassistenten al tientallen jaren in ons leven zijn, lanceerde Amazon pas eind 2014 de eerste slimme luidspreker, Amazon Echo. Vijf jaar later hebben we nu honderden miljoenen digitale spraakassistenten geïnstalleerd in slimme luidsprekers, slimme thuissystemen, wearables en andere slimme apparaten die altijd luisteren naar een wake-word. Uit het laatste onderzoek voorspelt SAR Insight &Consulting dat tegen 2023 het aantal geïnstalleerde spraakgestuurde apparaten zal groeien tot bijna 1 miljard.
De sensoren die voor het eerst altijd luisteren en stemmen eerst mogelijk maakten - ultraminiatuurmicro-elektromechanische systemen (MEMS) microfoons ter grootte van een potloodpunt - leggen omgevingsgeluidsgegevens vast. In eerste instantie leek het een prima oplossing om die gegevens in de cloud te verwerken en het geluid te analyseren op wake-woorden en commando's. Maar volgens International Data Corp. 1 genereert de exponentiële groei van spraakassistenten en andere always-on IoT-apparaten zoveel data:41,6 miljard IoT-apparaten genereren in 2025 79,4 zettabyte aan data. - dat we de collectieve bandbreedte overbelasten en kosten- en stroominefficiënties creëren als een onbedoeld gevolg. Dit drijft de halfgeleiderindustrie ertoe om nieuwe manieren te vinden om een deel van die krachtige cloudcomputing in het apparaat te brengen - een mogelijkheid die edge-verwerking wordt genoemd.
Uitdagingen aan de rand
Het succes van edge computing is sterk afhankelijk van de snelle verspreiding van low-power digitale signaalprocessors en microcontrollers, waarvan sommige een ingebed neuraal netwerk bevatten, dat wil zeggen een kleine machine learning (TinyML)-chip. Deze veelal digitale verwerkingschips kunnen de complexe analyse van gegevens aan, zoals beslissen of een wake-word is uitgesproken, direct op het apparaat. Maar hoewel deze chips nu zo slim zijn als een brein, vertrouwen ze nog steeds op de originele systeemarchitectuur die werd gebruikt in het eerste altijd-aan-detectieapparaat, een die de onmiddellijke conversie vereist van al het geluid - dat van nature analoog is - naar een digitaal signaal. Dat is zelfs waar als het geluid, zoals een blaffende hond of een huilende baby, onmogelijk een wake-woord kan bevatten. Deze altijd-aan-luisterende benadering, die energie en data verspilt, zet OEM's op ramkoers met ontevredenheid van de consument.
Consumenten verwachten nog steeds dezelfde of betere prestaties van steeds kleinere, altijd luisterende slimme apparaten die in een zak of zelfs in een oor passen, maar zonder de levensduur van de batterij in te leveren. Dat plaatst OEM's in een moeilijke positie, want als ze bij de oude architectuur blijven, zullen ze 80% tot 90% van de batterijduur blijven verspillen aan het verwerken van zinloze gegevens. Ze zullen gedwongen worden om de consument te laten kiezen voor het minste van twee kwaden:een niet-draagbare spraakassistent die op het stopcontact moet worden aangesloten of een draagbare spraakassistent die overal mee naartoe kan, maar wordt gehinderd door een korte batterijduur.
Omdat het verplaatsen van gegevens door een systeem energie kost, is de meest efficiënte manier om energie te besparen, de hoeveelheid gegevens zo snel mogelijk terug te brengen tot wat belangrijk is. Als we de altijd-aan-luisterende krachtuitdaging echt willen oplossen, hebben we een nieuw paradigma nodig dat beter aansluit bij het vermogen van de hersenen om op een bepaald moment de enorme hoeveelheden gegevens die afkomstig zijn van het menselijke sensorische systeem efficiënt te verwerken. Besteed vooraf een klein beetje stroom om te bepalen wat relevant is, en bespaar de meeste middelen om alleen de belangrijkste gegevens te verwerken.
Geluid is van nature analoog
Om de levensduur van de batterij in apparaten die altijd luisteren te verbeteren, moet een technologie worden omarmd die veel van de hedendaagse ingenieurs zowel ouderwets als intimiderend vinden:analoog . Werken met ruwe, ongestructureerde analoge signalen van het echte woord - namelijk aanraking, zicht, gehoor en trillingen - is moeilijk. Sinds de introductie van de eerste digitale geïntegreerde schakeling was het veel eenvoudiger om producten te maken die sensorsignalen verwerken, met bekende enen of nullen, dan om de analoge gegevens die worden gedetecteerd direct te verwerken. (Daarom zetten always-on-apparaten analoge invoer onmiddellijk om in digitale signalen, voordat ze bijna iets anders doen.)
Hoewel digitaal de verwerkingsuitdagingen van de afgelopen 50 jaar effectief heeft opgelost, heeft het misschien eindelijk een muur geraakt in de wetten van de fysica. De vertraging in het schalen van digitale apparaten heeft ertoe geleid dat technologen creatief zijn geworden met de chips in het apparaat. In dit geval heeft die creativiteit twee fundamentele veranderingen ondergaan:gebruik digitaal strategischer, zodat digitale chips alleen zware verwerkingen uitvoeren als dat nodig is; en gebruik het inherente lage vermogen van analoge circuits, gecombineerd met machine learning, om een eerste analyseronde uit te voeren die bepaalt of spraak aanwezig is terwijl de geluidsgegevens zich nog in hun natuurlijke, analoge staat bevinden. Dat houdt de digitale verwerkingschips in de energiezuinige slaapstand totdat ze daadwerkelijk nodig zijn om naar een trefwoord te 'luisteren'.
De weg naar meer energie-efficiëntie in altijd-aan-apparaten ligt niet in het feit dat elke chip "denkt als een brein", maar in het opnieuw bedenken van een systeemarchitectuur die meer lijkt op het menselijke sensorische systeem, waarbij geluid geleidelijk in lagen wordt geanalyseerd, zodat de meeste energie wordt gefocust over wat het belangrijkste is.
Bio-geïnspireerde edge-verwerking (onder) richt de digitale verwerkingskracht op de meest relevante sensorische gegevens. (Afbeelding:Aspinity)
Iedereen wint
De jacht op een langere levensduur van de batterij zal systeemontwerpers aanmoedigen om een nieuw architectonisch paradigma te omarmen waarin minder gegevensverwerking een langere levensduur van de batterij betekent. Een analoge ML-chip bevindt zich aan de rand en kan fungeren als een slimme verkeersmanager die digitale verwerkingschips laat slapen tenzij ze nodig zijn. Deze bio-geïnspireerde always-on edge-verwerkingsbenadering stelt de analoge en digitale processors in staat om de taken uit te voeren waarin ze het meest efficiënt zijn, waardoor de consument de ultieme winnaar wordt. Wie wil er tenslotte niet een spraakgestuurde tv-afstandsbediening die een jaar lang op één set batterijen werkt?
Referentie
1 International Data Corp. Wereldwijd Global DataSphere IoT-apparaat en gegevensprognose, 2019-2023. juni 2019
>> Dit artikel is oorspronkelijk gepubliceerd op onze zustersite, EE Times Europe.
Sensor
- Mobiel IoT onderzoeken:kosten, batterij en data
- Onderhoud in de digitale wereld
- Digitale verzekeringen:5 digitale trends die de verzekeringssector vormgeven
- Maatregelen om een veilige digitale ervaring te garanderen
- Voor supply chain-financiering is digitaal contant geld gewoon beter
- Digitale productieteams machtigen met kennis
- Proces + Master Data &Digitale Transformatie, Deel II
- Digitale tweelingen:wat bedoel je daarmee?
- Een vliegende start met digitale transformatie in de productie
- Digitale transformatie bij Norbord verbetert productiviteit
- Hoe kleine winkels digitaal kunnen worden - economisch!