Industriële fabricage
Industrieel internet der dingen | Industriële materialen | Onderhoud en reparatie van apparatuur | Industriële programmering |
home  MfgRobots >> Industriële fabricage >  >> Industrial Internet of Things >> Internet of Things-technologie

Spraakbiometrische oplossing richt zich op authenticatie

Vooruitgang in kunstmatige intelligentie maakt nu voldoende nauwkeurigheid in stembiometrie mogelijk, zodat het niet alleen kan worden gebruikt voor identificatie en personalisatie, maar ook voor toepassingen zoals betalingsauthenticatie. Een nieuwe oplossing van Synaptics en ID R&D biedt AI-aangedreven spraakbiometrie en anti-spoofing-algoritmen die kunnen worden uitgevoerd op een Synaptics SoC in het edge-apparaat. In het bijzonder is de software geoptimaliseerd voor de neurale verwerkingseenheid (NPU) in de VS600-serie van Synaptics voor smarthome-apparaten zoals settopboxen (STB's), slimme luidsprekers en beveiligingssystemen.

Synaptics verkoopt zijn AI-compatibele SoC's in smart home-producten die videostreaming, audiostreaming en imaging moeten verwerken. Een typisch gebruiksscenario is bijvoorbeeld een STB met camera's voor videoconferenties.


Spraakbiometrie is nu nauwkeurig genoeg om betalingsverificatie op smarthome-apparaten mogelijk te maken

"Wat gebruikelijk is in de settopbox-applicatie en steeds gebruikelijker wordt naarmate de tijd verstrijkt, is de mogelijkheid om spraak als interface te gebruiken", vertelde Vineet Ganju, vice-president marketing bij Synaptics aan EE Times . "Afstandsbedieningen kunnen spraakgestuurd worden, zodat je ermee kunt praten om door je Netflix-account te navigeren en naar films te zoeken... spraak als interface wordt bijna standaard in deze applicaties."

Wanneer een STB Netflix gebruikt, is het eerste wat gebruikers moeten doen, selecteren wiens profiel ze willen gebruiken. Met stembiometrie zou de STB onmiddellijk weten wie er toekeek, een stap uit het proces.

"Met pay-per-view-inhoud kun je bijvoorbeeld niet alleen met je stem zoeken en bepaalde films vinden die misschien geen deel uitmaken van je abonnement, maar je bent ook bereid $ 5 te betalen om te bekijken," zei Ganju. “Dan willen [operators] zich onmiddellijk kunnen authenticeren en je die film ter plekke laten kopen. Ze zien dat als een enorme vermindering van wrijving, waardoor gebruikers niet alleen inhoud kunnen vinden die voor hen is gepersonaliseerd, maar ook in staat zijn om voor die inhoud te betalen en deze te kunnen bekijken."

Inschrijving op apparaat

ID R&D's stembiometrie AI haalt meer dan 400 functies uit de stem, inclusief combinaties van parameters met betrekking tot frequentie/toonhoogte en andere zaken zoals uitspraak en accenten.

"Het is niet beperkt tot de manier waarop sommige van de eerdere generatie spraakbiometrie waren", vertelde John Amein, senior vice-president verkoop bij ID R&D aan EE Times , eraan toevoegend dat het pas in het afgelopen jaar is dat AI-spraakbiometrie de nauwkeurigheid heeft bereikt die vereist is voor toepassingen zoals betalingsauthenticatie.

Het algoritme leert de stem van de gebruiker te herkennen via een proces dat 'inschrijving' wordt genoemd, waarbij de gebruiker een zin drie keer herhaalt. Elke zin kan worden gebruikt en het werkt op elke taal uit de doos. Inschrijving wordt verwerkt op het edge-apparaat.

Het AI-algoritme van ID R&D kan ingeschreven gebruikers identificeren met een valse acceptatiegraad van minder dan 1 op 10.000, wat Amein vergelijkt met de kans dat iemand uw pincode raadt. Het percentage valse weigering - het percentage waarmee de stem van de ingeschreven gebruiker ten onrechte wordt afgewezen - ligt in de buurt van 5%. En het spoof-acceptatiepercentage (SAR) voor spoofing-aanvallen, zoals opnames van de stem van de gebruiker die op het systeem wordt afgespeeld, is beter dan 7%, wat de standaardlimiet is voor biometrische ontgrendeling van Android-apparaten.

"Terwijl de biometrische matching een valse acceptatiegraad heeft van één op 10.000 en de anti-spoofing beter is dan de 7% die vereist is door de Android-standaard, raken we echt beide dingen die nodig zijn om stembiometrie te accepteren veilig genoeg voor een betalingsautorisatie,” zei Amein.

Anti-spoofing

De anti-spoofingtechnologie van ID R&D is ook afhankelijk van AI.

"Gesproken stem heeft een bandbreedte die tot 3500 Hz gaat, en we samplen met een veel hogere snelheid dan dat," zei Amein. “Dus we horen frequenties die hoger zijn dan de gesproken stem. We luisteren in deze hogere bereiken voor verschillende kenmerken.”

De menselijke stem die wordt gecreëerd door te spreken via ons buisvormige stemkanaal, produceert karakteristieke frequenties die heel anders zijn dan geluiden die worden geproduceerd door de trilling van een plat oppervlak zoals in een luidspreker. Dit is een van de elementen die de anti-spoofing AI gebruikt om een ​​live stem te onderscheiden van een opname.

"We kunnen ook gesynthetiseerde stemmen detecteren, zoals tekst-naar-spraaktoepassingen", zei Amein. “Veel daarvan zijn niet zo geweldig, maar ze worden steeds levensechter. En in dat scenario zijn er nog steeds afwijkingen in het signaal – het is in sommige gevallen te perfect, of er zijn alleen overgangen of faseverschillen die het oor niet kan horen, maar de [AI] wel.”

Neurale verwerkingseenheid

De SoC's uit de VS600-serie van Synaptics hebben een neurale verwerkingseenheid (NPU); De NPU van de VS680 biedt 6,75 TOPS, terwijl de nieuw aangekondigde VS640 1 TOPS biedt en is gericht op "meer mainstream kosten en prestaties en powerpoints", aldus Vineet Ganju van Synaptics. De NPU van beide partijen heeft "meer dan genoeg" rekenkracht om de spraakbiometrie-algoritmen en anti-spoofing van ID R&D gelijktijdig uit te voeren, zei hij. De NPU was in staat om de inferentie van stembiometrie met een factor 10 te versnellen in vergelijking met het gebruik van de CPU van de chip, waarvan het gebruik met een factor 3 werd verminderd.

Synaptics biedt een toolset waarmee bedrijven zoals ID R&D hun technologieën voor de NPU kunnen optimaliseren, en hoewel ID R&D in dit opzicht de eerste partner van Synaptics is, zal het bedrijf in de toekomst met meer partners samenwerken voor toepassingen buiten stembiometrie.

"Op basis van onze gesprekken met spraakherkenningsbedrijven kunnen we een volledig Engelstalige spraakherkenningsengine op het apparaat gebruiken, ruim binnen de 1 TOPS-capaciteit van de NPU", zei Ganju. “Je kunt dus een volledig offline product hebben met betrekking tot spraakherkenning... voor producten waarbij gebruikers het bijvoorbeeld niet meteen met hun wifi verbinden, kan de ingebouwde spraakherkenning hen helpen om een ​​goede out-of-the-box-ervaring te krijgen, zelfs voordat het is verbonden.”

De eerste softwareversie van ID R&D zal later deze maand beschikbaar zijn op de VS600-ontwikkelkits van Synaptics.

>> Dit artikel is oorspronkelijk gepubliceerd op onze zustersite, EE Times.


Internet of Things-technologie

  1. Een IIoT-sensor naar Cloud Gateway-oplossing
  2. Differentiële vergelijkingen
  3. Minterm vs Maxterm-oplossing
  4. pH-meting
  5. Mobiliteit produceren:data, spraak, video en locatie
  6. Vraag en antwoord met een Industry 4.0 Solution Architect
  7. De drie uitdagingen van de ontwikkeling van IoT-oplossingen
  8. Siemens, Bentley lanceert oplossing om fabrieksdigitalisering te versnellen
  9. Azima DLI-oplossing richt zich op programma's voor het bewaken van machineconditie
  10. De stem van de klant op CNC-machine
  11. HMI-PLC-integratie