Industriële fabricage
Industrieel internet der dingen | Industriële materialen | Onderhoud en reparatie van apparatuur | Industriële programmering |
home  MfgRobots >> Industriële fabricage >  >> Industrial Internet of Things >> Internet of Things-technologie

De democratisering van de spraakinterface

Geschiedenisboeken beschouwen spraakbesturing wellicht als de belangrijkste vooruitgang die is geboekt in de Human Machine Interface. Niet meer typen, niet meer wijzen, we zeggen gewoon wat we willen. De eerste vooruitgang op dit gebied strompelde voort tot de komst van slimme luidsprekers, toen we begonnen te beseffen wat mogelijk zou kunnen zijn. Nu is de race begonnen met verbeteringen in herkenning, functies en toepassingen in telefoons, headsets, hearables en het slimme huis. De meest bekende oplossingen zijn tegenwoordig afhankelijk van platforms en services die worden beheerd door een klein aantal providers, maar dat is aan het veranderen. Spraakactivering kan overal worden ingebed, met maatwerk, verbeterde ruisimmuniteit, lager stroomverbruik, groter bereik en toch net zo effectief als de grote platforms voor spraakherkenning.


(Bron:CEVA/Shutterstock)

De consumentenaudiomarkt, waar deze mogelijkheid een belangrijke rol speelt, heeft een interessante geschiedenis. FutureSource laat zien dat van 2008 tot 2012 het dollarvolume daalde, omdat audio-ervaringen zich voornamelijk op smartphones consolideerden. Van 2012 tot 2014 bleef de markt vrijwel vlak. Vervolgens groeide het van 2015 tot 2018 opnieuw met een CAGR van 15%, voornamelijk gedreven door spraakactivering. Vooruitkijkend verwacht Yole Développement een CAGR van minimaal 30% tot 2023, voornamelijk gedreven door spraakherkenning . Het grootste deel van deze groei zal in smartphones blijven zitten, gevolgd door headsets en hearables, persoonlijke assistenten en smarthome-functies (tv's, apparaten, enz.). In hetzelfde rapport wordt geconcludeerd dat we nu een tweede fase ingaan op het gebied van slimme audio, waarin spraakbesturing veel doordringender zal worden naarmate consumenten meer vertrouwd raken met deze methode van controle.

Waar ze ook worden ingezet, het doel is om de differentiatie te vergroten. In een smartphone of een ander apparaat dat op batterijen werkt, is een duidelijk voordeel de ondersteuning van always-on-luisteren; u hoeft niet op een knop te drukken voordat u een opdracht geeft. Dit vereist trigger-woorddetectie met ultralaag vermogen, wat, zoals we weten, hardware betekent met nauw op elkaar afgestemde software om het stand-byvermogen te minimaliseren. Natuurlijk wilt u triggerwoorden of -frases voor uw merk personaliseren, en in meerdere talen, om een ​​sterke penetratie te krijgen in uw regio en misschien ook op de internationale markt. U kunt nog steeds volgende opdrachten doorgeven aan een van de belangrijkste aanbieders van spraakherkenning om het verzoek uit te pakken. Of misschien niet. Als uw apparaat alleen ondersteuning nodig heeft voor een beperkt vocabulaire, heeft u mogelijk geen hulp van een derde partij nodig, als uw spraakherkenningsengine daartoe kan worden uitgebreid.

Een andere cruciale behoefte is herkenning en wellicht authenticatie in een lawaaierige omgeving. Spraakherkenning biedt andere uitdagingen dan bij objectherkenning. In een woonkamer of een auto kunnen er bijvoorbeeld meerdere geluidsbronnen zijn:pratende mensen, tv en onafhankelijke muziek-/radiobronnen, binnen- en buitengeluiden en echo's van al deze geluidsbronnen van oppervlakken in een kamer of het interieur van een auto. Het isoleren van de bron van een opdracht, het annuleren van echo's en het verminderen van achtergrondgeluid vereist geavanceerde technologie, afhankelijk van meerdere microfoons, beamforming en echo-onderdrukking, samen met ruisonderdrukking.

Dat zijn de behoeften en natuurlijk staan ​​beschikbare oplossingen zoals die van CEVA klaar om aan die behoeften te voldoen. Oplossingen zoals het onlangs geïntroduceerde CEVA WhisPro™-product voor fraseherkenning maken gebruik van op neurale netwerken gebaseerde software die op CEVA DSP-platforms draait. WhisPro ondersteunt al "Alexa" en "OK Google" als spraaktriggers en het kan tijdens de training worden aangepast om door de klant gevraagde triggers te ondersteunen. Het ondersteunt meerdere talen en kan meerdere stemtriggers aan. Training wordt uitgevoerd met meerdere ruisachtergronden, dus herkenning heeft ingebouwde ruisimmuniteit, levert>95% herkenning en valse acceptatie van minder dan 1 per uur, zonder dat cloudverificatie nodig is.

Door toevoeging van een gespecialiseerde voice-pickup-oplossing, CEVA ClearVox™, kunnen ontwikkelaars multi-microfoonondersteuning en beamforming bereiken voor een verbeterde far-field voice-pickup, samen met echo-onderdrukking en verdere ruisonderdrukking. Door WhisPro samen met ClearVox te koppelen, krijg je competitieve triggerherkenning op een grotere afstand (tot 7 meter), vooral in lawaaierige omgevingen.


Youval Nachum fungeert als CEVA's Senior Product Marketing Manager voor de audio- en spraakproductlijn. Youval heeft meer dan 20 jaar multidisciplinaire ervaring in marketing, systeemarchitectuur, ASIC en softwaredomeinen bij toonaangevende technologiebedrijven. Hij heeft een passie voor het anticiperen op langetermijntrends en het leiden van technische programma's tot hun succesvolle voltooiing. Zeer bedreven in het combineren van marktvereisten, productdefinities, industriestandaarden en ontwerpinnovaties tot baanbrekende producten. Youval heeft een B.Sc. en M.Sc. in elektrotechniek van het Technion – Israel Institute of Technology.


Internet of Things-technologie

  1. De opdrachtregelinterface
  2. C#-interface
  3. Java-interface
  4. Wat moet ik doen met de gegevens?!
  5. Interface versus abstracte klasse in Java:wat is het verschil?
  6. Speak Up:Voice Tech verhoogt productinspecties
  7. C# - Interfaces
  8. Hoe kan spraakherkenningstechnologie de productieprocessen verbeteren?
  9. Augmented Reality wordt de gebruikersinterface voor IoT
  10. Fluent.ai x BSH:spraakautomatisering van de assemblagelijn
  11. De verenigde stem van de persluchtindustrie