Convergerende technologieën maken Elasticsearch op miljarden schaal mogelijk

Overal om ons heen vindt digitale convergentie plaats, omdat technologieën die oorspronkelijk niets met elkaar te maken hadden, op opwindende nieuwe manieren samenkomen. De iPhone is een perfect voorbeeld van een combinatie van een telefoon met een computer, een camera en sensoren om een uitstekende ervaring te bieden.

Convergentie is niet nieuw in de embedded space. Ingebedde apparaten zijn traditioneel onderworpen aan strengere beperkingen van geheugen en verwerking en hebben convergentie omarmd als een manier om het beste uit vele technologische gebieden te halen. Dus, aangezien we nog maar aan het begin staan van de convergentie van technologieën van verschillende schalen, met schijnbaar ongelijksoortige technologieën die beloven samen te werken om bestaande industrieën te ontwrichten en dwingende nieuwe kansen in te luiden, zal ook de embedded ruimte profiteren. Een nieuwe convergentie is het gebruik van k-NN dichtstbijzijnde buur (k-NN) met in-memory acceleratieverwerking om bijna realtime reacties te bieden voor Elasticsearch-operaties op miljarden schaal.

Elasticsearch is een zoekmachine die JSON-verzoeken voor het doorzoeken van documenten aanneemt en JSON-gegevens als resultaten levert. Het Elasticsearch-gegevensformaat is een document met gestructureerde gegevens die zijn gecodeerd in JSON. Elasticsearch begon als een zoekmachine voor tekst, maar de database kan elk type gegevens dekken, waarbij elk document een unieke ID en een gegevenstype heeft.

Omdat de structuur "schemavrij" is, kunnen documenten worden gedefinieerd naar wat de gebruiker nodig heeft. Voorbeelden van documenten in Elasticsearch-databases zijn:

Afbeeldingen die worden gebruikt om zoekopdrachten van consumenten te identificeren.
Netwerkgegevenslogboeken die worden gebruikt om netwerkinbraken, anomalieën of onevenwichtigheden in de belasting te identificeren.
Productontvangsten die worden gebruikt om kooppatronen van klanten te identificeren en het voorraadbeheer te verbeteren.
Netwerkarchitectuur gebruikt voor automatisch delen en repliceren.
Tekstdocumenten die worden gebruikt om specifieke literaire voorbeelden te vinden.
Tekstdocumenten met één-op-veel-toewijzingen die worden gebruikt voor computerondersteunde vertaling.

Elasticsearch is ontworpen om te worden verspreid. Het is schaalbaar in infrastructuur en flexibel voor lokale server, externe server of cloudgebaseerde werking. Dankzij de open en rustgevende API-structuur kan de uitbreidbare zoekmachine moeiteloos worden gebruikt met plug-ins. Een van die plug-ins is van GSI Technology die een aantal voordelen biedt, waaronder hardwareversnelde k-NN, het gebruik van vectoren voor multimodaal zoeken en het samenvoegen van scoreresultaten.

Elasticsearch vertrouwt op zijn gedistribueerde computerondersteuning voor schaalbaarheid, en zijn razendsnelle snelheden liggen in de orde van seconden voor zoekopdrachten in databases op miljoenen schaal. Vanwege de gedistribueerde aard en sharding-ondersteuning, maakt Elasticsearch het mogelijk om gegevens te dupliceren, het zoeken parallel te laten lopen en het te versnellen voor grotere databases. De gedistribueerde functionaliteit die voortkomt uit het plaatsen van de HTTP-opdracht maakt het ook mogelijk meerdere zoekopdrachten met verschillende resoluties uit te voeren door een ingebed apparaat - één op lokale bronnen en één verzonden naar stroomopwaartse bronnen.

Core Elasticsearch maakt gebruik van een rekenkundig zware uitputtende match (match all), die het vertraagt of vrij duur maakt in dubbele hardware om grootschalige databasezoekacties te ondersteunen. Een techniek die kan worden gebruikt om de databasegrootte te vergroten, is k-NN-zoekopdracht. Het werkt door eerst te zoeken naar overeenkomsten in gemeenschappelijke groeperingen en vervolgens de laatste zoekopdracht uit te voeren binnen die een of meer groeperingen. Deze techniek maakt het ook mogelijk om grote databases te doorzoeken op edge-scale servers in plaats van cloudgebaseerde compute-farms voor zeer latentiegevoelige applicaties.

Computationeel uitdagende benadering

Hoewel k-NN een methodologie biedt voor Elasticsearch om zeer grote databases te ondersteunen, zoals die op miljardenschaal en hoger, is het compute-uitputtend. Als gevolg hiervan was het een uitdaging om k-NN te versnellen vanwege de beperking van het verplaatsen van de databases tussen GPU- of CPU-kernen.

Een van de grootste beperkingen voor het versnellen van de werkbelasting is de beperking van de benodigde gegevensuitwisseling tussen processors en geheugen. Een groot nadeel van de Von Neumann-architectuur die in moderne processors wordt gebruikt, is de overhead van gegevensoverdracht tussen processors en opslag. De CPU moet uitgaan en gegevens ophalen voor elke bewerking die hij doet.

Deze architectuur is zelfs nog inefficiënter in een offload-acceleratieomgeving. De prestaties van dergelijke systemen worden beperkt door de snelheid waarmee gegevens via het geheugen kunnen worden uitgewisseld door de host die de bewerkingen aanvraagt en ook door rekenmachines die de bewerkingen uitvoeren.

Er wordt onderzoek gedaan naar architecturen die de gegevensstroom uit het geheugen verminderen om de bottleneck van Von Neumann te helpen verlichten. Het knelpunt is echter bijzonder groot bij het omgaan met geheugenintensieve kunstmatige-intelligentietoepassingen. De werking van AI-gerelateerde applicaties hangt af van de snelle en efficiënte verplaatsing van enorme hoeveelheden data in het geheugen. Getrainde databases moeten worden geladen in het werkgeheugen en gevectoriseerde invoerquery's. Vervolgens moeten ze worden verwerkt en geladen om de vergelijkingsfuncties te laten werken.

Een bewezen technologie die al een impact op de markt heeft, is de Associative Processing Unit (APU). Het mooie van in-memory acceleratie is dat de opslag zelf de processor wordt. Dit is geen enorme reeks verwerkingskernen met cachegeheugen in de buurt, maar eerder een geheugenarray met rekeneenheden ingebouwd in de leesregelarchitectuur.

De APU onderscheidt zich dus doordat de geheugenarray de rekenkracht kan versnellen. Het is aangetoond dat dit type "versnelde" processor de prestaties met orden van grootte versnelt, terwijl het stroomverbruik van de werkbelasting van standaardservers wordt verminderd.

De convergentie van Elasticsearch, k-NN en APU-versnelling zorgt voor minder latentie en meer zoekopdrachten per seconde. Het maakt het ook mogelijk om ondersteuning te bieden voor het zoeken naar databases op miljarden schaal met een lager vermogen dan traditionele systemen met alleen CPU of GPU-versnelde systemen. In de ingebedde ruimte kan Elasticsearch een manier bieden om lokaal te zoeken op een edge-apparaat en tegelijkertijd een HTTP-verzoek te verzenden voor een diepere zoekopdracht in het netwerk. Verschillende resultaten kunnen aan elkaar worden genaaid voor een steeds scherper antwoord, of er kunnen alleen nieuwe uitzonderingen worden opgenomen.

Een extreem edge-apparaat zou zijn CPU-bronnen kunnen gebruiken om een zoekopdracht uit te voeren in een lokaal relevante database voor snelheid. Vervolgens zorgt het gebruik van de APU-dichtheidsmultiplier ervoor dat de Elasticsearch-netwerkverzoeken efficiënt op een edge-server of aggregator kunnen worden uitgevoerd in plaats van naar de cloud te worden verzonden. Overweeg robots die autonome beslissingen kunnen nemen, maar toch back-upvalidatie of koerscorrecties krijgen van een diepere zoektocht stroomopwaarts. Overweeg geautomatiseerde voertuigen die onmiddellijk beslissingen nemen op basis van regels en lokale omstandigheden, terwijl ze informatie verzenden via gateways voor snelwegborden en stroomopwaartse weginformatie en rij-instructies terugkrijgen.

In de toekomst zal het spannend zijn om te zien welke nieuwe kansen deze convergentie zal bieden.

Gegevensoogstfeeds Landbouw 4.0 Arduino-bord brengt intelligentie naar buitentoepassingen

Internet of Things-technologie

Ingebed

Sensor

Cloud computing

Internet of Things-technologie