Industriële fabricage
Industrieel internet der dingen | Industriële materialen | Onderhoud en reparatie van apparatuur | Industriële programmering |
home  MfgRobots >> Industriële fabricage >  >> Industrial Internet of Things >> Internet of Things-technologie

Waarom traditionele datawarehouses tekortschieten op het gebied van realtime analyse

Datagedreven organisaties slagen of falen op basis van hun vermogen om beslissingen te nemen op basis van de nieuwste, meest actuele informatie. Of u nu toeleveringsketens optimaliseert, fraude bij financiële transacties opspoort of de klantervaring in realtime personaliseert:de actualiteit van gegevens is van cruciaal belang.

Voor veel organisaties blijft deze heilige graal van ‘data-immediacy’ echter ongrijpbaar. Ze blijven vertrouwen op traditionele datawarehouses of andere verouderde datastores – krachtige tools die zijn gebouwd voor batchverwerking en historische analyse – maar zijn slecht toegerust om aan de eisen van realtime analyses te voldoen. Het resultaat? Er worden cruciale zakelijke beslissingen genomen op basis van gegevens die niet langer actueel zijn, wat leidt tot gemiste kansen, suboptimale resultaten en het onvermogen om gelijke tred te houden met de concurrentie.

Als u zich in een situatie bevindt waarin de recentheid van gegevens cruciaal is voor uw gebruiksscenario, en u nog steeds een datawarehouse als uw primaire analyseopslag gebruikt, profiteert u waarschijnlijk niet ten volle van de voordelen van realtime inzichten. Sterker nog, u krijgt waarschijnlijk te maken met aanzienlijke datalatenties en operationele kosten, waardoor uw realtime data-initiatieven op de lange termijn onhoudbaar worden.

Het datawarehouse is nooit ontworpen voor realtime

Om te begrijpen waarom datawarehouses tekortschieten op het gebied van realtime analyses, moeten we kijken naar de belangrijkste architecturale verschillen tussen deze oudere systemen en moderne realtime analysedatabases.

Datawarehouses zijn geoptimaliseerd voor batchverwerking en historische analyse. Ze blinken uit in het samenvoegen van grote hoeveelheden gegevens uit verschillende bronnen, het transformeren en opschonen van de gegevens en het vervolgens laden ervan in een gecentraliseerde opslagplaats voor rapportage en business intelligence. Deze batchgerichte aanpak werkt goed voor gebruiksscenario's waarbij tijdigheid geen kritische factor is, zoals maandelijkse verkooprapporten of driemaandelijkse financiële analyses.

Het inherente ontwerp van een datawarehouse introduceert echter een aanzienlijke gegevenslatentie. Gegevens worden doorgaans op periodieke basis in het magazijn geladen:elk uur, dagelijks, wekelijks of maandelijks. Dit betekent dat tegen de tijd dat de gegevens beschikbaar zijn voor analyse, deze al verouderd zijn, soms al uren of zelfs dagen. In een snelle zakelijke omgeving waar elke seconde telt, kan deze vertraging het verschil zijn tussen het grijpen van een kans en het volledig missen ervan.

Bovendien zijn datawarehouses niet ontworpen om datastromen met hoge snelheid te verwerken of zoekopdrachten met lage latentie te ondersteunen. Naarmate de datavolumes en de gelijktijdigheid van gebruikers toenemen, hebben datawarehouses moeite om de responstijden van minder dan een seconde te bieden die nodig zijn voor realtime besluitvorming. De onderliggende opslag- en indexeringsstructuren van een datawarehouse zijn geoptimaliseerd voor het laden en aggregeren van bulkgegevens, niet voor de snelle opname en bevraging van gedetailleerde, realtime gegevens.

De kosten van verouderde gegevens

De gevolgen van het vertrouwen op een datawarehouse voor realtime analyses kunnen ernstig zijn. Overweeg de volgende scenario's –

  • Retailpersonalisatie: Een e-commercebedrijf wil zijn klanten realtime productaanbevelingen geven op basis van hun browse- en aankoopgeschiedenis. Met behulp van een datawarehouse worden de aanbevelingen gebaseerd op gegevens die mogelijk uren of dagen oud zijn, wat leidt tot een suboptimale klantervaring en gemiste verkoopkansen.
  • Fraudedetectie: Een financiële instelling streeft ernaar frauduleuze transacties in realtime te detecteren om verliezen te minimaliseren. Met een op een datawarehouse gebaseerd systeem worden de fraudedetectiemechanismen beperkt door de latentie van de gegevens, waardoor frauduleuze activiteiten mogelijk onopgemerkt kunnen doorglippen.
  • Optimalisatie van de toeleveringsketen: Een fabrikant wil de productie- en voorraadniveaus in realtime aanpassen op basis van veranderingen in de vraag en de omstandigheden in de toeleveringsketen. Vertrouwen op een datawarehouse zal resulteren in vertraagde reacties op marktschommelingen, wat leidt tot voorraadtekorten, overtollige voorraad en gemiste omzetkansen.

In elk van deze voorbeelden kunnen de kosten van verouderde gegevens niet alleen worden gemeten aan de hand van verloren omzet en ontevredenheid van klanten, maar ook van de alternatieve kosten van gemiste strategische voordelen. Organisaties die niet op basis van de meest recente informatie kunnen handelen, zullen altijd achterblijven bij hun meer wendbare concurrenten.

Bovendien kunnen de operationele kosten die gepaard gaan met het onderhouden van een op een datawarehouse gebaseerde infrastructuur voor realtime analyse onbetaalbaar zijn. De behoefte aan aanvullende ETL-processen, gegevensreplicatie en complexe mechanismen voor gegevenssynchronisatie zorgt voor aanzienlijke administratieve lasten en verhoogt de totale eigendomskosten (TCO).

Realtime analytische databases

Om de beperkingen van datawarehouses voor realtime gebruiksscenario's te overwinnen, wenden organisaties zich steeds meer tot gespecialiseerde realtime analysedatabases zoals Apache Pinot. Deze speciaal gebouwde oplossingen zijn vanaf de basis ontworpen om te voldoen aan de unieke vereisten van analyses met lage latentie en hoge gelijktijdigheid op snel bewegende gegevens.

In tegenstelling tot datawarehouses zijn realtime analysedatabases zoals Pinot geoptimaliseerd voor continue gegevensopname en realtime query's. Ze kunnen datastromen in milliseconden opnemen en indexeren, waardoor query-responstijden van minder dan een seconde mogelijk zijn, zelfs met miljarden records. Hierdoor kunnen organisaties beslissingen nemen op basis van de meest recente gegevens, waardoor het ware potentieel van realtime analyses wordt ontsloten.

Bovendien zijn realtime analysedatabases ontworpen om horizontaal te schalen, waardoor ze groeiende datavolumes en gelijktijdigheid van gebruikers kunnen verwerken zonder dat dit ten koste gaat van de prestaties. Deze schaalbaarheid is cruciaal voor bedrijfskritische, op de gebruiker gerichte applicaties waarbij duizenden gebruikers tegelijkertijd het systeem kunnen bevragen.

Maar de voordelen van realtime analysedatabases gaan verder dan alleen de technische mogelijkheden. Ze bieden ook aanzienlijke operationele en kostenvoordelen –

  • Vereenvoudigd gegevensbeheer: Real-time databases zoals Pinot nemen een groot deel van de complexiteit weg die gepaard gaat met datawarehousing, waardoor de administratieve overhead wordt verminderd en teams zich kunnen concentreren op activiteiten met een hogere waarde.
  • Lagere TCO: Door de behoefte aan dure ETL-processen, datareplicatie en andere datawarehouse-specifieke infrastructuur te elimineren, kunnen realtime databases de TCO voor realtime analyse-initiatieven aanzienlijk verlagen. Er kunnen andere prijsstatistieken zijn, zoals de kosten van zoekopdrachten per seconde, die veel kosteneffectiever kunnen zijn bij leveranciers die realtime databases aanbieden dan bij leveranciers met datawarehouses.
  • Verbeterde behendigheid: Dankzij de mogelijkheid om gegevens snel in realtime op te nemen, te verwerken en op te vragen, kunnen organisaties beter reageren op veranderende bedrijfsomstandigheden en klantbehoeften, waardoor ze een concurrentievoordeel krijgen.
  • Naadloze ecosysteemintegratie: Realtime databases kunnen vaak naadloos worden geïntegreerd met populaire tools voor gegevensopname, -verwerking en -visualisatie, waardoor het gemakkelijker wordt om end-to-end realtime analyseoplossingen te bouwen.

Wanneer kiest u voor een realtime analysedatabase boven een datawarehouse

De beslissing om een realtime analysedatabase zoals Apache Pinot te gebruiken in plaats van een traditioneel datawarehouse moet gebaseerd zijn op een zorgvuldige evaluatie van de specifieke gebruiksscenario’s en vereisten van uw organisatie. Als algemene vuistregel geldt dat als de recentheid van gegevens van cruciaal belang is voor uw bedrijfsresultaten en u te maken heeft met gegevensstromen met hoge snelheid, een realtime analysedatabase waarschijnlijk de betere keuze is.

Hier zijn enkele veelvoorkomende scenario's waarin een realtime analysedatabase uitblinkt –

  • Gebruikersgerichte analyse: Applicaties die responstijden van minder dan een seconde vereisen en een hoge mate van gelijktijdigheid kunnen verwerken, zoals dashboards, rapportagetools en personalisatie-engines.
  • Operationele analyse: Gebruik gevallen waarin realtime inzichten nodig zijn om onmiddellijk actie te ondernemen, zoals optimalisatie van de toeleveringsketen, fraudedetectie of voorspellend onderhoud.
  • IoT en Edge Analytics: Het analyseren van gegevens van verbonden apparaten en sensoren, waarbij een lage latentie en de mogelijkheid om gegevens dicht bij de bron te verwerken essentieel zijn.
  • Verwerking van streaminggegevens: Scenario's waarbij sprake is van de continue opname en analyse van snelle gegevensstromen, zoals financiële handel, clickstream-analyse of realtime advertentie-optimalisatie.

Datawarehouses kunnen daarentegen nog steeds de betere keuze zijn voor gebruiksscenario's waarbij de recentheid van gegevens minder cruciaal is, zoals historische rapportage, business intelligence of data science-workloads.

Uiteindelijk gaat het erom dat u uw specifieke vereisten begrijpt en het juiste gereedschap voor de klus kiest. Proberen om een datawarehouse geforceerd in te passen in een gebruiksscenario voor realtime analyse zal onvermijdelijk leiden tot suboptimale prestaties, hogere kosten en gemiste kansen.

Volgende stappen

Nu het tempo van zakendoen blijft toenemen, is de behoefte aan realtime data-inzichten nog nooit zo urgent geweest. Organisaties die de kracht van nu kunnen benutten – het vermogen om data met de snelheid van het denken om te zetten in actie – zullen degenen zijn die gedijen in het digitale tijdperk.

Om u te helpen dieper in dit onderwerp te duiken en meer duidelijkheid te krijgen, hebben we een eBook voor u samengesteld – “Aanpassen of voorbijstreven:de concurrentievoordeel van realtime gegevens”. Download het vandaag nog en maak binnen uw organisatie een pleidooi voor het adopteren van een realtime analysedatabase zoals Apache Pinot als de juiste tool voor al uw realtime, gebruikersgerichte analysebehoeften.


Internet of Things-technologie

  1. Bedrijven stellen deadlines voor intelligente systemen
  2. Hoe communicatiebedrijven geld kunnen verdienen met IoT buiten connectiviteit
  3. Houden beveiliging en privacy IoT tegen?
  4. 8 IoT-trends die momenteel worden gevolgd voor een betere landbouw
  5. IoT en de impact van 5G beoordelen
  6. Commerciële drones:7 regels voor het beveiligen van gegevens in het ecosysteem
  7. Digital twins kunnen de intelligente voorsprong zijn voor IoT in de productiesector – deel 1
  8. Renault en Powervault werken samen om thuisbatterijen van stroom te voorzien
  9. Team Chemie en Industrie 4.0
  10. Realtime sportanalyses betrekken fans thuis en in het park
  11. Wat is OSGi en wat heb je eraan?