Feit of fictie:welk verhaal vertellen uw gegevens u?

In 30.000 voor Christus schilderden onze voorouders verhalen op grotmuren over hun dagelijks leven, en tegen 700 voor Christus hadden we ons eerste gedrukte verhaal - Gilgamesj. Flash forward naar 2021 en al meer dan een half decennium co-creëren we samen met AI verhalen. Maar wanneer nauwkeurige business intelligence aan de orde van de dag is, willen bedrijven er zeker van zijn dat hun kunstmatige intelligentie en machine learning-systemen geen artistieke vrijheid nemen en een sterk verhaal terugspugen.

Dit geldt met name nu de besluitvorming op basis van AI en ML op het hoogste niveau van adoptie tot nu toe is en zelfs de meest onwillige leidinggevenden beginnen de enorme voordelen te zien die kunnen worden gehaald uit een datacentrische benadering van strategie. Omdat vertrouwen de belofte van AI en ML bouwt, is nauwkeurigheid van cruciaal belang. Velen blijven de vraag stellen:“Hoe kunnen we zien of onze gegevens ons het hele verhaal vertellen – en een verhaal dat op feiten is gebaseerd? Wat moeten we weten om op onze modellen te kunnen vertrouwen?”

Prachtig schone gegevens

Wanneer een machine learning-systeem een onnauwkeurige voorspelling biedt, kunnen we naar één boosdoener kijken:de gegevens. Afgezien van gebeurtenissen met een zwarte zwaan, vormen gegevens het begin, het midden en het einde van elk voorspellend systeem. Het kan zijn dat er gewoon niet genoeg gegevens waren om het systeem betrouwbaar te trainen of de voorspellingen op te baseren, in welk geval meer gegevenspunten het probleem kunnen oplossen. Gewoonlijk zou zoiets worden opgemerkt in de vroege stadia van het bedenken van een model en vrijwel zeker voorafgaand aan de implementatie, in ieder geval voor zover het wild onnauwkeurige voorspellingen voorkomt. De meest waarschijnlijke boosdoener is echter dat de startgegevens niet "schoon" genoeg waren. Schoon genoeg is relatief. Gegevensvereisten voor sommige projecten lijken op "Zijn mijn sneakers schoon genoeg om naar de supermarkt te gaan?" Anderen, vooral in kritieke systemen en systemen die betrekking hebben op leven, veiligheid en welzijn, lijken meer op "stofvrij, spit-glans, paradeglans waarin je je tanden zou kunnen checken"-scenario's als het gaat om hoe schoon de gegevens moeten zijn om de taak betrouwbaar (en ethisch) uit te voeren.

Dus, wat maakt gegevens vies? Het korte verhaal bevat onjuiste of vertekende informatie.

Kapotte labels, kapotte modellen

Dit kunnen onjuist getagde gegevens zijn, gegevens met de verkeerde informatie in het verkeerde veld of in een onjuist formaat, bijv. 27 december 2015 in plaats van 27/12/15 of 27/12/2015. Hoewel de eerste optie gewoon een fout kan veroorzaken of genegeerd kan worden, kan het verwisselen van de laatste twee datumnotaties ernstige gevolgen hebben voor de nauwkeurigheid. En datums zijn niet het enige dat ongeldige opmaak kan beïnvloeden:tijden, SKU's, tekst waar getallen zouden moeten staan, getallen waar tekst zou moeten staan en alle speciale datastromen die uit apparatuur op de werkvloer komen, zoals overschrijvingen, alarmen, belastingen, snelheden, feeds, etc. Het punt is dat gegevens zonder een betrouwbare en consistente structuur rommelig kunnen worden en tot onnauwkeurige inzichten kunnen leiden.

Met MachineMetrics kunnen bedrijven profiteren van onze geautomatiseerde gegevenstransformatie-engine die een breed scala aan gegevenstypen standaardiseert en opmaakt voor eenvoudige analyse. Het kan aangepaste sensorwaarden, machinestatus, modi, alarmen, overschrijvingen, belasting, snelheden, feeds, PMC-parameters, diagnostiek en meer verwerken.

Kunt u uw bronnen vertrouwen?

Het is belangrijk om ook rekening te houden met de waarheidsgetrouwheid en nauwkeurigheid van alle gegevensbronnen die worden gebruikt, vooral als die bronnen menselijk zijn. Mensen zijn niet de meest nauwkeurige wezens. We ronden en vergeten en fudge de nummers. We worden lui of moe of hongerig of afgeleid. Door de aard van het gebruik van menselijke gegevensbronnen, zullen gegevens op de een of andere manier vuil zijn. Hier is het belangrijk om naar toleranties te kijken. Machinebedieners kunnen bijvoorbeeld gegevens toevoegen over de staat van de apparatuur die ze gebruiken. Bij het geven van informatie over uitvaltijd kunnen de genoemde redenen juist zijn, terwijl de tijd meer een schatting is. Dit leidt tot een minder nauwkeurig voorspellend systeem, omdat de antwoorden die het geeft ook dichter bij schattingen liggen dan ze zouden zijn geweest als ze echt nauwkeurige gegevens hadden verstrekt.

Dit is een ander scenario waarbij rekening moet worden gehouden met realistische toleranties. Intervallen van seconden of een half uur? In het geval van sourcing van machinegegevens, zou u voor sommige gebruiksscenario's zelfs kunnen kijken naar nanoseconden of kleiner. Ongeacht welke tolerantie redelijk wordt geacht voor het project, het is belangrijk om die tolerantie af te dwingen en ervoor te zorgen dat alle gegevensinvoer in het systeem binnen die parameters valt voor nauwkeurigheid.

De MachineMetrics High-Frequency Data Adapter legt machinegegevens vast op 1 kHz (in vergelijking met een standaard 1 Hz - dus 1000x sneller), zodat u nooit een slag hoeft te missen, ongeacht het nauwkeurigheidsniveau van uw toepassing.

Dit is ook waar bedrijven ook op zoek moeten zijn naar bias-potentieel. Leugens van weglating leiden nog steeds tot sprookjesachtige voorspellingen. Verzamelen uw gegevensbronnen breed genoeg om het hele plaatje te laten zien of zijn ze vatbaar voor vertekening als gevolg van de gebruikte verzamelmethoden? Als u bijvoorbeeld het gemiddelde salaris voor een productielijnmedewerker probeert te berekenen, maar alle respondenten waren mannen, krijgt u waarschijnlijk een scheef cijfer versus als u zowel mannen als vrouwen zou ondervragen om een duidelijker en nauwkeuriger beeld. Het actief zoeken naar mogelijke onoplettendheid zoals deze kan leiden tot schonere gegevens en nauwkeurigere voorspellingen.

Context en complexiteit

Hoe complexer een systeem, hoe meer ruimte er is voor onnauwkeurigheden, inconsistenties, risico's en algemene storingen in de gegevens en logica die eraan ten grondslag liggen wanneer u het probeert te vertalen naar iets dat kan worden gebruikt voor analyse. Uit hoeveel stappen bestaat het proces waarin u gegevens probeert te verzamelen? Heb jij de branchekennis om je te helpen context te geven aan de ruwe data? Een machine die bijvoorbeeld meerdere keren binnen enkele minuten "uitvalt" met een succesvolle productie ertussen, is minder waarschijnlijk echte productieruns, maar is eerder een indicatie van tests om ervoor te zorgen dat het probleem dat aanvankelijk de uitvaltijd veroorzaakte, volledig wordt opgelost, opnieuw gekalibreerd en klaar om echt te hervatten productie. Als u deze cijfers echter in de dataset laat zoals ze zijn ingevoerd, kan dit ernstige onnauwkeurigheden veroorzaken die voor het ongetrainde oog moeilijk te zien zijn.

Dit betekent niet dat uw data science-team de ultieme expert moet zijn in alles in uw branche. Het betekent echter wel dat er kanalen zijn waar de experts kunnen context toevoegen is van cruciaal belang. Met MachineMetrics zijn machinebedieners bijvoorbeeld uitgerust met een tablet op de werkvloer, direct op hun machinepark. Ze kunnen snel en eenvoudig menselijke context toevoegen aan de numerieke gegevens om de nauwkeurigheid in de analysefase te vergroten. Zonder dit soort contextkanaal kan het een gokspel worden om te bepalen welke getallen in de pot moeten worden gegooid en welke moeten worden weggegooid.

Verliesloze transformaties

Wanneer je het ene in het andere verandert, is er eigenlijk altijd een zekere mate van verlies, hoe klein ook - of dat nu het omzetten van erts in staal, katoen in textiel of gegevens in een formaat voor analyse is, het is belangrijk om te bepalen hoeveel verlies acceptabel is en hoe veel is te voorkomen. Beginnen met schone, nauwkeurige gegevens is een essentiële eerste stap in een schone en nauwkeurige analyse. Na dat stadium is het noodzakelijk om te overwegen welke tools u gaat gebruiken en voor welke toepassingen, hoe groot de kans is op verlies van betrouwbaarheid en in welke mate dit acceptabel (of irrelevant) is. Dit leidt direct tot inzicht in wat u probeert te doen met uw gegevens en met uw modellen - welke problemen u probeert op te lossen - en het nauwkeurigheidsniveau dat nodig is om ze effectief op te lossen.

Bij MachineMetrics zorgen we ervoor dat uw gegevens u de hele waarheid geven en niets anders dan. Wij zijn branche-experts die de diepte, de breedte en het type gegevens begrijpen dat u nodig hebt om uw meest urgente problemen op te lossen, of dat nu machine-uitvaltijd, het optimaliseren van output of een groot aantal andere opties is, met behulp van een gegevensgestuurde aanpak. We gebruiken eenvoudige, verteerbare formaten voor het delen en analyseren die hun integriteit en betrouwbaarheid behouden, zelfs in realtime. MachineMetrics vereenvoudigt de taak om gegevens op de werkvloer te integreren met echte besluitvorming via een beproefd proces, geïmplementeerd in duidelijke taal en met tools die zo eenvoudig zijn dat zelfs niet-technische mensen ze gemakkelijk zelf kunnen installeren, voor een service die heeft onze klanten in minder dan een week naar ROI geleid. Om te zien welke soorten vragen MachineMetrics voor uw bedrijf kan beantwoorden of om een demo te boeken, kunt u hier altijd contact met ons opnemen.

Lean Manufacturing:de principes, verspillingen, voordelen en hulpmiddelen Kwaliteitsborging in productie:alles wat u moet weten

Industriële technologie

Productieproces

3d printen

Automatisering Besturingssysteem

Industriële technologie