Wat is datamining? Basisprincipes en zijn technieken.

De basis van de vierde industriële revolutie zal grotendeels afhangen van data en connectiviteit(Connectivity) . Analysis Services die in staat zijn om datamining-oplossingen te ontwikkelen of te creëren, zullen hierbij een sleutelrol spelen. Het kan helpen bij het analyseren en voorspellen van de resultaten van het koopgedrag van klanten om potentiële kopers te targeten. Gegevens(Data) zullen een nieuwe natuurlijke hulpbron worden en het proces van het extraheren van relevante informatie uit deze ongesorteerde gegevens zal enorm belangrijk worden. Als zodanig zou een goed begrip van de term Datamining , de processen en toepassing ervan ons kunnen helpen bij het ontwikkelen van een holistische benadering van dit modewoord.

Basisprincipes(Data Mining Basics) van datamining en zijn technieken

datamining

Datamining, ook wel Knowledge Discovery in Data ( KDD ) genoemd, gaat over het doorzoeken van grote hoeveelheden gegevens om patronen en trends te ontdekken die verder gaan dan eenvoudige analyse. Dit is echter geen eenstapsoplossing maar een meerstappenproces en wordt in verschillende fasen doorlopen. Waaronder:

1] Gegevens verzamelen en voorbereiden

Het begint met het verzamelen van gegevens en de juiste organisatie ervan. Dit helpt bij het aanzienlijk verbeteren van de kansen om de informatie te vinden die kan worden ontdekt door middel van datamining

2] Modelbouw en evaluatie

De tweede stap in het dataminingproces is de toepassing van verschillende modelleringstechnieken. Deze worden gebruikt om de parameters op optimale waarden te kalibreren. De gebruikte technieken zijn grotendeels afhankelijk van de analytische capaciteiten die nodig zijn om een ​​scala aan organisatorische behoeften aan te pakken en om tot een besluit te komen.

Laten we in het kort enkele technieken voor datamining bekijken. Het is gebleken dat de meeste organisaties twee of meer dataminingtechnieken combineren om een ​​geschikt proces te vormen dat aan hun zakelijke vereisten voldoet.

Lees(Read) : Wat is big data?(What is Big Data?)

Dataminingtechnieken

  1. Associatie –  (Association – )Associatie(Association) is een van de algemeen bekende dataminingtechnieken. Op basis hiervan wordt een patroon ontcijferd op basis van een relatie tussen items in dezelfde transactie. Daarom(Hence) wordt het ook wel de relatietechniek genoemd. Detailhandelaren van grote merken vertrouwen op deze techniek om de koopgewoonten/voorkeuren van klanten te onderzoeken. Bij het volgen van het koopgedrag van mensen kunnen detailhandelaren bijvoorbeeld vaststellen dat een klant altijd room koopt wanneer ze chocolaatjes kopen, en daarom suggereren dat ze de volgende keer dat ze chocolaatjes kopen, misschien ook room willen kopen.
  2. Classificatie(Classification) – Deze dataminingtechniek verschilt van de bovenstaande doordat deze gebaseerd is op machine learning en gebruikmaakt van wiskundige technieken zoals lineair(Linear) programmeren, beslissingsbomen(Decision) , neurale(Neural)netwerk. Bij classificatie proberen bedrijven software te bouwen die kan leren hoe de gegevensitems in groepen kunnen worden ingedeeld. Een bedrijf kan bijvoorbeeld een classificatie in de toepassing definiëren die "gezien alle gegevens van werknemers die hebben aangeboden ontslag te nemen bij het bedrijf, het aantal personen kan voorspellen dat waarschijnlijk in de toekomst ontslag zal nemen bij het bedrijf." In een dergelijk scenario kan het bedrijf de gegevens van werknemers indelen in twee groepen, namelijk "vertrekken" en "blijven". Vervolgens kan het zijn dataminingsoftware gebruiken om de werknemers in eerder aangemaakte afzonderlijke groepen in te delen.
  3. ClusteringAnders(Different)objecten met vergelijkbare kenmerken worden via automatisering gegroepeerd in één cluster. Veel van dergelijke clusters worden gemaakt als klassen en objecten (met vergelijkbare kenmerken) dienovereenkomstig erin worden geplaatst. Laten we, om dit beter te begrijpen, eens kijken naar een voorbeeld van boekbeheer in de bibliotheek. In een bibliotheek is de enorme collectie boeken volledig gecatalogiseerd. Artikelen van hetzelfde type worden samen vermeld. Dit maakt het voor ons gemakkelijker om een ​​boek van onze interesse te vinden. Op dezelfde manier kunnen we door gebruik te maken van de clustertechniek, boeken die bepaalde overeenkomsten hebben in één cluster bewaren en er een geschikte naam aan toekennen. Dus als een lezer op zoek is naar een boek dat relevant is voor zijn interesse, hoeft hij alleen maar naar die plank te gaan in plaats van de hele bibliotheek te doorzoeken. De clustertechniek definieert dus de klassen en plaatst objecten in elke klasse,
  4. Voorspelling(Prediction) – De voorspelling is een dataminingtechniek die vaak wordt gebruikt in combinatie met de andere dataminingtechnieken. Het omvat het analyseren van trends, classificatie, patroonovereenkomst en relatie. Door gebeurtenissen of instanties uit het verleden in de juiste volgorde te analyseren, kan men een toekomstige gebeurtenis veilig voorspellen. De techniek van de voorspellingsanalyse kan bijvoorbeeld bij de verkoop worden gebruikt om toekomstige winst te voorspellen als de verkoop wordt gekozen als een onafhankelijke variabele en de winst als een van de verkoop afhankelijke variabele. Vervolgens kan men op basis van de historische verkoop- en winstgegevens een aangepaste regressiecurve tekenen die wordt gebruikt voor winstvoorspelling.
  5. Beslisbomen(Decision trees) – Binnen de beslisboom beginnen we met een eenvoudige vraag die meerdere antwoorden heeft. Elk antwoord leidt tot een volgende vraag om de gegevens te classificeren of te identificeren, zodat ze kunnen worden gecategoriseerd, of zodat een voorspelling kan worden gedaan op basis van elk antwoord. We gebruiken bijvoorbeeld de volgende beslissingsboom om te bepalen of we cricket ODI willen spelen : Datamining-beslissingsboom(Data Mining Decision Tree) : Als de weersvoorspelling regen voorspelt, moeten we de wedstrijd voor die dag vermijden. Als alternatief, als de weersvoorspelling duidelijk is, moeten we de wedstrijd spelen.

Datamining vormt de kern van analyse-inspanningen in verschillende sectoren en disciplines, zoals communicatie, verzekeringen(Insurance) , onderwijs(Education) , productie(Manufacturing) , bankwezen(Banking) en detailhandel(Retail) en meer. Daarom is het essentieel om over de juiste informatie te beschikken voordat u de verschillende technieken toepast.



About the author

Ik ben een computertechnicus met meer dan 10 jaar ervaring, waarvan 3 jaar als a店員. Ik heb ervaring met zowel Apple- als Android-apparaten en ben vooral bedreven in het repareren en upgraden van computers. Ik kijk ook graag films op mijn computer en gebruik mijn iPhone om foto's en video's te maken.



Related posts