Datautvinning. bruker teknologi til vår fordel

INTRODUKSJON

(Riquelme, Ruiz, & Gilbert, 2006) uttaler at den digitale revolusjonen har gjort det mulig for digitalisert informasjon å være enkel å fange opp, behandle, lagre, distribuere og overføre. Med den betydelige fremgangen i databehandling og relaterte teknologier og utvidelsen av bruken av dem i forskjellige aspekter av livet, fortsetter en stor mengde informasjon å bli samlet og lagret i databaser.

Av denne grunn er det viktig at organisasjoner bruker denne typen teknologi til sin fordel, for å møte utfordringene som eksisterer i dag, for eksempel å opprettholde varige forhold til kunder. (Braga, Valencia, & Carvajal, 2009) uttaler at den største utfordringen organisasjoner kan møte i dag er å opprettholde en lukrativ kundeportefølje, det handler ikke lenger om å organisere produksjon, redusere kostnader eller ta vare, at selv om det er nødvendige forhold, er de ikke lenger tilstrekkelige til å vinne i det globale og svært konkurransedyktige markedet.

Forfatterne antyder at det er gjennom kunnskapen som er tilegnet om kunder at organisasjoner skal kunne tolke sine mål, forventninger og ønsker. Dette kan oppnås, argumenterer de (Braga et al., 2009) med "data mining", eller ved "customer centic data mining", som er en samling teknikker og metoder som letter anskaffelse og oppbevaring av den delen av markedet som passer et selskap (markedsandel). Målene for god omsorg og kostnadsreduksjon gjelder også ideelle organisasjoner, statlige eller ikke. Virksomheten som kjenner kundene sine kommer til å betjene dem enda bedre.

Denne artikkelen vil forklare hva data, tekst og sentiment gruvedrift består av og hvordan organisasjoner kan bruke denne typen teknologi, ikke bare for å få et konkurransefortrinn i forhold til andre organisasjoner, men også for å oppnå et bedre fokus på produktene sine. og / eller tjenester av informasjonen innhentet fra forbrukere og kunder.

DATAUTVINNING

(Braga et al., 2009) forklarer at data mining gir en automatisk metode for å oppdage mønstre i data, uten skjevhet og begrensning av en analyse som kun er basert på menneskelig intuisjon.

De forklarer også at kundestyrt data mining gir kunnskap om kunders egenskaper og atferd. Fordi å beholde kunder koster mindre enn å skaffe nye.

Forfatterne forklarer at data mining omfatter et sett med teknikker for beskrivelse og prediksjon fra store datamasser. Av denne grunn er det generelt tilknyttet databaser spesielt kalt "datavarehus". Disse databasene tillater rask integrering av data fra forskjellige kilder.

(Joyanes, 2016) argumenterer for at data mining viser til prosessen med å søke etter verdifull forretningsinformasjon i en database, datavarehus eller datamart.

Data mining kan utføre to grunnleggende operasjoner:

Å forutsi trender og atferd Identifisere tidligere ukjente mønstre. Normale Business Intelligence-applikasjoner gir brukerne innsikt i hva som har skjedd, data mining hjelper deg med å forklare hva som skjer og spår hva som vil skje i fremtiden.

Data mining er en prosess som bruker statistisk, matematisk, kunstig intelligens og maskinlæringsteknikker for å trekke ut og identifisere nyttig informasjon som blir til kunnskap fra store databaser, datavarehus eller datamart.

(Pérez, 2007) definerer data mining som en prosess for å oppdage nye og betydningsfulle relasjoner, mønstre og trender ved å undersøke store datamengder.

(Riquelme et al., 2006) uttaler at kunnskapsfunn i databaser (KDD) er definert som prosessen med å identifisere viktige mønstre i dataene som er gyldige, nye, potensielt nyttige og forståelige for en bruker, og denne prosessen Den er interaktiv og iterativ som inneholder følgende trinn:

Forstå applikasjonsdomenet: Dette trinnet inneholder relevante forkunnskaper og applikasjonsmål Utpak måldatabasen: samle inn dataene, vurder kvaliteten på dataene og bruk utforskende analyse av dataene for å bli kjent med dem. Forbered dataene: inkluderer datarensing, transformasjon, integrasjon og reduksjon. Det blir gjort et forsøk på å forbedre kvaliteten på dataene og samtidig redusere tiden som kreves av læringsalgoritmen brukt senere Data Mining: Som nevnt ovenfor, er dette den grunnleggende fasen av prosessen. Den består av en eller flere av følgende funksjoner, klassifisering, regresjon, klynger, sammendrag, henting av bilder, utvinning av regel osv. Tolkning: forklar de oppdagede mønstrene, så vel som muligheten for å visualisere dem.Bruk den oppdagede kunnskapen: bruk den opprettede modellen

Siden vi har vært i stand til å visualisere den grunnleggende fasen av KDD er data mining, vil vi derfor nedenfor forklare hva dens funksjoner består av:

Klassifisering: klassifiserer data innenfor de forhåndsdefinerte kategoriske klasser Regresjon: Formålet med denne modellen er å matche en data med en reell verdi av en variabel. Clustering: refererer til gruppering av poster, observasjoner eller tilfeller i klasser av objekter Lignende. En klynge er en samling poster som ligner og skiller seg fra postene i en annen klynge Regelgenerering: Her trekkes regler ut eller genereres fra dataene. Disse reglene refererer til oppdagelsen av assosiasjonsrelasjoner og funksjonelle avhengigheter mellom de forskjellige attributtene. Sammendrag eller oppsummering: Disse modellene gir en kompakt beskrivelse av et undersett av data. av gener osv.Målet er å modellere tilstandene i prosessen, eller å trekke ut og rapportere avvik og trender over tid.

Søknader om datatrafikk

(Riquelme et al., 2006) nevner at noen av de viktige oppgavene for data mining inkluderer identifisering av applikasjoner for eksisterende teknikker, og utvikling av nye teknikker for tradisjonelle eller nye applikasjonsdomener, for eksempel elektronisk handel og bioinformatikk.

Områdene hvor data mining kan brukes er praktisk talt i all menneskelig virksomhet som genererer data som:

Handel og bank: kundesegmentering, salgsprognose, risikoanalyse Medisin og apotek: diagnostisering av sykdommer og effektiviteten av behandlinger Sikkerhet og påvisning av svindel: ansiktsgjenkjenning, biometriske identifikasjoner, tilgang til nettverk ikke tillatt, etc. Ikke-numerisk informasjonsinnhenting: tekstgruvedrift, nettverksdrift, bilde, video, tale- og tekstsøk og identifikasjon fra multimediedatabaser Astronomi: identifisering av nye stjerner og galakser Geologi, gruvedrift, landbruk og fiske: identifisering av områder til bruk for forskjellige avlinger eller fiske eller gruvedrift i satellittbildedatabaser. Miljøvitenskap: identifisering av fungerende modeller av naturlige og / eller kunstige økosystemer for å forbedre deres observasjon, styring og / eller kontroll.Studie av strømningene av opinionen. Byplanlegging: identifisere nabolag med konflikt basert på sosiodemografiske verdier.

TEKSTMINNING

(Matallana & Delgado, 2010) vurderer at tekstbryting er en spesiell form for data mining som gjør det mulig å utvinne kunnskap fra store informasjonslagre, strukturert eller ikke, og i form av tekst. Målet ligner på datamining, å oppdage usynlige atferdsmønstre og ny kunnskap i en dokumentarisk samling.

Tekstbryting bruker matematiske og statistiske teknikker, samt semantisk analyse av teksten. Tekstbryting er prosessen med å anvende automatiske metoder for å analysere og strukturere tekstdata for å skape nyttig kunnskap fra strukturert og ustrukturert informasjon.

I følge denne forfatterne fokuserer tekstgruvedrift på oppdagelsen av interessante mønstre og ny kunnskap i et sett tekster. Målet er å oppdage nye trender, avvik og assosiasjoner innenfor store mengder tekstinformasjon.

(Joyanes, 2016) forklarer at gruvedrift av tekst søker, gruver og oppdager tekst i dokumenter av alle slag, det kalles også tekstdatautvinding, forfatteren argumenterer for at en praktisk forstand er prosessen med å trekke informasjon av høy kvalitet fra av en viss tekst.

Tekstanalyse prøver å finne mønstre i et sett med tekster som letter bedre beslutningstaking, og dets mål er å forbedre beslutningen. Tekstanalyse tar sikte på å fange ustrukturerte, behandlede data og lage strukturerte data fra dem som kan brukes i analyse- og rapporteringsprosessene.

(Joyanes, 2016) argumenterer for at tekstdata har et stort påvirkningspotensial i nesten alle organisasjoner og selskaper så vel som i bransjen. Læringsmetoder som tillater fangst, analysering og endelig tekstanalyse er avgjørende for organisasjoner.

Føler gruvedrift

(Joyanes, 2016) argumenterer for at sentimentbryting fokuserer på analyse av følelser og meninger som er til stede i tekstmeldinger og andre medieformater, og gjør det mulig å oppdage meninger eller følelsen innebygd, for eksempel i tekstmeldinger, i twitter innlegg osv. av en konkret fordel for aksjonærene og arbeidstakerne som utgjør den.

Opinion eller sentiment gruvedrift som kjent, refererer til naturlig språkbehandling, beregningsspråklighet og tekstanalyse for å identifisere og trekke ut subjektiv informasjon fra materielle kilder.

Klassisk følelsesanalyse har gjennomgått en dramatisk endring siden introduksjonen av Web 2.0 og den økende bruken av blogger og sosiale nettverk. En nettapplikasjon som måler sentimentanalyse er "twitter sentiment". Sentimentanalyse er nå en populær bruk av tekstanalyse, den undersøker og oppnår den generelle meningsretningen fra et stort antall mennesker som gir informasjon om hva markedet sier, tenker og føler om en organisasjon eller person. Sentimentanalyse bruker data fra sosiale mediesider.

Fra perspektivet til en organisasjon eller bedrift lar sentimentanalyse deg raskt og effektivt analysere hva som sies om et merke eller produkt, følge meningene eller samtalene til visse innflytelsesrike brukere, oppdage trender på Internett, etc.

(Joyanes, 2016) erklærer at følelsesanalyse er en metode som forsøker å oversette menneskelige følelser til data, men med bruk av moderne verktøy er det mulig å oppnå at spontaniteten og umiddelbarheten til opinionen i sosiale medier får disse følelsene til å bli mer autentisk og bevare sitt emosjonelle innhold. Analysen relatert til ustrukturert innhold kan måles med følgende grunnleggende egenskaper:

Polaritet: positiv, negativ eller til og med nøytral i en meningssak.

Intensitet: grad av følelser som kommer til uttrykk. Subjektivitet: kilden som avgir uttrykket er objektiv, delvis eller upartisk.

Sentiment gruvedrift kan ha forskjellige applikasjoner som:

Måling av ansattes tilfredshet og arbeidsmiljø Måling av kundetilfredshet Forebygge ubehag ved å oppdage situasjoner med risiko for tap av en klient ved å oppdage negative meninger som tolkes som mulig oppsigelse av klienter Sammenligning med konkurranse ved å evaluere meninger om konkurransen til merkevaren, selskapet, produktene… og sammenligne den med vår. Påvisning av styrker og svakheter i forskjellige områder av vår organisasjon, ved å oppdage positive eller negative synspunkter om innvirkning. bedrifts omdømme Prediksjon av utviklingen av visse handlinger, produktlanseringer, etc. Analyse av valgene til menighetens mening når det gjelder politiske stemmer.

Sentimentanalyse er innrammet innen naturlig språkprosessering (NLP), kunstig intelligens og tekstgruvedrift, blant andre teknikker, siden den fundamentalt søker å trekke ut subjektiv informasjon fra en tekst, for eksempel en tweet, et blogginnlegg, etc.

TAKK

Jeg takker Gud for alle hans velsignelser, så vel som muligheten til å jobbe gjennom prosessen med å forbedre meg selv. Jeg takker foreldrene mine for å støtte meg til enhver tid i dette nye eventyret, National Council of Science and Technology for deres støtte i studiene mine, Orizaba Technological Institute, Master of Administrative Engineering, samt emnet Fundamentals av administrativ ingeniørarbeid, for å gi meg de nødvendige basene for å bli bedre som profesjonell og som menneske.

Referanser konsultert

Braga, LPV, Valencia, IOL, & Carvajal, SS (2009). Introduksjon til data mining. Rio de Janeiro: Editora E-papers.Joyanes, LA (2016). Big Data, analyse av store datamengder i organisasjoner. Alfaomega Grupo Editor.Matallana, FE, & Delgado, JMC (2010). Stor til liten: Strategiene til store selskaper innen rekkevidde for mellomstore selskaper. Netbiblo. Pérez, CL (2007). Data mining: teknikker og verktøy. Redaksjonell Paraninfo.Riquelme, JC, Ruiz, R., & Gilbert, K. (2006). Databehandling: konsepter og trender. Kunstig intelligens. Ibero-American Journal of Artificial Intelligence, 10 (29). Gjenopprettet fra

Last ned originalfilen