Data mining: quello che devi sapere

Con data mining si intende tutto il corpus di tecniche e metodi finalizzati all’assunzione di informazione attraverso un grande quantitativo di dati, come i database dei computer per intenderci. Queste procedure possono avvenire in modo automatico o semi automatico e generalmente vengono adottate in ambito scientifico o aziendale. Anzi, sono sempre più utilizzate e richieste, vediamo perché.

Data mining: una definizione

tecniche di data miningPer alcuni si tratta di qualcosa di estremamente simile alla statistica, che in egual modo si prefigge di estrarre informazioni da un insieme di dati. Pur se dobbiamo ammettere la veridicità di questa somiglianza è opportuno sottolineare una differenza: la statistica può giungere a fornire informazioni generalizzate su una data popolazione, mentre il data mining viene impiegato per individuare connessioni tra diverse variabili che riguardano singoli individui. Un esempio: considerando il comportamento medio dei clienti possono fare una previsione sul comportamento d’acquisto di un cliente medio nel futuro.

Una definizione del termine data mining può essere questa:

l’analisi, da un punto di vista matematico, eseguita su database di grandi dimensioni

Il termine è stato coniato negli anni Novanta proprio per sintetizzare in maniera esaustiva questa definizione. Da allora ai nostri anni Dieci del Duemila le cose sono cambiate e l’estrazione di dati offre un duplice vantaggio:

  • Estrazione di informazioni implicite da dati strutturati
  • Esplorazione e analisi per l’individuazione di schemi significativi

Per tutti e due questi aspetti il termine “informazione” e “significato” sono connessi al campo in cui si applica il data mining. Ossia, uno di questi due aspetti può non essere rilevante a seconda del campo di applicazione.

Pensiamo ai vantaggi di questo procedimento nella ricerca scientifica e di mercato. Sono molte le professioni in cui è possibile ricavare ottimi risultati e avanzamenti. Sembra assurdo ma anche la psicologia può avvantaggiarsi dalla produzione di informazioni di questo genere, riuscendo a prevedere e individuare l’insorgere di eventuali comportamenti. Uno dei settori maggiormente avanzati nell’uso dei big data è senza ombra di dubbio l’informatica, disciplina da cui nascono molti di questi strumenti di analisi.

Esempi di big data e data mining

Per capire meglio ciò di cui stiamo parlando forse è utile fare una distinzione di ciò che può rientrare nel campo del data mining e ciò che invece non ha nulla a che fare. Tutti i giorni abbiamo a che fare con una mole ingente di dati, ma non per questo siamo esperti in big data. Il processo che attraversa l’analisi e l’estrazione di informazioni è complesso e può avvenire solamente tramite strumenti applicativi e programmi che consentono automazioni degli algoritmi.

Insomma, anche se spulci tra i risultati infiniti di Google, anche se hai a che fare con circa 386.000.000 risultati trovati dal motore di ricerca in 0,44 secondi non credere di sapere di cosa stiamo parlando quando parliamo di data mining.

Ma allora che cosa si intende con questa definizione?

La classificazione dei documenti che hai trovato per campi di senso, ossia per campi semantici. Potresti ad esempio ordinarli per categorie, ma se i dati sono nell’ordine di migliaia di milioni potresti impiegare un’intera vita, per una procedura che un computer è in grado di fare in una manciata di secondi.

Un’altra cosa che probabilmente non potresti fare da solo è individuare quali clienti hanno maggiore probabilità di acquistare determinati prodotti. Forse puoi usare l’intuito, ma perché affidarti ad un metodo impreciso quando puoi avere a disposizione una traccia sicura fornita dall’analisi su dati certi e numerosi?

Gli algoritmi del data mining

Algoritmo è una parola importantissima per chi studia i big data, ma anche Ingegneria o qualsiasi altro campo in cui venga utilizzato: “qualsiasi schema o procedimento sistematico di calcolo”, come recita la definizione del dizionario.

Esiste una particolare forma di data mining che utilizza questi algoritmi (quelli creati dal processo) per analizzare i testi e destrutturare i documenti, unendo una lettura delle parole e quindi una sorta di “tecnologia della lingua” ad un’analisi altamente approfondita su una serie di documenti consistente. Ovviamente il text mining ha implicazioni incredibili se si pensa al settore dei motori di ricerca e alla possibilità di intervenire, leggere, approfondire, correggere e analizzare la miriade di contenuti testuali che il web propone, ottenendo informazioni sempre più ordinate, precise e soprattutto corrette. Un colpo basso alla produzione sempre più frequente di fake news che il text mining può contribuire ad arginare. Ma non esiste solo l’analisi del testo, anzi, sono molte altre le possibilità e le discipline che possono sfruttare questi processi, ad esempio:

  • La ricerca scientifica
  • L’intelligenza artificiale
  • Le ricerche di mercato

Solo per citarne alcune. Particolarmente affascinante la ricerca nell’ambito dell’apprendimento automatico, il cosiddetto Machine learning, che ci porta sempre più vicini ad un impiego quotidiano dell’intelligenza artificiale.

Se vuoi scoprire altre possibilità affascinanti che dischiude il mondo dei data mining puoi prendere in seria considerazione l’iscrizione al Master I Livello in Data science: “information & knowledge management per data scientist” promosso dall’Università degli Studi Niccolò Cusano. Gli obiettivi della proposta formativa sono i seguenti:

  • Formare professionisti interdisciplinari
  • Fornire expertise diversificate
  • Formare nell’ambito della progettazione di algoritmi informatici
  • Consolidare la conoscenza degli aspetti economico-giuridici
  • Creare professionisti in grado di contribuire al management delle Aziende

Grazie ad una corposa proposta formativa sarà possibile maneggiare queste informazioni in modo professionale e applicarle nel proprio lavoro. Per maggiori informazioni non esitate a contattarci.


CHIEDI INFORMAZIONI

icona link