Home Alfabeto della Vita Digitale Alfabeto della Vita Digitale: D come Data mining

Alfabeto della Vita Digitale: D come Data mining

91
0
data mining

Letteralmente significa estrazione di dati.

Ogni giorno abbiamo a che fare con i dati in tutte le forme. Li generiamo, li riceviamo, li utilizziamo, li “vendiamo”.

E’ ovvio che risiedono fisicamente su delle memorie e ci vengono forniti attraverso la tecnologia in davvero svariate maniere. Il processo che si pone tra la fruizione del dato ed il posto dove risiede è detto ‘data mining’, ovvero l’estrazione fisica del dato da un database ed il suo uso che poi ci viene fornito, sotto varie forme, il tutto in maniera automatica.

Proprio da una delle parole che ha visto una forte crescita da diversi anni a questa parte, informatica (informazione automatica), deriva la gestione dei dati in maniera automatica.

Attraverso hardware, codice, algoritmi e statistica è possibile derivare qualsiasi informazione dai dati. Il data mining può servire alle più svariate argomentazioni, dalle notizie alle scoperte scientifiche di più alto valore, al sociale e così via.

Al sito RelFinder (scopritore di relazioni), si può far cercare alla macchina delle relazioni derivanti dall’incrocio di diversi database nel mondo. Uno degli esempi che troverete riguarda le relazioni tra le 4 case automobilistiche tedesche

La medicina utilizza il data mining per capire il funzionamento del nostro corpo, quali cellule resistono, quali sono quelle che danneggiano, o predire gli effetti collaterali di una terapia o altre situazioni più o meno complesse. Nell’ambito scientifico è indispensabile per studiare, predire, confermare.

medicinaAnche nel marketing, le aziende si avvalgono del data mining per cercare di profilare i potenziali clienti (scouting) a cui sottoporre pubblicità per avere acquisti. Oppure quante persone preferiscono notizie di borsa o di cronaca o di gossip anziché di sport ?

Anche se si è in automobile e si preferisce proseguire per una data strada, grazie al proprio navigatore, o per una alternativa siccome il traffico è intenso, ecco che ci vengono “serviti” dati da visualizzare per poterli poi usare a nostro piacimento.

Va da sé che tutto il processo non è banale, anzi, ma grazie alle macchine e le strutture di computer che sono state create dall’uomo, è possibile governare e addirittura predire diversi argomenti che toccano la nostra vita quotidiana  (previsioni del tempo ?  😀  ).

C’è una cittadina, Bristol (1 milione di persone), nominata come la città più intelligente (smart city) della Gran Bretagna, dove una moltitudine di dati sono estratti ed incrociati al fine di trarne un vantaggio globale, sia per chi la gestisce, sia per chi la abita.

WWW.BRISTOLISOPEN.COM

Con una connessione dati per la città di “5g” (anche fino a 1000 volte più veloce del 4g, usa onde millimetriche a frequenze altissime fino a 300 Ghz), in molte case e parti della città, sono presenti sensori e telecamere che raccolgono dati dalle più svariate situazioni quotidiane, anche in casa (va da sé che chi vi partecipa abbia acconsentito al trattamento dei propri dati da parte di terzi, in questo caso i dati vanno all’Università di Bristol e all’amministrazione locale, Bristol City Council), per poter monitorare ad esempio i flussi del traffico, l’utilizzo di energia, la qualità dell’aria e molto altro. Tutti questi dati vengono per prima cosa resi anonimi dopodiché messi a disposizione della comunità attraverso un portale “open data”, poi usati.

Si pensi in più all’aggiunta dell’ “Internet of Things”, l’internet delle cose, dove i dati sono attinti dalle cose (contapassi, cardiofrequenzimetro, GPS della bicicletta, drone, lavatrice, caldaia, condizionatore, smartcam per l’assicurazione auto…), tutto è connesso, ogni dato, da ogni dove, confluisce in un reticolo mondiale di dati.Knowledge management

Posti, persone e cose insomma, fuse e gestite in gran parte attraverso i dati che successivamente sono assorbiti da strutture di intelligenza artificiale che in gran parte utilizzano a loro volta reti neurali (una scatola nera…) o algoritmi genetici (rimane la struttura più resistente) o fuzzy system ( impiegati molto nella domotica ) per trarre relazioni da questa moltitudine di numeri, attraverso regole inizialmente scritte dall’uomo.

Perché? Perchè così si possono individuare i cosiddetti “Pattern” da cui si trae:

  • una conferma delle proprie tesi attraverso i dati (metodo di verifica)
  • la scoperta di una regola che si manifesta (metodo di scoperta)

Tutto questo serve per estrarre conoscenza (knowledge management).

visual management

Per intenderci, se al posto delle basi di dati abbiamo le basi di conoscenza (Knowledge base, anziché database) ecco qui che saremo ancora più facilitati perché è già chiaro alla macchina cosa significhi vedere una persona che si scotta mentre cucina, o riconoscerla e proporle della pubblicità. O semplicemente “accendi la luce, abbassa il volume, lavatrice: parti”. Oppure all’alba alza la tapparella.

Anche noi esseri umani, dalla nostra vita quotidiana, forniamo dati in quantità enorme. Quanti di voi dimenticano accesa la posizione del proprio smartphone? Potete comunque riaverla perché tanto viene registrata nel vostro account se glielo permettete.

Ma non solo, agli attuali mondiali di calcio di Russia 2018, ad esempio, molti sensori sono stati impiegati per poi avere i dati estratti ed usati in maniera visuale fornendo statistiche e curiosità al pubblico (quanto una persona ha simulato, quante volte ha affrontato l’avversario, l’area che ha occupato durante la partita, e cosi via) ma anche un validissimo partner strategico a disposizione di ogni squadra.

tessere fedeltà

Le vostre tessere fedeltà per il cibo, l’abbigliamento etc. che tracciano le vostre compere e che vi fanno “vincere” dei punti che utilizzerete per altre cose, sono ciò che voi “vendete” (e mi rifaccio all’inizio dell’articolo) al negozio in cui comprate. Pensate alla quantità di dati che vengono raccolti. Servono al marketing, ad esempio, per capire quali prodotti compriamo insieme, in maniera da metterli più vicini negli scaffali, o per esempio quali spostare verso le casse (prodotti ad alto margine di guadagno) .

O anche attraverso il neuromarketing che propone pubblicità personalizzata, magari, quando passi di fronte ad un cartello interattivo con la telecamera preposta a riconoscere il tuo volto e di conseguenza proporti cose analoghe a quelle comprate precedentemente, oppure che ti interessano, visto che le cerchi sul più grande database del mondo: il web.

Dunque, i dati fanno parte della nostra vita ed è una materia dove ancora l’uomo non possiede esperienza di lungo corso, perchè mai ci sono state collezioni di dati così massicce da gestire,  e se si pensa che è possibile ricostruire parti di vita di una persona, più che altro non è che esistano, ci avvolgono.

Ed il data mining si occupa di gestirli al meglio.