Il machine learning è una tecnica ombrello che comprende al momento oltre 100 algoritmi riconosciuti dalla comunità scientifica, ognuno caratterizzato da una specifica logica di funzionamento, che lo porta ad essere più o meno indicato in virtù dell’obiettivo dell’analisi dei dati che si intende effettuare.

Immagine promozionale cta infografica intelligenza artificiale

Il machine learning si basa principalmente su due tipi di apprendimento automatico: l’apprendimento non supervisionato e l’apprendimento supervisionato, a cui si affianca l’apprendimento semi-supervisionato.

Vediamo in particolare in cosa consiste, come funziona e quali sono le principali applicazioni dell’apprendimento supervisionato, per comprendere come il machine learning possa supportare l’uomo in molti processi di analisi dei dati, sempre più cruciali in tutti gli ambiti di business.

Cos’è l’apprendimento supervisionato

L’apprendimento supervisionato è un approccio del machine learning (ML) che prevede l’impiego di algoritmi informatici, addestrati per migliorare la loro efficienza fino a rilevare i pattern e le relazioni tra i dati di input e le etichette di output dei data set. Una volta formato in maniera soddisfacente, l’algoritmo consente di etichettare in maniera accurata anche i nuovi dati forniti al sistema.

In altri termini, l’obiettivo dell’apprendimento supervisionato è dare un senso ai dati nel contesto di una richiesta specifica, il che lo rende estremamente indicato nel caso di problemi di classificazione e di regressione, come potrebbero essere la categorizzazione di una nuova informazione o la previsione di un volume di vendite in una specifica data.

L’altro approccio prevalente nel machine learning è costituito dall’apprendimento non supervisionato, in cui i dati non vengono etichettati a priori. L’assenza di un output predefinito fa sì che sia l’algoritmo stesso a dover riconoscere i pattern e le similarità presenti nei set data set, creando in maniera autonoma la categorizzazione, anziché esplorare le relazioni che intercorrono tra input e output noti a priori.

Come funziona

L’apprendimento supervisionato regola il training di una serie di algoritmi di machine learning, sulla base di set di dati etichettati, che vengono utilizzati per istruire il sistema in merito alla variabile di output da correlare ad uno specifico input.

Una volta sottoposto al training, il modello viene presentato con i dati di test, di cui il sistema non conosce le etichette, anche se sono ovviamente note a priori. L’obiettivo è infatti quello di dimostrare l’accuratezza dell’algoritmo nel ricostruire la stessa situazione a partire dai dati non etichettati.

L’apprendimento supervisionato si basa sulle seguenti fasi:

  • – Scegliere i dati da utilizzare come set di training
  • – Raccogliere i dati etichettati necessari per l’addestramento
  • – Suddividere i dati di addestramento in set di dati di addestramento, test e convalida
  • – Valutare e scegliere un algoritmo per il modello di machine learning
  • – Eseguire l’algoritmo con il set di dati di addestramento
  • – Valutare l’accuratezza del modello con dati di test non etichettati
  • – Determinare l’accuratezza del modello sulla base della correttezza degli output
  • – Procede alla convalida del modello attraverso l’esecuzione di un ulteriore data set, appositamente predisposto

Un algoritmo di ML potrebbe ad esempio essere addestrato per identificare immagini di auto e moto. Come è lecito attendersi, il training consisterebbe in set di dati contenenti immagini di auto e moto ritratte in varie situazioni contestuali. Tutte rigorosamente etichettate.

Al termine del processo di addestramento, il modello di ML dovrebbe prevedere se un determinato output corrisponde ad un’auto oppure ad una moto, ed etichettarlo di conseguenza.

Alcuni esempi di apprendimento supervisionato

Gli algoritmi di apprendimento supervisionato sono oggi utilizzati in moltissime situazioni di business, in riferimento ad un’ampia varietà di problemi da risolvere.

Classificazione delle immagini

L’apprendimento supervisionato consente di classificare gli oggetti presenti in immagini e video. I social media, ad esempio, utilizzano sistemi di questo genere per riconoscere una persona all’interno di un’immagine e applicare automaticamente un tag capace di ricondurre alla sua identità.

Sistemi di raccomandazione

Gli algoritmi di apprendimento supervisionato sono impiegati dalle piattaforme e-commerce per consigliare gli utenti sulla base delle informazioni acquisiste dai sistemi di tracciamento, che consentono al sistema di machine learning di effettuare l’analisi comportamentale. Attraverso l’analisi della cronologia di visita, un assistente virtuale può ad esempio suggerire all’utente prodotti simili ma maggiormente rispondenti alle aspettative dell’utente, al fine di facilitare le conversioni.

Manutenzione predittiva

Gli algoritmi di ML, addestrati con i dati direttamente acquisiti dai sensori IoT installati sui sistemi monitorati, riescono a distinguere le situazioni di funzionamento corretto dalle anomalie che potrebbero essere sintomatiche di un guasto o di una situazione che potrebbe causarlo. La manutenzione predittiva consente di intervenire su un sistema soltanto quando si rivela strettamente necessario.

Valutazione dei rischi

I modelli di apprendimento supervisionato sono utilizzati da banche ed istituti finanziari per valutare i rischi di insolvenza di chi richiede un mutuo o un finanziamento, ai fini di concedere o negare l’erogazione dello stesso.

Rilevamento di frodi

L’apprendimento supervisionato è ormai alla base del funzionamento della maggior parte dei sistemi antifrode. Il training avviene grazie a data set che contengono sia situazioni lecite che fraudolente, per permettere al modello di riconoscere le anomalie riconducibili ai tentativi di frode.

Sicurezza informatica

I sistemi di monitoraggio analizzano i log dei sistemi per identificare la presenza di possibili anomalie comportamentali. Tale lavoro viene svolto grazie all’impiego di algoritmi di apprendimento supervisionato.

Tipologie di apprendimento supervisionato

Le principali tipologie di apprendimento supervisionato sono formate da algoritmi di classificazione e algoritmi di regressione, oltre ai quali possono essere considerate anche le reti neurali.

Quando vengono chiamati a scegliere un algoritmo di apprendimento supervisionato, gli specialisti dei dati effettuano varie considerazioni. Un fattore evidente risiede nel comprendere la distorsione e la varianza che esistono all’interno dell’algoritmo, cercando di mantenere la flessibilità entro un certo limite.

Un altro elemento fondamentale risiede nel valutare la complessità del modello o della funzione che il sistema sta cercando di apprendere, anche in funzione dei requisiti computazionali che ciò comporta, ai fini di essere certi che la soluzione proposta rientri nel budget previsto.

Classificazione

Un algoritmo di classificazione mira a ordinare i dati di input in un determinato numero di categorie in base ai dati etichettati grazie ai quali è stato in precedenza addestrato. Viene utilizzato nella classificazione binaria, come il già citato esempio relativo all’auto o alla moto, oppure per riconoscere ed etichettare una mail come spam o non spam.

Tra gli algoritmi di classificazione più noti ritroviamo:

  • Alberi decisionali: separano i data provenienti da un unico tronco in due categorie simili, procedendo via via ad ulteriori etichettature, secondo una logica a ramificazione che consente di creare categorie sempre più dettagliate.
  • Foresta casuale: insieme di alberi decisionali, utile a collezionare i risultati di molti modelli predittivi, quando occorre generalizzare maggiormente il contesto di riferimento.
  • Regressione logistica: consente di analizzare una serie di variabili indipendenti e definire un output binario che ricade in una delle due categorie previste.

Regressione

Un algoritmo di regressione, anziché una classificazione binaria, prevede la produzione di una relazione numerica tra i dati di input e i dati di output. Vengono utilizzati in vari ambiti. Nel real estate sono apprezzati nell’analisi predittiva dei prezzi delle unità immobiliari collocate nelle varie zone. Nelle vendite vengono utilizzati ad esempio per prevedere la disponibilità a pagare per i prodotti in base alle caratteristiche anagrafiche dei potenziali clienti.

Tra gli algoritmi di regressione più noti ritroviamo:

  • Regressione lineare: consente di prevedere i valori delle variabili a partire dai valori di altre variabili.
  • Regressione non lineare: particolarmente utile nei casi in cui l’output non è riconducibile ad un input di tipo lineare, per individuare relazioni tra i punti basate su curve o andamenti sinusoidali.
  • Algoritmi bayesiani: analizzano i modelli statistici, acquisendo le conoscenze pregresse nei nuovi parametri del modello di ML.

Reti neurali

Nel caso delle reti neurali, l’apprendimento supervisionato viene migliorato costantemente grazie al progressivo avvicinamento, a livello di accuratezza degli output, agli obiettivi previsti, risultato di un paziente lavoro di fine tuning.

I fattori decisivi sono essenzialmente due: i dati etichettati disponibili e l’algoritmo utilizzato. È inoltre fondamentale tenere conto delle seguenti condizioni:

I dati di training devono essere ben preparati e soprattutto puliti. Dati incoerenti o duplicati compromettono il processo di apprendimento con il rischio di creare modelli poco attendibili.

L’accuratezza del modello è importante ma non è determinante, nel caso in cui si verificasse una condizione di over fitting, magari poco problematica in sede di test, ma poco attendibile quando si impiegano dei set di dati reali. Gli specialisti attenuano questo problema utilizzando dati di test differenti rispetto a quelli di training, in modo che l’algoritmo non possa trarre risposte dall’esperienza precedente.

Nel caso del deep learning si dispone di algoritmi capaci di analizzare immense quantità di dati, con un livello di accuratezza molto elevata, come dimostrano le più recenti applicazioni di AI generativa. La chiave sta nel selezionare l’algoritmo più adatto in funzione dei dati di training di cui si dispone, e viceversa. Non esiste una condizione valida a priori in tutte le situazioni.

Apprendimento supervisionato vs non supervisionato

La differenza fondamentale tra l’apprendimento supervisionato e l’apprendimento non supervisionato risiede nel modo in cui l’algoritmo apprende dai dati che gli vengono forniti.

Nel caso dell’apprendimento non supervisionato, il training set è costituito da dati non etichettati, non ci sono quindi output rispetto a cui trovare correlazioni con gli input. È il modello stesso a dover riconoscere i pattern e le similarità all’interno dei set di dati.

Questa tipologia di algoritmi, non avendo alcuna determinazione a priori, consente di scoprire relazioni anche inaspettate nei dati di cui si dispone. I più noti sono gli algoritmi di clustering, che rilevano automaticamente i gruppi all’interno dei set di dati, e gli algoritmi di associazione, capaci di prevedere le regole per descrivere i dati.

Per comprendere la logica di funzionamento, possiamo ancora una volta richiamarci al caso dell’auto e della moto. L’apprendimento supervisionato ha come obiettivo una classificazione binaria: o auto, o moto. L’apprendimento non supervisionato è invece più indicato quando si intende rilevare le differenze tra le auto e le moto che gli sono state sottoposte durante la fase di training, ma non è in grado di etichettarle come tali.

In generale, un algoritmo di apprendimento supervisionato, rispetto ad uno non supervisionato, gode di alcune caratteristiche che lo rendono preferibile in certe situazioni e meno consigliabile in altre.

Tra i fattori di adozione favorevoli va evidenziata la maggior probabilità di formulare insight di semplice comprensione per il supporto decisionale, per il fatto che sono noti i dati di training da cui sono state elaborate certe informazioni. Vi è dunque un livello di controllo molto elevato sui risultati attesi. La capacità di produrre output predittivi basati sulle precedenti esperienze e l’accuratezza nel modo in cui gli oggetti vengono etichettati completano il quadro di qualità che rendono auspicabile l’impiego di un modello ML basato sull’apprendimento supervisionato.

Per contro, un modello di apprendimento supervisionato, rispetto ad uno non supervisionato, può presentare dei limiti evidenti di fronte alle situazioni impreviste ed eccezionali, come nel caso in cui nel set di training basato su auto e moto capitasse una barca a vela. Il sistema supervisionato rischierebbe di associare un’etichetta erronea in una delle due categorie note, mentre un algoritmo non supervisionato saprebbe riconoscere le differenze della barca rispetto ai due veicoli terresti etichettati.

Il limite principale dei modelli supervisionati è insito nella loro definizione, ossia il fatto di richiedere una grande quantità di dati etichettati per effettuare training comunque esoso in termini di tempo, mentre i modelli non supervisionati si dimostrano molto più flessibili da questo punto di vista, riuscendo a raggiungere comunque un ottimo risultato dal punto di vista analitico.

La scelta dell’algoritmo va effettuata da personale esperto in materia e dotato di una comprovata esperienza nelle situazioni specifiche che si presentano nel contesto di situazioni analitiche reali, legate a casi concreti da risolvere.

ARGOMENTI CORRELATI
Categoria: INTELLIGENZA ARTIFICIALE
Concept di colleghi che osservano dati su cartella

Intelligenza artificiale e machine learning: differenze e utilizzi

Intelligenza artificiale (AI) e machine learning (ML) sono spesso trattate in maniera intercambiale, come fossero dei sinonimi tecnologici. In realtà,… Leggi tutto

Concept che richiama il machine learning e gli algoritmi. Immagine che raffigura un uomo che guarda in alto come osservando un algoritmo che in autonomia produce informazioni

Algoritmi di machine learning: come funzionano e quali sono

Il machine learning, o apprendimento automatico, è il subset dell’intelligenza artificiale in cui vengono utilizzati algoritmi per apprendere dai dati… Leggi tutto

Gruppo di lavoro formato da ragazzi che osservano dati su un notebook

Cosa sono e come funzionano le reti neurali ricorrenti

Le reti neurali trovano il loro fondamenti nei lontani anni Quaranta del Novecento, quando Warren McCulloch e Walter Pitts pubblicarono… Leggi tutto