Red Hot Cyber
La cybersecurity è condivisione. Riconosci il rischio, combattilo, condividi le tue esperienze ed incentiva gli altri a fare meglio di te.
Cerca

Perché i progetti di IA falliscono? Cerchiamo di dare delle risposte

Redazione RHC : 10 Aprile 2023 08:33

Inizia a digitare “l’intelligenza artificiale cambierà” in un motore di ricerca e vedrai i finali di frase suggeriti come “il mondo”, “tutto nella tua vita” e “il volto del business nel prossimo decennio”. 

Cerca un po’ di più e diventerà chiaro che i progetti di intelligenza artificiale e apprendimento automatico non stanno solo guidando i progressi, ma sono parte integrante del loro successo

Secondo una ricerca di Accenture, l’85% dei dirigenti nei settori ad alta intensità di capitale, affermano che non si potranno raggiungere gli obiettivi di crescita a meno che non si utilizzi l’AI. Allo stesso tempo, la ricerca del MIT Sloan suggerisce che il divario tra le organizzazioni che ottengono valore con successo dalla scienza dei dati e quelle che lottano per farlo si sta allargando. 

Vuoi diventare un Ethical Hacker?
Non perdere i nostri corsi e scrivi subito su WhatsApp al numero
375 593 1011 per richiedere informazioni dicendo che hai trovato il numero sulle pagine di Red Hot Cyber

Supporta RHC attraverso:


Ti piacciono gli articoli di Red Hot Cyber? Non aspettare oltre, iscriviti alla newsletter settimanale per non perdere nessun articolo

Come sappiamo, la scienza dei dati e l’apprendimento automatico sono il motore dietro le applicazioni di intelligenza artificiale, poiché è attraverso l’elaborazione dei dati che l’IA impara a interpretare il nostro mondo e a rispondere come vogliamo. Se l’IA vuole avere un impatto reale sulle aziende e sui loro clienti, le aziende hanno bisogno di un nuovo approccio all’apprendimento automatico. Come conclude il MIT Technology Review : “il modo in cui alleniamo le IA è fondamentalmente imperfetto”.

Molti articoli in pubblicazioni come Towards Data Science e Open Data Science cercano di distinguere esattamente perché i progetti di apprendimento automatico falliscono. Questi articoli sono fantastici se sei uno scienziato dei dati, ma non così utili se sei un’azienda che cerca di capire perché l’assistente di conversazione o la campagna di personalizzazione in cui hai speso migliaia di investimenti non sono mai decollati.

La realtà è che il tuo progetto di machine learning molto probabilmente non ha fallito perché hai incasinato il tuo approccio al controllo delle versioni dei dati o alla distribuzione del modello. La maggior parte dei progetti di machine learning fallisce semplicemente perché le aziende non disponevano delle giuste risorse, competenze o strategie sin dall’inizio

Il rapporto sullo stato dell’IA del 2021 di McKinsey lo ha confermato, riferendo che le aziende che vedono il maggiore impatto sui profitti dall’adozione dell’IA seguono le migliori pratiche sia di base che di intelligenza artificiale e spendono per l’IA in modo più efficiente ed efficace rispetto ai loro colleghi.

Cinque errori comuni commessi dalle aziende sulle IA

Si è quindi identificato un modello di errori comuni che riducono l’efficienza, fanno aumentare i costi, ritardano i tempi e, in definitiva, sono i motivi per cui i progetti di machine learning falliscono.

Errore comune 1: valutazione errata delle risorse necessarie

Il primo motivo per cui i progetti di apprendimento automatico falliscono è che le aziende non sono preparate e non sono attrezzate per portarli a termine. Secondo Dimensional Research, 8 aziende su 10 trovano i progetti di machine learning più difficili del previsto perché sottovalutano il lavoro che viene svolto correttamente nei modelli di formazione. 

Questo è il motivo per cui così pochi progetti di data science arrivano alla produzione; senza una chiara comprensione delle risorse e delle competenze necessarie, le aziende finiscono per incontrare ostacoli insormontabili o per bruciare il budget a causa delle inefficienze. 

Una cosa che viene giudicata male è lo sforzo richiesto per ottenere i dati di allenamento corretti, il che ci porta all’errore comune numero due.

Errore comune 2: affidarsi a broker dei dati per per l’addestramento

Le aziende non hanno difficoltà a ottenere i dati di formazione. Dopotutto, ci sono numerosi fornitori di dati che vendono artefatti di dati di addestramento in enormi volumi a prezzi bassi. Il motivo per cui i progetti di machine learning falliscono è che le aziende faticano a ottenere dati di formazione di alta qualità .

Acquistando dati universali dai fornitori, le aziende non ottengono dati sufficientemente specifici per le esigenze del loro progetto di machine learning. Per capire perché, considera l’esempio di un fornitore di lezioni di ginnastica online che costruisce un personal trainer digitale (PT). Affinché il PT sia in grado di riconoscere una forma scadente e consigliare miglioramenti, deve essere addestrato con dati che vadano oltre le immagini di individui in diverse posizioni di esercizio. Ha anche bisogno di saper riconoscere le persone con diversi livelli di esaurimento e sudorazione, che indossano abiti diversi e con diversi livelli di forma fisica e competenza.

Esistono molti altri problemi con i set di dati di addestramento preconfezionati, tra cui:

  • Non vi è alcuna garanzia che i dati rappresentino l’equilibrio di età, genere, razza, ecc. necessario a ridurre i pregiudizi;
  • I dati non hanno annotazioni o non sono stati annotati in un modo corretto per il tuo algoritmo;
  • I dati non sono stati controllati come conformità e standard rispetto alle normative globali sull’IA come il progetto di legge europea sull’intelligenza artificiale (EU AIA);
  • Le aziende non possono essere sicure che siano state osservate corrette misure sulla privacy e sicurezza dei dati, né su come proteggere l’integrità dei dati in futuro.

Per eseguire progetti di machine learning di vero successo, le aziende dovrebbero pensare ai dati di formazione come una tra le prime cose.

Errore comune 3: l’addestramento delle IA richiede un’iterazione costante

L’acquisto di dati dai fornitori non solo ha conseguenze per la qualità dei dati di addestramento, ma rende anche il resto del processo di addestramento dell’IA infinitamente più difficile.

L’addestramento di algoritmi ML non è un processo unico. Una volta che la formazione è in corso, gli sviluppatori devono richiedere continuamente modifiche ai dati raccolti man mano che le esigenze del modello di dati diventano più chiare. Questo perché addestrare un algoritmo di intelligenza artificiale è come provare a fare la spesa e cucinare allo stesso tempo: potresti pensare di avere tutti gli ingredienti che ti servono, ma una volta che inizi a cucinare, ti rendi conto che hai dimenticato un ingrediente, che è necessario scambiarlo o l’equilibrio degli ingredienti non è giusto e quindi devi continuare a modificare la tua ricetta.

Nell’apprendimento automatico, è difficile sapere esattamente quali dati siano necessari finché non si avvia il processo di addestramento dell’algoritmo. Potresti renderti conto che il set di formazione non è abbastanza grande o che si è verificato un problema con il modo in cui sono stati raccolti i dati. Molti broker di dati hanno politiche rigorose o non offrono alcuna possibilità di modificare gli ordini, di fatto questo comporta l’acquisto di nuovi dati. Questo è un collo di bottiglia comune a molte aziende che fa aumentare i prezzi, ritarda le scadenze e riduce l’efficienza. In definitiva, è il motivo principale per cui i progetti di apprendimento automatico falliscono.

Errore comune 4: non integrare i test QA

Le aziende di tutti i settori spesso non riescono a integrare i test di qualità in tutte le fasi del processo di sviluppo del prodotto e questo è uno dei motivi per cui i progetti di apprendimento automatico falliscono. 

A differenza dello sviluppo software tradizionale, non è possibile risolvere i bug con un semplice aggiornamento del software; piuttosto, gli errori scoperti nella fase di test di qualità, possono essere risolti solo rifacendo l’intero processo. Se la tua IA non funziona come previsto, è molto probabile che si sia verificato un problema con i dati di addestramento o che i dati di addestramento hanno distorto il modello nella direzione sbagliata. In ogni caso, ciò significa tornare alla fase uno e curare nuovi artefatti dei dati di addestramento.

Le aziende che non integrano la convalida dei risultati in tutte le fasi del processo di sviluppo dell’IA fanno più lavoro. Invece di addestrare l’algoritmo con un enorme set di dati e quindi testare l’IA, le aziende devono addestrare e testare in modo più iterativo. L’adozione di un approccio agile e “bak-in” ai test aiuterà a ridurre le spese non necessarie, accelerare i tempi e consentire un’allocazione più efficiente delle risorse.

Errore comune 5: mancata riqualificazione continua

L’ultimo motivo per cui i progetti di apprendimento automatico falliscono è che le aziende celebrano il loro successo troppo presto.

I progetti di intelligenza artificiale non sono mai veramente finiti. Anche se un’esperienza di intelligenza artificiale soddisfa pienamente le aspettative come precisione e prestazione, è stata ancora addestrata solo su dati che riflettono la società così com’è oggi. 

L’algoritmo ha imparato a prendere decisioni sulla base di opinioni, dialoghi e immagini che stanno già cambiando. Pensa alle applicazioni di elaborazione del linguaggio naturale (NLP): queste sanno comunicare solo perché sono state addestrate su conversazioni reali con le persone in un periodo storico. Dato che ogni anno vengono create circa 5.400 nuove parole nella sola lingua inglese, le applicazioni NLP diminuiranno di precisione molto rapidamente.

Se le esperienze di intelligenza artificiale devono continuare a essere utili per i clienti, devono essere riqualificate su base continuativa man mano che gli atteggiamenti sociali, gli sviluppi tecnologici e le terminologie cambiano.

Come garantire progetti di machine learning di successo

Ciò di cui le aziende hanno bisogno è un approccio programmatico allo sviluppo dell’IA. 

Piuttosto che pensare a ogni singola fase del processo come a progetti distinti, le aziende dovrebbero considerare di unirli come parte di un programma olistico. Lo sviluppo dell’IA è un processo iterativo e agile in cui i team devono lavorare in tandem, non in silos, il tutto governato da un leader del programma con la responsabilità del successo del programma.

Redazione
La redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.