datialdente
Posts
L'AI che usi in azienda elabora i tuoi dati. Ma sa davvero cosa ci sono dentro?

L'AI che usi in azienda elabora i tuoi dati. Ma sa davvero cosa ci sono dentro?

Alessandro Cavallo
8 giugno 2026

Giovedì scorso Anthropic ha pubblicato un report in cui chiede una pausa globale nello sviluppo dell'AI. Il motivo dichiarato è che i modelli stanno diventando così capaci da rischiare di sfuggire al controllo umano. Nello stesso documento, l'azienda ha rivelato che Claude scrive già oltre l'80% del codice rilasciato nei propri sistemi di produzione. C'è qualcosa in questa notizia che vale la pena leggere con attenzione. Non il tono allarmistico che ha accompagnato i titoli, né l'ironia su un'azienda AI che chiede di rallentare l'AI. Il punto è un altro. Chi costruisce questi sistemi sa esattamente su quali dati ragionano, come sono stati costruiti, dove potrebbero fallire. E nonostante questo, dice che la velocità con cui il mondo li sta adottando ha già superato la capacità collettiva di governarli. In Italia questo disallineamento ha una forma specifica.

I numeri che contano

Secondo l'Osservatorio AI del Politecnico di Milano, nel 2025 l'84% delle grandi aziende italiane ha acquistato licenze di almeno uno strumento di AI generativa. Gli strumenti più diffusi sono Microsoft Copilot, ChatGPT e Gemini. Nelle PMI il quadro è radicalmente diverso. Solo il 9% usa strumenti a pagamento, un ulteriore 9% usa strumenti gratuiti. Oltre l'80% non ha ancora avviato nessun percorso strutturato. Questi due mondi hanno in comune un problema che nessuno dei due ha ancora risolto. Non è un problema di strumenti. È un problema di dati.

Cosa succede quando l'AI incontra i dati reali di un'azienda

I sistemi AI ragionano su quello che viene loro fornito. Documenti caricati, contesti descritti, database collegati. Ma in tutti i casi il sistema non sa nulla di quello che non gli viene mostrato. Non sa che il CRM non viene aggiornato sistematicamente da mesi. Non sa che nel gestionale esistono migliaia di record duplicati accumulati in anni di migrazioni mai completate. Non sa che i dati di vendita di un certo periodo includono un errore di caricamento che nessuno ha mai corretto perché nessuno se n'è mai accorto. Non sa che una stessa categoria di clienti viene classificata in modo diverso tra un reparto e l'altro, e che questa incoerenza si trascina da anni senza che nessuno l'abbia mai mappata. Ragiona su quello che riceve, producendo risposte che sembrano affidabili perché sono internamente coerenti. Ma la coerenza interna di un output generato da un modello non è una garanzia di corrispondenza con la realtà. È una garanzia di coerenza con i dati che ha ricevuto. Il risultato pratico è che un'analisi costruita su un CRM pieno di duplicati produce insight sui clienti che non esistono. Un sistema di supporto decisionale alimentato con dati di vendita errati suggerisce priorità basate su numeri sbagliati. Un assistente AI che risponde a domande interne usando documenti di policy obsoleti fornisce risposte precise su procedure che l'azienda ha già cambiato. In tutti questi casi l'AI funziona perfettamente. Il problema è altrove, nel layer che precede il modello, nei dati che nessuno ha mai verificato prima di usarli come fondamenta.

Il problema che nessuno vede prima che diventi caro

Una PMI di servizi che pensava di avere pochi strumenti AI in uso, dopo una mappatura sistematica, ha contato quattordici sistemi distinti attivi tra i propri dipendenti. Ognuno aveva accesso a qualche frammento di dati aziendali. Nessun frammento era stato verificato prima di diventare contesto per le risposte del modello. Questo non è un caso isolato. È la norma in qualsiasi organizzazione che ha adottato strumenti AI dal basso, per necessità operativa, senza che nessuno si sia posto la domanda di cosa stessero elaborando davvero. Non a caso, quattro grandi imprese italiane su dieci hanno già definito linee guida interne proprio per evitare che i dati aziendali vengano usati come contesto senza controllo su cosa contengano. Nelle PMI questo processo è appena iniziato, quando è iniziato.

La domanda che viene prima di tutto il resto

Il punto di partenza non è scegliere il modello giusto, né decidere quale piattaforma adottare. È una domanda molto più semplice e molto più scomoda: i dati che abbiamo rispecchiano davvero come funziona la nostra azienda oggi? In molti casi la risposta è no. Non perché qualcuno abbia sbagliato qualcosa, ma perché i dati registrano quello che è stato configurato per essere registrato, nel modo in cui era stato configurato, nel periodo in cui quella configurazione funzionava. Quello che è cambiato nel frattempo, i processi evoluti, le categorie ridefinite, i sistemi mai allineati tra loro, rimane fuori. Un sistema AI non vede quello che manca. Vede quello che c'è, e ci costruisce sopra un ragionamento fluido. Più il sistema è sofisticato, più quel ragionamento sembra affidabile. La sofisticazione del ragionamento non compensa la qualità delle fondamenta su cui è stato costruito. Chi vuole usare l'AI per decidere meglio deve prima sapere su quali dati quelle decisioni verranno costruite. Non è un prerequisito tecnico. È la condizione di base perché qualsiasi strumento, per quanto avanzato, produca qualcosa di utile invece che qualcosa di plausibile.