Primo articolo dopo ben 9 anni dall’ultimo articolo su questo blog 🙂
Ho letto tantissime baggianate su ChatGPT, OpenAI e in generale sull’intelligenza artificiale. Praticamente solo baggianate, anche in articoli su riviste prestigiose, figuriamo sui social (che leggo sempre meno contenendo una quantità insopportabile di scempiaggini).
Visto che di AI ne so qualcosa, cerco di fare un po’ di chiarezza, per chi ha la voglia e la capacità di capire qualcosa di più.
Cercherò di mantenere il livello il più possibile semplice e succinto, quindi necessariamente commetterò imprecisioni che non dubito che i pochi esperti che mi leggeranno mi perdoneranno. Gli argomenti da approfondire sarebbero molti tanti di più. Lo farò a una conferenza se mi si inviterà.
Le tre componenti principali
- Il “cuore” di ChatGPT è composto da tre componenti principali: un’engine di reasoning, un cortex (da qui vengono le lettere PT che stanno per Pre-Trained) e una componente Generativa
- Entrare nel merito delle prime due componenti richiederebbe molte pagine, ed esula lo scopo di queste righe. Per dare un senso al discorso che segue per chi non è familiare con questi concetti, possiamo immaginare la engine di reasoning come una specie di “motore di ricerca”, che agisce sul cortex, che possiamo immaginarci come una specie di “database”. Queste definizioni sono estremamente imprecise (diciamo pure: errate), perché un AI cortex non è neanche lontanamente imparentato con qualsiasi database “classico” (che normalmente visualizziamo come dati strutturati per righe e colonne, per intenderci): il cortex è una (pallida) imitazione del funzionamento dei neuroni del cervello umano: possiamo immaginarcelo come un universo multi-dimensionale (si va ben oltre le 4 dimensioni classiche, a volte oltre le 10) che contiene pezzi di informazioni o “concetti”, collegate in modo più o meno “forte” fra di loro. La engine di reasoning è estremamente complessa e non fa affatto una “ricerca” nel cortex ma, di solito in modo iterativo, genera una risposta partendo da un certo input e dal cortex stesso.
- Le performance (diciamo il “QI”) dipendono da entrambi gli elementi, ma probabilmente l’estensione del cortex è la più importante per la qualità delle risposte, mentre le performance della engine offrono maggiore velocità di risposta a parità di risorse utilizzate.
Le fonti e la “bassa risoluzione”
- OpenAI per il progetto ChatGPT ha “masticato” dati per quasi un anno (spendendo 350M$ in capacità di calcolo e di storage), caricando solo fra informazioni pubbliche disponibili in rete, scartando quelle più recenti del 2021. Le fonti sono principalmente pubblicati siti web istituzionali, enciclopedie e di giornalismo. La componente proveniente dai social network è stata preferenzialmente scartata, e non per motivi relativi alla privacy ma perché zeppa di dati inutili, errati e fuorvianti. Anche i dati eventualmente provenienti da social network, sono comunque solo quelli pubblicati e visibili a tutti. OpenAI non ha certo hackerato Gmail per frugare nella tua posta o nei tuoi file su Drive, né dei social network per leggerti le chat private, e non ha nemmeno creato degli account fasulli per diventare tuo amico e poter leggere i post che pubblicavi solo per gli amici.
- il cortex di ChatGPT è 10-100 volte più grande di quelli normalmente utilizzati per applicazioni aziendali, ma visto che è generalista (o meglio “tuttologico”), la sua “risoluzione di dettaglio” è bassissima, un po’ come le primissime foto satellitari visibili da google maps/earth, prima che le integrassero con foto scattate tramite aerei a bassa quota: si vedono ad esempio le automobili, ma anche “zoomando” non ci sono abbastanza pixel per capire marca e modello, e tantomeno per leggere un numero di targa o riconoscere un volto.
- ChatGPT sa dare risposte notevolmente elaborate dal punto di vista linguistico, perché il cortex caricato è comunque sufficientemente vasto per dargli una notevole precisione linguistica (sintattica e lessicale), in tutte le lingue scritte in rete, ma dal punto di vista semantico sono (tendenzialmente) sono corrette solo le risposte a domande semplici e generali, dove pertanto abbiano caricato abbastanza informazioni per fornire una risposta. Appena si tenta di approfondire, su un qualsiasi specifico campo del sapere, ChatGPT non può che mostrare le sue enormi lacune di apprendimento.
La componente “Goliardica”
- Proprio a causa di queste enormi (e globalmente incolmabili!!) lacune, i developer di OpenAI hanno fatto una vera e propria “Goliardata”: hanno aggiunto una componente software che “inventa” i pezzi mancanti, procedendo per “approssimazioni regressive” fino a diventare, di fatto, casuali (random), in pratica l’hanno programmato come uno studente molto ignorante ma molto furbo, che non risponde mai “non lo so”, ma risponde, con una gran “faccia tosta”, prelevando da quel poco che ha studiato le informazioni più prossime (o che “assomigliano” di più a quelle richieste), inventando di sana pianta i collegamenti e i dettagli mancanti, ma impacchettando il tutto in un eloquio educato e professionale.
- Pertanto, chiunque gli chieda qualcosa su cui non è preparato, facilmente resterà stupito di “quanto ne sappia”. Per questo, in realtà, è stato realizzato e messo online: principalmente per stupire
- Appena però gli si chiede qualsiasi cosa di specifico, dove si è sufficientemente preparati, si noteranno un sacco di banalità, imprecisioni, strafalcioni ed errori grossolani. Tutti sempre esposti con sicurezza ed estrema professionalità ed una inusuale educazione, rispetto ed ossequiosità.
- Pertanto, le due innovazioni più appariscenti di ChatGPT sono: 1) aver caricato un cortex generalista (cioè saper rispondere un po’ a tutto) 2) aver cambiato registro: al posto della classica, fredda, perentoria onestà con cui le macchine ci hanno da sempre spiattellato la loro impossibilità di rispondere (“Error” o “Not found” etc), hanno “umanizzato le risposte”, rendendole al contempo ingannevoli e furba.
- Questo è stato fatto, come dicevo, per stupire: cioè per far sembrare ChatGPT molto più “intelligente” di quello che è, specialmente alle masse, che sono per definizione mediamente ignoranti.
- Tanto il reasoning, quanto la componente “creativo-goliardica” suddetta, fanno uso, per elaborare le risposte, del cortex insieme alle informazioni fornite nella domanda di input, insieme a quelle precedenti della stessa conversazione (che non vengono aggiunte permanentemente al cortex ma vengono in pratica ri-utilizzate ogni volta come parte dell’input). ChatGPT pertanto “sembra” apprendere da noi, imitando quindi ancora meglio lo “studente furbetto” che rielabora la propria risposta usando in modo sagace quanto spregiudicato le informazioni fornite, talora in modo inconsapevole, da chi lo sta interrogando.
- potremmo ben dire pertanto che ChatGPT è più che altro un generatore di “supercazzole”, anche se per alcuni compiti semplici e noiosi io l’ho trovato davvero utile.
- Per i motivi suddetti, se si prova a “supercazzolarlo” a nostra volta, insistendo più volte e con sicurezza che una certa cosa (totalmente inventata) è vera, tendenzialmente riusciremo a fargli confermare qualsiasi castroneria o baggianata, che lui infiorirà con altri dettagli (inventati o meno) e la solita prosa eloquente e cordiale.
I limiti
- Oltre alle grosse limitazioni dovute al cortex, che è vasto ma ben poco dettagliato e approfondito, e fermo al 2021, è bene ricordare che ChatGPT NON ha la possibilità di accedere a Internet e non può quindi fare ulteriori approfondimenti
- Le informazioin fornite dagli utenti “chattando” con ChatGPT, restano nell’area di quell’utente, esattamente come le proprie conversazioni su gmail e whatsapp restano chiuse lì e non vengono mischiate o scambiate con altri utenti. Potranno al limite essere utilizzate per mostrarci l’annuncio pubblicitario più pertinente con i nostri interessi.
- Tali conversazioni NON vanno a integrare il cortex, che nel caso di ChatGPT NON è auto-apprendente come invece lo sono molte altre applicazioni aziendali di AI. Ciò può sembrare controintuitivo, ma questa scelta era inevitabile a causa della mancanza di controlli di validazione, che invece normalmente in applicazioni aziendali esiste
- Infatti, in applicazioni aziendali, ogni utente ha le credenziali per operare solo negli ambiti in cui è stato formato e in cui ha sviluppato una certa esperienza, e comunque sotto la supervisione dei suoi superiori e degli altri colleghi. Quindi, senz’altro vi saranno errori, ma si può presumere che la maggior parte di essi verrà identificata e corretta, quantomeno dietro reclamo del cliente destinatario, e quindi un apprendimento continuo porti sostanzialmente a una evoluzione positiva del cortex.
- La stessa cosa non si può dire nel contesto aperto a tutti in cui opera ChatGPT: qui, un apprendimento continuo porterebbe quasi certamente a una involuzione e degradazione del cortex, a causa del fatto che gli utenti più attivi sono normalmente i più estremi e polarizzati.
Chi l’ha bloccato in Italia e cosa c’entra la privacy?
- Prima di tutto, ChatGPT non è stato bloccato dal Garante italiano, e la privacy non c’entra nulla.
- Il Garante italiano si è mosso in modo bislaccamente minaccioso (chiedendo informazioni e minacciando sin dalla primissima comunicazione una multa di 20M) primariamente in relazione a fake news e rischi di diffamazione: come si riusciva a far rispondere a ChatGPT che la tal persona è un famoso cuoco o architetto o atleta olimpionico (anche se tutto ciò era inventato di sana pianta), si riusciva anche a fargli ammettere che la stessa persona fosse un pericoloso ricercato fuorilegge.
- A quanto ho visto, hanno recentemente e cautelativamente limitato la sua capacità di rispodere in senso diffamatorio.
- Non ho informazioni di prima mano sul motivo per cui OpenAI ha preferito rendere irraggiungibile il servizio per gli utenti italiani, anzichè rispondere al Garante, ma ritengo di poterle dedurre con sufficiente precisione:
- Prima di tutto, non hanno ancora un business model definito (anche perchè non lo si dimentichi, sono ancora una fondazione no profit, anche se l’accordo con Microsoft è alquanto inusuale). Pertanto, non mi risulta abbiano una struttura commerciale e il loro reparto legale non è certo strutturato come quello di un’azienda profit.
- A mio avviso, essendo basati nella Bay Area in California, hanno un bias abbastanza forte sull’Italia, la cui magistratura si è distinta nell’ultimo ventennio per azioni assolutamente bislacche, che ne hanno mostrato da un lato la crassa ignoranza e inadeguatezza, dall’altro la relativa “pericolosità”. Mi riferisco ad esempio a quando un giudice italiano spiccò un mandato d’arresto internazionale per il fantomatico “CEO di Youtube” (che non esiste, essendo Youtube un servizio di Google, non un’azienda a se stante) ritenendo che la piattaforma non era stata abbastanza rapida ad oscurare un video oggettivamente disturbante che era stato pubblicato da minorenni disturbati. Quello e altri casi simili diedero parecchio da fare alla lawfirm di Google, e le lawfirm in USA costano care. Non mi stupisco pertanto che la reazione sia che convenisse “tagliare fuori a piè pari quei perditempo degli italiani”. Fece molto scalpore in California anche l’incredibile e assurda vicenda giudiziaria di Silvio Scaglia in Fastweb, che venne arrestato, incarcerato e messo ai domiciliari per un anno, in piena violazione delle norme di procedura penale che regolano l’arresto cautelare, solo con l’intento (illegale) di costringerlo ad ammettere una truffa IVA di cui lui non sapeva nulla, ma anche molte altre persecuzioni giudiziarie a fini politici. A mio avviso il CSM dovrebbe istituire una commissione di esperti internazionali, per monitorare le potenziali figuracce internazionali della magistratura, perché gli effetti collaterali possono potenzialmente essere molto pesanti per il Paese.
- Non escludo che abbiano inoltre voluto mandare un messaggio implicito alle altre Authority del resto del mondo, specialmente europee: occhio a romperci le scatole, perché non ne abbiamo né tempo, né voglia: se lo fate, vi tagliamo fuori dal nostro progetto.
- Chi vuole bypassare il blocco e continuare a usarlo (senza violare alcuna legge e fare nulla di illegale) basta che installi e usi una qualsiasi VPN (io uso Freedome di F-Secure, basata in Finlandia).
Ma allora ci sei ancora! 🙂
Bell’articolo, molto interessante.
Ps: se hai cambiato numero e vuoi riprendere i contatti, il mio è sempre lo stesso…
Diego