Professional Documents
Culture Documents
©2009 Neuroscienze.net
Journal of Neuroscience, Psychology and Cognitive Science
Intelligenza Artificiale
Una breve introduzione
di Enrico Nanni
UN PO' DI STORIA
L'Intelligenza Artificiale nasce ufficialmente negli anni 50 con la redazione di un documento, a
seguito di un seminario tenutosi al Dartmouth College di Hannover, in cui si descriveva il progetto
di poter ricreare l'Intelligenza in un essere artificiale . Il termine stesso, Artificial Intelligence, pare
sia stato coniato da un giovane professore di matematica, John McCarthy, nel tentativo di trovare
un'etichetta accattivante e appetibile per supportare la richiesta dei fondi da destinare
all'organizzazione del seminario che avrebbe dovuto studiare delle tecniche per "riprodurre
l'intelligenza" in un essere non umano. Ecco come suonava tale richiesta: "Proponiamo che uno
studio (di due mesi, con dieci uomini) dell'intelligenza artificiale venga condotto durante l'estate
del 1956 al Dartmouth College di Hannover, New Hampshire. Lo studio procederà sulla base
della congettura che, in linea di principio, ogni aspetto dell'apprendimento o di qualsiasi altra
caratteristica dell'intelligenza possa venir descritto in modo così preciso da mettere una macchina
in grado di simularlo." La richiesta fu finanziata dalla fondazione Rockfeller e il seminario vide la
partecipazione, tra gli altri, di Marvin Minsky, Allen Newell, Herbert Simon. Il progetto non ebbe
risultati consistenti per quanto riguarda la ‘creazione' di macchine intelligenti. Si è trattato
di un coraggioso, pionieristico tentativo, di affrontare un problema forse inaffrontabile allora (e
forse ancora oggi), con le armi dell'impegno e della multidisciplinarità. Facendo un salto di quasi
cinquant'anni, è lecito chiedersi cosa abbia prodotto questa scienza ancora giovanissima, e quali
siano le nuove frontiere della ricerca in quest'ambito. È importante sottolineare che l'IA è
tutt'altro che una disciplina omogenea e ben definita. L'anima originale dell'IA si basa sull'ipotesi
Page 2/6
del sistema fisico di simboli (physical symbol system). Nella definizione degli stessi Newell e
Simon: "un sistema fisico di simboli consiste in un insieme di entità, dette simboli, le quali sono
delle strutture fisiche che possono apparire come componenti di un altro tipo di entità dette
espressioni (o strutture simboliche). Così una struttura simbolica è composta da un certo numero
di esemplari (o token) di simboli che sono fisicamente in relazione tra loro in un certo modo (per
esempio per il fatto che un token si trova accanto ad un altro token). In ogni istante il sistema
conterrà una collezione di queste strutture simboliche. Oltre a queste strutture, il sistema conterrà
anche una collezione di processi che operano sulle espressioni per produrre altre espressioni:
processi di creazione, modifica, riproduzione e distruzione. Un sistema fisico di simboli è una
macchina che produce nel corso del tempo una serie mutevole di strutture simboliche. Questo
sistema esiste in un mondo di oggetti più ampio rispetto a queste espressioni simboliche (Newell e
Simon, 1976). Questa ‘branca' dell'Intelligenza Artificiale (comprendente moltissime
sotto-aree) viene chiamata Intelligenza Artificiale Classica o Simbolica. L'intelligenza Artificiale
Classica comprende sotto di sé numerosi campi di ricerca. Come abbiamo visto il proposito
originario dell' IA era quello di ridurre il ragionamento ad un calcolo, intendendo per calcolo un
qualcosa che abbia una struttura finita e ben definita, e che possa in questo modo essere
implementato su una macchina. Il primo passo è quello di definire cosa intendiamo per
comportamento intelligente. Un comportamento intelligente è un comportamento organizzato, e
quindi complesso. Al di là di questa definizione intuitiva, la Teoria della Commutabilità è in
grado di darci una misura di quanto un problema sia difficile da risolvere. A volte ci rendiamo
conto che le macchine sembrano più intelligenti di noi; una qualsiasi calcolatrice tascabile ha delle
capacità di calcolo che chiunque di noi si sognerebbe di avere. Ma non dobbiamo cedere alla
tentazione: bisogna spostare l'attenzione su che cosa è da considerare intelligente, e che cosa no.
Alan Turing ha proposto un test, da cui emerge una visione operazionale dell'intelligenza: stretto ai
minimi termini, il ragionamento di Turing era che se una macchina è in grado di sostenere una
conversazione con un agente umano via terminale oltre un certo limite di tempo, senza che questi
si accorga che sta comunicando con una macchina, allora la macchina ha un comportamento
intelligente. La macchina in questo caso deve riuscire a derivare una semantica dal linguaggio
naturale, in modo da dare delle risposte adeguate. Uno dei punti cruciali su cui era focalizzata
l'attenzione dell'IA delle origini era l'elaborazione del linguaggio. Ai tempi di Turing era ancora
difficile che una macchina fosse in grado di ‘parlare' con una persona. Anche per questo
l'interazione linguistica poteva plausibilmente rappresentare un buon criterio di valutazione per
l'intelligenza, quanto meno per quella di una macchina. Così nacque Eliza. Eliza, un programma
scritto da Joseph Weizenbaum, è un terapeuta virtuale col quale si poteva (e si può tuttora, io l'ho
scaricato da Internet) dialogare dei propri problemi, ricevendo risposte plausibili per i primi
scambi di battute, ma artificiose e totalmente non-psicologicamente realistiche subito dopo. Eliza
funziona più o meno in questo modo: analizza aree di significato all'interno della frase che viene
immessa nel calcolatore, e dà in uscita risposte in base a regole del tipo "quando ricevo in input la
parola padre ïƒ dare in uscita la risposta "mi parli ancora della sua infanzia" o "mi parli
ancora del rapporto coi suoi genitori". Si tratta di un comportamento non intelligente, ma di tipo
associativo.
Page 3/6
Artificiale ‘soft' in contrapposizione a quella hard.
Page 4/6
associato un peso, sono rappresentate da una matrice i cui elementi sono organizzati, alla fine
dell'apprendimento, in una configurazione ottimale per la risoluzione del problema che la rete deve
affrontare. Se ad esempio la rete deve imparare a separare un set di fotografie in due categorie,
uomini e donne, noi dobbiamo presentarle n volte il corpus di fotografie in cui ad ogni immagine è
associato il nome della classe di appartenenza. Questo è un compito alquanto difficile, dato che la
rete non ha un'informazione esplicita sulle foto che vede, ma deve in un certo modo
‘capire' la regola che sta sotto all'associazione. Una rete neurale artificiale è in grado di
fare questo se riesce a capire le invarianze caratteristiche di ciascuna classe. Addestreremo la rete
finché non produrrà un errore sufficientemente basso; verificheremo se la rete ha imparato a
distinguere tra le due classi presentandole delle foto nuove, di uomini e di donne, che la rete non
ha mai visto, e osservando se ha imparato a categorizzare quindi in modo adeguato i nuovi dati.
Questa è la cosiddetta fase di test. La rappresentazione risiede nella matrice dei pesi associati ai
legami tra le unità e i cambiamenti di rappresentazione sono dati dall'evoluzione di tale matrice.
Dobbiamo notare che la rete è composta da unità relativamente semplici, e che le funzioni
complesse emergono dalle interazioni dei singoli elementi. Nel singolo nodo non c'è niente della
complessità manifestata dal sistema di cui fa parte. Nel caso della capacità di scegliere tra due
categorie in cui mettere una fotografia di una persona, si tratta proprio di una funzione emergente
dalle interazioni reciproche tra i nodi, sotto forma di operazione algebriche che vedremo più da
vicino in una sezione specifica.
Page 5/6
di neuroni, o addirittura singoli nodi, nel riconoscimento di tratti specifici, come linee inclinate,
colori, particolari gradienti di intensità della luce, e così via. Vedremo in dettaglio che sono stati
raggiunti, in molti casi, risultati straordinari.
Bibliografia
Page 6/6