Tesi di Laurea

“Computer Vision”, un passo verso la vita artificiale?

Introduzione

Le motivazioni che spingono gli uomini a compiere determinate azioni non sono sempre chiare agli stessi, la consapevolezza spesso è una dura conquista. A volte le scelte sono casuali; in altri casi, si segue semplicemente la strada già tracciata; più raramente si riesce a valutare e programmare il prosieguo delle azioni che incideranno sulla propria esistenza.

Una premessa così filosofica sembra avere poco a che fare con l'argomento che mi accingo ad affrontare: una nuovo ambito della ricerca applicata denominata “computer vision”¹ e le sue possibili relazioni con altri campi tra cui la vita artificiale. Il termine computer richiama una visione tecnica, matematica, automatica; parlando di vita artificiale il pensiero di molti va ai più recenti film di fantascienza o alle ricerche più avanzate della scienza.

Eppure alcune loro applicazioni sono già entrate nelle nostre case, a volte senza che ce ne si sia resi conto. È sufficiente ricordare, per la prima, un semplice programma per il riconoscimento, tramite scansione elettronica, di testi cartacei e, per la seconda il Tamagochi, quel gioco elettronico, che, simulando un pulcino lasciato alle cure dei bambini, è stato causa delle preoccupazioni di più di qualche genitore.

Diffondere la conoscenza della tecnologia che influenza la nostra vita: questo è il motivo che mi ha spinto e mi spinge a riflettere sull'argomento, a trattare l'ampio tema² del rapporto tra la tecnologia, la scienza e l'uomo.

L'obiettivo di questo lavoro vorrebbe essere di diffondere la conoscenza di alcuni aspetti tecnologici della computer vision, finora riservati a professionalità specialistiche quali ingegneri o programmatori informatici tra un pubblico più ampio, con l'auspicio di suscitare interesse e riflessioni sui possibili sviluppi di questa tecnica e prospettarne i possibili vantaggi^³.

L'opportunità di valutare in anticipo le possibili evoluzioni di una ricerca non è sempre stata a disposizione dell'uomo, anzi, in passato, alcune scoperte sono giunte casualmente (es: il fuoco, la ruota, la polvere da sparo, il nastro adesivo). Tuttavia prevedere il possibile evolversi di alcune ricerche sta divenendo necessario per un efficiente ed efficace, utilizzo delle risorse disponibili e quindi assicurare un futuro migliore per l'uomo e il suo ambiente. Infatti, come dice Antonio Zichichi: “Spazio, Tempo, Massa, Energia e Cariche sono le quantità fondamentali della nostra esistenza nell'Immanente. E sono tutte finite.”^⁴. In tal senso la computer vision può essere sia oggetto di osservazione, sia uno strumento di osservazione per altri fenomeni.

Il tema potrebbe assumere un carattere più generale riferendosi non solo a “come”, e cioè con quali artefatti, si possano tecnicamente raggiungere certi risultati/prodotti che soddisfano i nostri bisogni, ed eventualmente quali siano questi bisogni, ma soprattutto il “perché”, i motivi che ci spingono verso queste mete, e la valutazione di queste mete/bisogni.

E' chiara, fin da queste prime righe, la mia ispirazione a uno dei più conosciuti teorici dei media, Marshall McLuhan, e alle sue riflessioni: “In una cultura come la nostra, abituata da tempo a frazionare e dividere ogni cosa al fine di controllarla, è forse sconcertante sentirsi ricordare che, per quanto riguarda le sue conseguenze pratiche, il medium è il messaggio. Che in altre parole le conseguenze individuali e sociali di ogni medium, cioè di ogni estensione di noi stessi, derivano dalle nuove proporzioni introdotte nelle nostre questioni personali da ognuna di tali estensioni o da ogni nuova tecnologia.”^⁵McLuhan, non sa o non vuole pronunciarsi sulla bontà del processo di estensione della comunicazione^⁶ e lo considera un problema aperto a “....un'ampia gamma di soluzioni. Ma è praticamente impossibile dare una risposta a qualsiasi domanda su tali estensioni dell'uomo senza prenderle tutte in esame nel loro insieme⁷”.

È questo il tipo di approccio necessario per la comprensione di ogni medium, un approccio sistemico, cioè il considerare le interazioni dell'elemento preso in esame con gli altri elementi del sistema. Per comprendere il processo visivo è necessario esaminarlo in relazione agli altri sensi, alla funzione svolta per l'uomo: la funzione percettiva, di relazione con l'ambiente, il mondo, il reale.

Significativa, al riguardo, è una famosa metafora di David Marr, uno dei primi e principali ricercatori a proporre un approccio computazionale nell'ambito delle scienze visive: “Come è impossibile capire il volo di un uccello esaminando solo le penne delle ali, ma è necessario analizzare i vincoli e le limitazioni della gravità al volo e come l'uccello riesca a superarli, così per capire la visione non è sufficiente occuparsi solo della neurofisiologia della visione, ma è necessario individuare una teoria che renda conto delle limitazioni, dei vincoli che si oppongono alla visione e di come è possibile neutralizzarli. Non è sufficiente avere una conoscenza di un solo livello, ma si deve essere capaci di descrivere le risposte dei neuroni, di predire i risultati degli esperimenti di psicologia e di scrivere un programma al calcolatore che analizzi e interpreti gli imput visivi nel modo desiderato”⁸. Tale affermazione si apre a varie interpretazioni come afferma Tomás Maldonado, esperto e critico d'informatica, “una metafora, talvolta, nasconde qualcosa di più che un sapere insufficiente sulle questioni discusse”. In effetti, la visione è sempre stata un argomento che dà luogo a molte controversie; probabilmente, nei suoi pensieri, Marr voleva chiedere collaborazione e convincere i più dubbiosi del fatto che riprodurre la visione è possibile⁹.

McLuhan propone una prospettiva storica, identificando un'era meccanicistica di partenza, caratterizzata dalla frammentazione delle attività umane, per arrivare all'era elettrica, dove vige l'automazione e si ha una ricomposizione dell'uomo sia nei ruoli sia nelle capacità richieste per ricoprirli. Egli individua soprattutto le relazioni tra medium-società-individui, le peculiarità sociali che hanno portato alla realizzazione di un determinato medium, come questo influenzi la collettività e i singoli, le spinte evolutive e le possibili dinamiche. Cercherò in questo mio elaborato di fare un percorso simile, partendo dall'uomo, e dal suo principale senso per l'orientamento e la costruzione della propria immagine del mondo^¹⁰, la vista, al fine di comprendere come le più recenti ricerche tentino di riprodurne automaticamente il processo. Concluderò ipotizzando quali possono essere gli effetti di una tale tecnologia a livello economico, sociale, psicologico, ecc. nella consapevolezza che, tale conclusione, è più un punto di partenza che di arrivo.

È mia intenzione dimostrare, nel più ampio dibattito che riguarda il rapporto uomo-tecnologia, come quest'ultima abbia una valenza positiva (presa di posizione che McLuhan non si è sentito di fare), e, in particolare, come la computer vision, sia necessaria alla nostra stessa sopravvivenza. Cercherò, di convincere, come Marr, anche i più scettici (un esempio di come vi sia timore verso le nuove tecnologie può essere dato da alcune opere cinematografiche anche recenti come Terminator 3).

Per quanto riguarda il metodo, penso di essermi comportato come in tutti i casi in cui si affronta un argomento abbastanza nuovo e poco conosciuto: partendo da una base, ho espanso le mie cognizioni inizialmente a macchia d'olio, successivamente secondo interesse e pertinenza. Il primo spunto è venuto dal testo “Le immagini digitali” di Roberto Marangoni e Marco Geddo^¹¹, dove gli autori dedicano, senza particolari approfondimenti, un capitolo alla computer vision. Intuendo le potenzialità di questa tecnologia ho cercato documenti e informazioni, prima in internet, per semplicità di accesso e reperibilità, poi in biblioteca, per monografie e miscellanee più complete, ritornando a internet per i documenti riguardanti i progetti più recenti. Dal punto di vista comunicativo è interessante notare il fatto che alcuni testi sono in lingua inglese, anche se gli autori sono italiani. Questo prova l'oramai avvenuta affermazione dell'inglese come “lingua ufficiale” in ambito scientifico.

Nel mio procedere ho sempre tenuto presente tre concetti che, penso, sia utile riportare:

“L'aver pensato rettamente non è un merito: statisticamente è quasi inevitabile che tra le molte idee sballate, confuse o banali che gli si presentano alla mente, qualcuna che ve ne sia di perspicua o addirittura geniale; e com'è venuta a lui, può esser certo che sarà venuta pure a qualcun altro.”^¹²questo è quanto afferma Italo Calvino, attraverso il suo personaggio, in Palomar. Di conseguenza ho cercato di documentare il più possibile le mie ipotesi, seguendo le tracce di chi ha già considerato certi argomenti e confrontando le conclusioni con altri autori. Inoltre, dove possibile, ho tentato di comprendere l'influenza esercitata dalla cultura del tempo sulle tesi esposte¹³.
Il “Discorso sul metodo” e sulla morale provvisoria di Cartesio^¹⁴. Per questi il sapere assume la caratteristica del dubbio: per ogni concetto è necessario dimostrare con evidenza che è assolutamente chiaro, privo di qualsiasi confusione con altre nozioni oscure e incerte, quindi inattaccabile da ogni immaginabile dubbio^¹⁵. Come lui e la maggior parte di scienziati e ricercatori, ho incontrato notevoli difficoltà ad applicare quest'atteggiamento: il dubbio e la ricerca di chiarezza richiedono tempi lunghi, forse infiniti. Nel frattempo, per non rimanere immobili, sono necessarie delle regole provvisorie, definite da Cartesio “morale provvisoria”:
1. “La prima era di obbedire alle leggi e ai costumi del mio paese, serbando fede alla religione nella quale Dio mi ha fatto la grazia di essere educato sin dall'infanzia, e regolandomi nel resto secondo opinioni più moderate, lontane da ogni eccesso, e comunemente seguite dalle persone più assennate con le quali dovevo vivere.”^¹⁶
2. “La seconda massima era di esser fermo e risoluto, per quanto potevo, nelle mie azioni, e di seguire anche le opinioni più dubbie, una volta che avessi deciso di accettarle, con la stessa costanza come se fossero le più sicure: imitando in ciò i viaggiatori, i quali, se si trovano smarriti in una foresta, non debbono aggirarsi or di qua e ora di là, e tanto meno fermarsi, ma camminare sempre nella stessa direzione, e non mutarla per deboli ragioni, ancorché, l'abbiano scelta a caso, perché, così, anche se non vanno proprio dove desiderano, arriveranno per lo meno, alla fine, in qualche luogo dove probabilmente si troveranno meglio che nel fitto della boscaglia.”^¹⁷
3. “La mia terza massima fu di vincere sempre piuttosto me stesso che la fortuna, e di voler modificare piuttosto i miei desideri che l'ordine delle cose nel mondo; e in generale di assuefarmi a credere che nulla, all'infuori dei nostri pensieri, è interamente in nostro potere, in modo che, quando abbiam fatto del nostro meglio riguardo alle cose che sono fuori di noi, se qualcosa non ci riesce, vuol dire ch'essa non dipende assolutamente da noi.”^¹⁸
  
  Quindi, nell'impossibilità di una verifica puntuale e completa, terrò per valide le teorie pertinenti più diffuse ed affermate, eventualmente evidenziando le problematiche e le possibili alternative, cercando di evitare contraddizioni e, in fine, che ulteriori approfondimenti potrebbero cambiare quanto esposto.
“Nessuno scienziato pensa in formule” è con questa idea che Einstein e Infeld scrissero “L'evoluzione della fisica. Sviluppo delle idee dai concetti iniziali alla relatività e ai quanti.”, chiaramente con l'obiettivo di diffondere il più possibile la conoscenza della materia. Presumo, inoltre, che essi stessi fossero convinti che, la conoscenza del mondo, avvenisse per ipotesi che debbono necessariamente essere verificate, ponendo così una congiunzione tra il mondo percepito dai nostri sensi e il mondo fisico misurabile con gli strumenti di volta in volta adeguati.

Come loro, è mia intenzione utilizzare un linguaggio accessibile, evitando, la formalizzazione matematica, specificando il significato delle sigle e/o acronimi, e servendomi di termini di uso comune, come consigliato da Tullio De Mauro¹⁹. Questo non significa, tuttavia, che non impiegherò la necessaria terminologia tecnica, nel tentativo di semplificare il messaggio a tutti i costi. Significa che, utilizzerò gli strumenti disponibili (immagini, diagrammi, disposizione visiva del testo, ecc), al fine di rendere comprensibile l'esposizione²⁰, nonché la necessaria ridondanza per una semplice memorizzazione dei concetti e una scorrevole lettura .

1Si usa anche “Machine vision”, ma il termine ha una accezione riguardante le applicazioni industriali, e viene tradotto in italiano con “visione artificiale”, la preferenza da me accordata a “computer vision” è in ragione della sua diffusione e alla generalità della materia cui si riferisce.

2Per la distinzione fra tema e argomento si veda Max Giovagnoli, Come si fa una tesi di laurea con il computer e internet, Milano, Tecniche Nuove, 2003 pp. 18-19

3Questo è quanto avviene normalmente all'interno di un gruppo di lavoro, ossia, uno scambio di conoscenze e competenze tra i membri che lo compongono al fine di giungere a un risultato migliore. La comunicazione viene quindi ad assumere un ruolo essenziale, tanto che spesso per facilitarla sono inserite figure specifiche come il comunicatore. Cfr. G.P. Quaglino, S. Casagrande, A. Castellano, Gruppo di Lavoro Lavoro di Gruppo, Milano, Raffaello Cortina Editore, 1992, p. 109.

4Intrage, L'universo tra scienza e fede, in rete alla URL http://interviste.intrage.it/zichichi/ 03 luglio06

5Marshall McLuhan, Gli strumenti del comunicare, trad. it. di E. Capriolo, Milano, Net, 2002, p. 15. (ed. orig. Understanding Media, 1964).

6Ibidem p. 9

7Ibidem

8Riccardo Valle, Introduzione, in Mente umana, mente artificiale, a cura di Riccardo Valle, Milano, Giangiacomo Feltrinelli, 1989 pp. XI-XII

9Cfr Tomás Maldonado, Critica della ragione informatica, Milano, Giangiacomo Feltrinelli, 2006 p. 170

10Crf. P. Frignani, P. Rizzati, Didattica della comunicazione, Ferrara, Tecom Projet, 2003 pp. 25-26

11Roberto Marangoni, Marco Geddo, Le Immagini digitali, Milano, Hoepli Editore, 2000 pp. 74-77

12Italo Calvino, Palomar, Milano, Arnoldo Mondadori editore, 2003 p. 103

13Riprendendo con ciò la tesi di Paul K. Feyerabend: i fatti non esistono “nudi”, ovvero al di fuori delle teorie, ma solo nell'ambito di determinati “quadri mentali”, in quanto lo scienziato vede solo ciò che questi lo inducono a vedere.
Crf. P. Frignani, P. Rizzati, Didattica della comunicazione, Op. cit. p. 293

14Salvatore Guglielmino, Herman Grosser, Il sistema letterario – Guida alla storia letteraria e all'annalisi testuale – Cinquecento e Seicento Settecento, Milano, G. Principato, 1988 pp. 250-254

15Cfr. Salvatore Guglielmino, Herman Grosser, Il sistema letterario – Guida alla storia letteraria e all'annalisi testuale – Cinquecento e Seicento Settecento, op. cit., p. 250

16Ibidem

17Ibidem

18Ibidem

19 http://www.tulliodemauro.it/default.htm 9 gennaio 2007

20Cfr. Riccardo Fedriga, Il Cittadino Lettore, Milano, Sylvestre Bonnard, 2005 p. 29