DICEMBRE 2011 | Prima edizione, febbraio 2008 | |||
L'Autrice
|
Editore
|
|
||
A
quali aspetti delle
tecnologie dell'informazione e della comunicazione sono interessati gli
umanisti? Sicuramente al trattamento dell'informazione: ad esempio, i
linguisti e i filologi apprezzano la velocità del computer
nell'elencare e analizzare le concordanze. Il manuale si concentra su due aspetti fondamentali: i metodi di rappresentazione dell'informazione e i metodi di elaborazione dei dati. Sono rispettivamente la seconda parte (da p. 101 a p. 188) e la terza parte (189-256) del volume, che è composto di tre parti. Nella prima sono presentati i concetti-base: che cos'è un algoritmo, un linguaggio di programmazione, una rete di calcolatori, una base dati (database). Per me è un buon ripasso. Nella seconda parte viene spiegato come la (rap)presentazione di un testo su supporto informatico richieda l'utilizzo di un linguaggio di marcatura (cap. 4); un altro caso è l'organizzazione dei contenuti in maniera distribuita: l'ipertesto (cap. 5); ovviamente anche le immagini digitali necessitano di un adeguato trattamento (cap. 9). La terza parte è quella più tecnica. Il cap. 7 ha come oggetto la linguistica computazionale. Scopo di questa disciplina è "acquisire nuova conoscenza dei testi che sia utilizzabile anche dalla macchina in modo automatico" (p. 210). A questo scopo, il computer può aiutare il ricercatore: a) nello studio sull'uso della lingua; b) nell'elaborazione del linguaggio naturale; c) nell'analisi linguistica dei testi. Il cap. 8 non parla di un'attività di ricerca attuale, ma possibile, futuribile: "fare del World Wide Web un luogo in grado di gestire collegamenti semantici" (p. 214). Lo sviluppo del web semantico è uno degli obiettivi del consorzio W3C, presieduto dal fondatore del web, Tim Berners-Lee (che è anche il primo ad aver usato l'espressione web semantico, p. 215). Non è ovviamente il lavoro di un esperto in informatica linguistica, che del Web è solo un utilizzatore finale. Ma il tema è talmente pregnante, data la pervasività che ha assunto il Web nelle nostre vite, che non può essere sottaciuto. Gli esperti in informatica linguistica ragionano su come potrebbe essere il web semantico nel prossimo futuro. I punti critici sono: 1) La ricerca e il recupero di documenti; 2) La ricerca e il recupero di informazioni; 3) La correlazione fra l'informazione disponibile; 4) Il dialogo tra le applicazioni. Il Dublin Core, un progetto per introdurre i metadati nel WWW elaborato nella seconda metà degli anni novanta, ormai è datato. È auspicabile un suo aggiornamento, anzi è necessario, considerata la velocità con cui cambia il web oggi. Posso dire cosa ne penso? Tutte belle idee, per carita, ma la materia è in mano ai gestori dei motori di ricerca. Essi sono pochi, non c'è spazio per entrare ed il loro lavoro è orientato a produrre un reddito. Sono piuttosto critico sull'utilità delle analisi degli esperti in informatica linguistica su quest'ultimo punto. Piuttosto m'interessa come si sta muovendo W3C su questo fronte. Il libro dice che l'obiettivo del consorzio è passare da documenti, cioè contenuti accessibili solo dall'uomo, a dati e informazioni processabili dalla macchina (pag. 225). Berners-Lee, in un suo scritto del 2000 (Semantic Web - XML2000), ha affermato che lo "Universal Resource Identifier" (URI), il linguaggio XML e il meta-linguaggio "Resource Description Frameword" (RDF) sono gli strumenti chiave per la definizione dell'infrastruttura del web semantico. Ne sapremo qualcosa di più negli anni futuri. |