Le home page dei motori di ricerca

I motori di ricerca sono strumenti di comunicazione, veicoli di informazione, media tra chi ha necessità di informazioni e chi possiede queste informazioni ed è disponibile a condividerle e sono strutturati in modo da risultare il più possibile funzionali, fruibili e accattivanti per gli utenti.

È interessante esaminare le home page (le prime pagine) dei siti di ricerca più famosi cercando di capire quali motivazioni abbiano portato a determinate scelte di stile e di usabilità, se queste scelte si dimostrino efficaci e quali limiti mettano eventualmente in evidenza.


di Stefano Cassi (e-mail: scassi@libero.it)

Revisione di Francesca Noceti - Università degli Studi di Ferrara - Carid

7 aprile 2005


Sommario

Capitolo 1 - Brum brum!

Introduzione: obiettivi, limiti, struttura del lavoro

Capitolo 2 - Motori & C.

Gli strumenti per la ricerca in Internet

  1. Motore di ricerca
  2. Classificazione dei motori di ricerca
  3. Il Web profondo

Capitolo 3 - Motoroni e motorini

Quali sono i motori di ricerca più popolari

  1. Classifiche
  2. Profili dei motori di ricerca

Capitolo 4 - Le home page

Esplorazione delle home page scelte

  1. Premessa
  2. Descrizione delle home page

Capitolo 5 - Motorabilità

Chi cerca, trova. Ma come e dove?

  1. Precisazioni
  2. Valutazione di alcuni parametri delle home page
  3. Motori di comunicazione
  4. Un'ultima considerazione. E un appello

Bibliografia


Capitolo 1 - Brum brum!

A chiunque abbia utilizzato Internet per lavoro o per svago, sono sicuramente bastati pochi momenti per accorgersi che la mole delle informazioni accessibili è immensa e che il numero dei documenti pubblicati in rete è molto grande.

Risulta complicato trovare informazioni che siano allo stesso tempo pertinenti rispetto a ciò a cui si è interessati e provenienti da fonti autorevoli e credibili.

Per questo motivo, fin dagli albori di Internet (inizi anni '90), sono stati offerti ai navigatori strumenti per la mappatura e la ricerca delle risorse disponibili.

Man mano che la rete si espande e il numero dei documenti pubblicati aumenta, gli strumenti per la ricerca diventano sempre più importanti per i navigatori di Internet e i siti dedicati a questo servizio diventano business molto proficui per i loro creatori.

Al di là dell'aspetto economico i siti di ricerca, perlomeno quelli più famosi e frequentati, diventano anche di riferimento per le tecnologie impiegate, per le scelte grafiche e di stile adottate e per l'efficacia con cui sanno raggiungere, con la veste e l'impostazione delle pagine, il loro obiettivo: indurre i navigatori a cercare informazioni e convincerli che grazie a loro le troveranno più facilmente e più velocemente.

È interessante esaminare le home page (le prime pagine) dei siti di ricerca più famosi cercando di capire quali motivazioni abbiano portato a determinate scelte e se quelle scelte si dimostrino vincenti o meno.

Come si presenta la prima pagina del sito? Dov'è posizionato, nella pagina, il logo, il nome del motore di ricerca? Dov'è la finestrella per immettere la parola da cercare? Quanto è lunga? Che cosa, di esplicito o di subliminale, induce il visitatore a ripempirla con un termine da cercare? C'è qualche riferimento a quale sia la effettiva porzione di Web esplorata? Vi sono dei link? Quali? Quali sono i colori dominanti? E come...? E cosa...?

Molte discipline e competenze diverse ci vorrebbero per compiere un'analisi esaustiva. Bisognerebbe sapere di usabilità dei siti, di psicologia, dell'effetto dei colori e delle forme sulla psiche di chi naviga, di ergonomia del Web, di Web design, di linguaggio Html e Java, di tipografia, di grafica e di molto altro ancora.

Il mondo di Internet, inoltre, è in continua e velocissima evoluzione e con esso quello degli strumenti di ricerca nel tentativo di restituire risultati sempre più pertinenti e di gestire una porzione sempre più grande dei documenti pubblicati.

Microsoft ha preparato una nuova interfaccia per il suo motore di ricerca (http://www.msn.it/msnsearch/demo/), di Yahoo! si trova già una versione di sola ricerca, dall'interfaccia semplificata ed epurata dei servizi del portale attuale (http://search.yahoo.com/).

Questo lavoro fotografa una piccola porzione di Web in un dato istante di tempo e, al di là delle evoluzioni future che certamente ci saranno, vuole suggerire una maggior consapevolezza nell'uso degli strumenti di ricerca in Internet e soprattutto dei più popolari motori di ricerca.

Il lavoro è così strutturato: dopo una classificazione dei tipi di strumenti di ricerca disponibili in Internet (Capitolo 2), verranno presentati i motori di ricerca presi in esame e la spiegazione dei criteri adottati nella selezione (Capitolo 3); quindi, le home page dei motori di ricerca scelti verranno esplorate, descritte (Capitolo 4) e verranno tratte alcune conclusioni (Capitolo 5).


Sommario


Capitolo 2 - Motori & C.

  1. Motore di ricerca

    Un motore di ricerca è un sito Internet che offre un servizio di selezione delle pagine Web e di ricerca di informazioni in rete ([18.1]). Nati intorno al 1993, i motori di ricerca (in inglese "search engine") costituiscono il principale sistema di accesso alla gigantesca mole delle risorse di Internet.

    L'utente consulta il motore prescelto digitandone l'indirizzo nell'apposita casella del browser (il programma di navigazione), inserisce una o più parole chiave scelte come criterio di ricerca e le sottopone al motore che risponde fornendo una lista di collegamenti a siti più o meno pertinenti.

    Il servizio funziona grazie a un software installato su un server o su un insieme di server e composto essenzialmente da tre programmi.

    Il primo, detto spider (o anche crawler o bot) ha la funzione di percorrere il Web pagina per pagina, di leggere i siti, di memorizzarne l'indirizzo Url e di indicizzarne le parole secondo i criteri adottati dal motore di ricerca.

    Un secondo programma si occupa di creare il database, vale a dire la directory di pagine Web entro cui il motore effettua la selezione quando viene interrogato dall'utente.

    Un terzo programma, infine, media il contatto con l'utente ricevendo i criteri di ricerca, confrontandoli con il database e restituendo il risultato.

    Le pagine selezionate vengono ordinate secondo la loro rilevanza, stimata in base all'occorrenza delle parole chiave nel testo e ad altri parametri statistici, caratteristici del particolare motore di ricerca.

    L'inserimento di un sito nel database di un motore di ricerca si deve al lavoro di selezione del programma spider o, in alternativa, all'intervento diretto di editori che lo registrano manualmente nell'archivio del motore.

    L'indicizzazione delle pagine può avvenire poi in base a due sistemi principali: l'uso dei meta tag o il sistema full text. I meta tag sono parole chiave che gli autori di un sito inseriscono in testa alla home page, non visualizzate dai browser, ma leggibili dagli spider. Il sistema full text consiste invece nell'associazione a un testo di tutte le parole che vi compaiono e nell'attribuzione a queste di un certo peso statistico.

    Ogni motore lancia il proprio programma spider con cadenza periodica, per tenere conto delle evoluzioni a cui sono continuamente soggette le pagine Web, del loro aggiornamento, della creazione di nuovi siti e della cancellazione dei vecchi. Se di una pagina già presente nel database lo spider rinviene una versione più aggiornata, la sostituisce a quella esistente.

  2. Classificazione dei motori di ricerca

    Nonostante si tenda a indicare tutti gli strumenti di ricerca, nel senso più generale, come "motori di ricerca", essi si dividono in almeno tre tipi principali ([1]):

    Tra questi tipi di strumenti vi sono differenze sostanziali, sia in merito al modo in cui le informazioni vengono raccolte e organizzate, sia in merito al modo in cui le informazioni vengono cercate.

    • Indici

      Gli indici organizzano i siti Web in categorie, come per esempio "Arte e cultura", "Sport e tempo libero" o "Istruzione e formazione".

      Questo lavoro di catalogazione è effettuato da persone che esplorano i diversi siti e inseriscono nell'indice quelli che reputano più validi, organizzandoli in categorie.

      La ricerca all'interno di un indice è detta "per soggetto" poiché procede in modo gerarchico, attraverso affinamenti successivi: la scelta di una categoria porta alla visualizzazione delle sue sottocategorie; ripetendo l'operazione con le sottocategorie si ottiene un elenco ancor più dettagliato e così via fino al livello di massimo dettaglio in cui si giunge all'informazione finale.

      Gli indici sono quindi raggruppamenti di informazioni organizzate e selezionate.

      Il risultato della ricerca tramite indice porta alla pagina iniziale di un sito Web (home page). Da quella pagina inizia l'esplorazione di tutte le altre pagine contenute nel sito alla ricerca dell'informazione necessaria.

      L'indice costituisce generalmente un buon punto di partenza per effettuare ricerche quando l'interesse è generico e non mirato e quando i termini di ricerca sono vaghi. Possiamo pensare di utilizzare un indice come si fa con un'enciclopedia o con le pagine gialle.

      Ad esempio, volendo trovare gli osservatori astronomici italiani, possiamo consultare categorie e sottocategorie di un indice fino ad arrivare all'argomento richiesto. Analogamente, se vogliamo trovare delle agenzie di viaggio, possiamo affidarci alla banca dati di un indice.

      La ricerca all'interno di un indice è semplice, poiché avviene attraverso affinamenti successivi e il materiale presente nell'indice è generalmente di buona qualità poiché viene controllato e verificato periodicamente da personale qualificato.

      Per contro, proprio perché la gestione dell'indice è affidata a personale qualificato e non può essere svolta automaticamente da un computer, il numero di siti indicizzati è limitato e anche la frequenza di aggiornamento è relativamente bassa.

    • Motori

      In questi strumenti la ricerca avviene mediante l'indicazione dei termini che si desidera cercare, e per tale motivo questo metodo è anche detto keyword search, ossia ricerca tramite parole chiave. Il risultato a cui si perviene è una lista delle pagine nelle quali sono state trovate le parole indicate (hit list).

      Tutti i motori di ricerca contengono infatti nei loro database un lungo elenco di termini; a ogni termine è associata la lista delle pagine Web in cui compare il termine. In tal modo, digitando una parola nell'apposito riquadro di un motore di ricerca si ottiene un elenco delle pagine residenti sui server Web di tutto il mondo in cui compare tale parola; inoltre, è possibile visualizzare nella finestra del browser ogni singola pagina trovata selezionandone il nome dall'elenco.

      Per aggiornare i propri database d'informazioni, come descritto sopra, i motori di ricerca utilizzano programmi chiamati spider, worm o robot che setacciano Internet analizzando milioni di pagine Web e registrando sia nuove pagine, sia versioni aggiornate di quelle precedenti. Il lavoro di aggiornamento dei dati all'interno del database in cui il motore effettua le ricerche viene svolto automaticamente, senza l'intervento umano.

      Per questo motivo, rispetto agli indici, i motori di ricerca hanno database molto più grandi (indicizzano quindi molte più pagine) e sono aggiornati più frequentemente.

      Per contro, poiché il lavoro di catalogazione delle pagine viene svolto in automatico, è più difficoltoso individuare i documenti che sono effettivamente rilevanti per il proprio scopo: in questo caso la ricerca non è più guidata da una gerarchia di categorie, ma è determinata dalle parole chiave inserite.

      I motori di ricerca sono estremamente utili quando si ha necessità di reperire un gran numero di informazioni e quando si cerca il classico "ago nel pagliaio".

      Quanto più mirate sono le richieste che vengono trasmesse al motore di ricerca, tanto più precisi sono i risultati ottenuti. Per questo motivo quasi tutti i motori mettono a disposizione degli utenti numerose funzionalità quali la possibilità di effettuare ricerche avanzate con più parole chiave contemporaneamente, la ricerca di frasi letterali, la scelta della lingua, la differenziazione tra maiuscolo e minuscolo, tra plurale e singolare e molto altro ancora.

    • Metamotori

      Con i metamotori è possibile svolgere una ricerca su più motori contemporaneamente.

      Questi strumenti infatti non effettuano ricerche in database propri, ma svolgono per conto nostro il compito di consultare diversi motori di ricerca: tale soluzione è comoda quando la richiesta da inoltrare è particolarmente complessa.

      Inevitabilmente non potremo essere molto dettagliati perché i diversi motori possiedono modalità differenti di operare, quindi un metamotore deve utilizzare le funzioni comuni a tutti i motori che interroga.

  3. Il Web profondo

    I motori di ricerca (motori, indici o forme ibride che offrono insieme i risultati di indicizzazioni automatiche e manuali del Web), sono siti il cui intento primario è di consentire agli utenti di trovare informazioni sul Web ([19.5]).

    Con i loro software, i motori di ricerca si pongono il formidabile obiettivo di indicizzare (cioè di catalogare) o perlomeno provare a indicizzare l'intero Web. Tutti i motori di ricerca creano e poi mantengono un proprio enorme database di pagine Web disponibili in Internet.

    Anche i motori di ricerca più grandi e con le tecnologie migliori riescono tuttavia a indicizzare solo una frazione di tutte le pagine Web che raggiungono.

    Ma soprattutto, esistono tipi di documenti che i motori di ricerca non riescono a raggiungere e non riescono a leggere e in particolare ([19.7]):

    • i documenti contenuti in database;
    • altri documenti che i motori di ricerca escludono per scelta dalle loro ricerche.

    Per quel che riguarda i primi, la situazione è che i software dei motori di ricerca (spider e simili) sono progettati per leggere solo le pagine Web cosiddette "statiche", ossia quelle che risiedono sui server in formato Html/Xml.

    Mentre Internet si evolve e cresce, tuttavia, diventa sempre più difficile creare e mantenere siti costituiti da singole pagine statiche a causa delle loro dimensioni (in termini di memoria sui computer) e dei costi che ne conseguono.

    Molti siti Web, quindi, passano a soluzioni diverse e in particolare a quelle che sfruttano dei database per archiviare i dati. I database salvano i dati sotto forma di tabelle generate con programmi appositi quali MS Access, Oracle, Sql Server, DB2 e altri. Da queste tabelle, poi, le pagine Web vengono create dal software "al volo" solo quando viene richiesto da chi sta interrogando il sito. Per questo esse vengono chiamate "dinamiche", per distinguerle da quelle statiche che risiedono nella memoria permanentemente.

    È il database a contenere le informazioni e queste vengono organizzate in forma di pagina Web solo quando il database viene interrogato (attraverso una richiesta, una "query") dall'utente, che è chiamato per questo a compilare un modulo o a compiere una selezione tra diverse opzioni proposte.

    In questi siti (che sono sempre di più, soprattutto tra chi possiede e deve pubblicare grandi quantità di informazioni) non vi sono pagine Web preesistenti (vi sono solo quelle create su richiesta). Non essendovi pagine Web preesistenti, non ci sono aree che i software dei motori di ricerca (spider, crawler, bot) possano indicizzare e catalogare.

    Spider e simili serpeggiano nel Web e indicizzano le pagine che trovano ([19.6]). Quando questi software incontrano un documento non statico, semplicemente essi non sanno che cosa farsene e non sono in grado, automaticamente, di compilare moduli o scegliere tra opzioni. Gli spider possono archiviare l'indirizzo della pagina Web, ma non dare informazioni sui database o i documenti a cui la pagina dà accesso.

    Perché succede questo? I motivi principali sono i limiti tecnologici nel funzionamento di questi software e/o la deliberata decisione da parte dei proprietari dei archivi di informazioni di escludere le loro pagine dall'esplorazione degli spider. Per esempio, molti siti di biblioteche universitarie richiedono un'iscrizione e una password di accesso per la consultazione dei documenti e automaticamente questo esclude la possibilità che i loro dati compaiano tra i risultati proposti dai motori di ricerca.

    Quindi, tutte le informazioni contenute nei database di questi siti risultano invisibili ai motori di ricerca convenzionali.

    Vi sono, poi, documenti volutamente esclusi dagli stessi motori di ricerca, per motivi più o meno tecnici.

    Una prima ragione di esclusione può essere il formato del documento. Il software dei motori di ricerca convenzionali, come detto sopra, è ottimizzato per la gestione di documenti in formato Html, il lunguaggio base del Web. Documenti in altro formato contengono informazioni e formattazioni incompatibili con l'Html. L'Html può contenere i collegamenti a questi documenti, ma non l'informazione completa in quel formato speciale.

    Pagine in formato Pdf (Portable document format), che utilizzano pochissimo o nessun codice Html, documenti creati con i software Flash, Shockwave, e altri programmi come Word, WordPerfect, PowerPoint ecc. sono difficilmente gestibili da parte dei motori di ricerca.

    A onor del vero, alcuni tra i motori di ricerca di ultima generazione stanno lavorando per provvedere a colmare queste lacune. Google, ad esempio, assicura la ricerca dei documenti Pdf o MS Word convertendoli in testo e riscrivendoli poi automaticamente in Html; lo stesso Google e altri motori di ricerca offrono database di immagini strutturati per gestire questo tipo di file.

    Rimangono comunque ancora esclusi molti tipi di documenti non testuali: file multimediali, file grafici, software e altri.

    Un altro motivo di esclusione dai database dei motori di ricerca è che la pagina contenga degli "script", cioè delle linee di codice di programmazione speciali. Gli script possono essere usati per creare e visualizzare le pagine Web. Vengono abitualmente impiegati anche per dare accesso a un database da una pagina Web.

    Quando, nell'indirizzo Url di una pagina Web, si trova un punto interrogativo, ciò significa che in quella pagina viene fatto uso di script.

    Molti motori di ricerca sono strutturati in modo da ignorare i siti e le pagine che includono degli script al loro interno. Non si tratta di un vincolo tecnologico dei motori di ricerca, ma una decisione presa a priori.

    Perché? Gli script, se male compilati, possono mettere in crisi gli spider dei motori di ricerca. Addirittura c'è chi potrebbe compilare degli script con l'intento di intrappolare gli spider in cicli senza fine (una sorta di virus informatico per i motori di ricerca) che ne rallenterebbero l'azione facendo schizzare alle stelle i costi di gestione degli spider.

    Per questo motivo, la maggior parte dei motori di ricerca sono impostati in modo da tralasciare i siti (o le parti dei siti) che contengono dei punti interrogatvi nei loro indirizzi, ossia che contengono script all'interno delle loro pagine Web, indipendentemente dal fatto che questi siano dolosi o innocui. E così molte informazioni vanno perdute.

    Tutte queste informazioni (documenti di database, documenti in formato non Html, documenti con script) costituiscono ciò che è stato indicato come "Web invisibile".

    Per la precisione questa terminologia fu impiegata per la prima volta nel 1994 dallo studioso americano Jill Ellsworth e voleva indicare tutte le informazioni invisibili ai motori di ricerca convenzionali.

    Il termine, però, è successivamente sembrato impreciso in quanto "motore-di-ricerca-centrico". In realtà, infatti, non vi sono informazioni invisibili, ma solo informazioni che sono più difficili da trovare di altre o che si possono trovare con strumenti diversi che non sono i motori convenzionali.

    La società americana Bright Planet (azienda leader in ricerche di informazioni in Internet) ha coniato il termine "Deep Web" (Web profondo) per descrivere il fenomeno dei database in Internet ([19.1]), mentre il Web statico è indicato come "Surface Web" (Web di superficie). Questa terminologia è in effetti più adeguata, in quanto il contenuto dei database è assolutamente visibile se esplorato con gli strumenti di ricerca adatti.

    Il dato soprendente è che, stando alla relazione (ormai datata, essendo del 2001, ma molto accurata e quindi ancora oggi citata ad esempio in [19.5]) messa a disposizione dalla stessa Bright Planet, le pagine alla superficie del Web sarebbero circa un miliardo contro i 550 miliardi di pagine pubblicate in tutta la profondità della rete.

    Nella stessa relazione è riportato che il Web di superficie cresceva (nel 2001) al ritmo di 7,5 milioni di documenti al giorno e quello profondo con un tasso ancora più alto ([19.2]), quindi presumo che questi dati suonerebbero oggi ancora più stupefacenti.

    Come vedremo visitando le home page dei motori di ricerca più popolari, solo Google dichiara esplicitamente il numero di pagine del suo database (otto miliardi e passa), ma si tratta ancora di una piccola porzione dell'intero Web (l'1,5% circa). L'efficacia stessa dei motori di ricerca, dunque, viene messa fortemente in discussione.

    Qualcuno potrebbe chiedersi se sia in fin dei conti importante sapere queste cose. Non sarebbe più semplice accontentarsi di ciò che possiamo trovare con Yahoo! o Google? Forse. Ma, così facendo, si correrebbe innanzitutto il rischio di non trovare ciò che si sta cercando (ad esempio se fa parte di quei tipi di documenti invisibili ai motori di ricerca convenzionali) e, anche nel caso si trovassero dei risultati, rimarrebbe il dubbio che ne esistano di più rilevanti.

    Pensiamo al Web come a una grande biblioteca ([19.6]). Non ci si aspetta di entrare dalla porta principale e trovarsi immediatamente davanti il libro sulla storia delle puntine da disegno che si cercava, no? Fuor di metafora, è per questo motivo che potremmo trovare nel Web profondo ciò che non abbiamo trovato con i motori di ricerca.

    Già, ma come si può cercare nel Web profondo se i motori di ricerca più popolari sono inefficaci? Fortunatamente, altri si sono fatti questa domanda e qualcuno ha risposto con la creazione di siti dedicati all'esplorazione del Web profondo.

    Contengono elenchi di database di informazioni consultabili gratuitamente in Internet o anche software per la ricerca in database. Tutti gli articoli sul Web profondo citati nella bibliografia ([19]) contengono collegamenti a queste risorse e permettono, quindi, di ampliare notevolmente il nostro raggio di azione.


Sommario


Capitolo 3 - Motoroni e motorini

  1. Classifiche

    In Internet sono segnalati, tra indici e motori generalisti e specializzati (ovvero dedicati a un particolare argomento, come il cinema o i libri), più di tremila strumenti di ricerca ([2.1], [6], [8] e [9]).

    Per il presente lavoro è stata fatta una scelta di campioni ritenuti significativi in base a risultati di popolarità e di successo. In breve: sono stati scelti i motori di ricerca più visitati di Internet, prendendo come aree di riferimento gli Stati Uniti e l'Italia.

    Una classifica dei siti più visitati in Usa (aggiornata a marzo 2004) e in Italia (dicembre 2004), è disponibile su MotoriDiRicerca.IT ([4.2]) e fornisce il seguente quadro:

    Usa (03/04)Pos.Italia (12/04)Pos.
    Yahoo!1a Google1a
    Time Warner Network (Aol)2aLibero2a
    Msn3aVirgilio3a
    Google5aMsn4a
    Siti più visitati in Usa e Italia (fonte: MotoriDiRicerca.IT)

    Analoghe classifiche (ma complete dell'andamento durante tutto l'anno 2004) sono riportate dal sito Linkness ([10.1 e 10.2]) che a sua volta attinge da Audiweb e Comscore rispettivamente per Italia e Usa.

    Come si nota, le indicazioni sono allineate alle precedenti: primi posti per Yahoo!, Time Warner Network (Aol), Msn e Google in Usa; Google, Libero, Virgilio e Msn in Italia.

    Motori di ricerca più visitati nel 2004 in Usa (fonte: Comscore)


    Motori di ricerca più visitati nel 2004 in Italia (fonte: Audiweb)

    A precisazione di questi risultati, occorre aggiungere qualche nota:

    • le classifiche dei siti più visitati sono un po' fuorvianti nel caso di portali (tra cui gli stessi Aol, Msn o Virgilio): non è chiaro se i visitatori accedano al portale per lo strumento di ricerca associato o per fruire di altri servizi;

    • l'importanza in assoluto dei motori di ricerca citati, tuttavia, è confermata anche da altre fonti (si vedano ad esempio per gli Usa i recenti articoli in [15]);

    • alla luce di tutto questo, manterrò come criterio di scelta quello delle migliori posizioni nelle classifiche dei motori o delle Web property cui appartengono (per Web property intendo l'aggregazione dei siti di proprietà di una stessa società), a rischio di tralasciare alcuni motori emergenti, ma non ancora consolidati (ad esempio Ask Jeeves - http://www.askjeeves.com/, citato come emergente sia in [3.1] che in [4.1] che negli stessi [15]).

    Considererò, dunque, Yahoo!, Aol Search (motore di ricerca del portale Aol), Msn Search (motore di ricerca del portale Msn), Google, Arianna (motore di ricerca del portale Libero) e Virgilio ([11]).

    Prima di esplorare le loro home page, ne traccerò un breve profilo ([3.1], [4.3 - 4.7] e [12.1 - 12.6]) .

  2. Profili dei motori di ricerca

    • Yahoo!
      (http://www.yahoo.com/)

      L'idea venne a due studenti di ingegneria elettrica dell'università di Stanford, David Filo e Jerry Yang, che verso la fine del 1993 decisero di impegnarsi nel catalogare efficacemente la loro lista di bookmark, ossia i link ai siti Internet da loro ritenuti più interessanti. Si trattava di circa 200 siti.

      Svilupparono così quello che possiamo definire il prototipo di Yahoo!, una lista di collegamenti suddivisa per categorie con la descrizione di ogni sito e la chiamarono "Jerry and David's Guide to the World Wide Web".

      Quando pubblicarono on line questo archivio, furono sommersi di richieste di catalogazione di siti e così decisero di tentare di catalogare l'intero Web, al ritmo di 1.000 pagine al giorno. Quando una categoria diventava troppo grande, creavano delle sottocategorie.

      La tentazione di utilizzare programmi che catalogassero in modo automatico i siti fu molto forte, ma continuarono a svolgere questo lavoro manualmente; una scelta che è stata probabilmente determinante per il successo di Yahoo! e ha permesso di sviluppare un archivio completo e ben strutturato.

      Nell'autunno del 1994, Yahoo! raggiungeva il notevole risultato di un milione di visite al giorno da parte di almeno centomila visitatori diversi.

      Nel 2002 Yahoo! fece il suo grande passo nel mondo della ricerca automatica (o motorizzata) basandosi sulla tecnologia di Google fino al febbraio del 2004 e successivamente su un software proprietario.

      Il direttorio Yahoo!, comunque, retaggio del progetto originale, è sopravvissuto e lo si può consultare all'indirizzo http://dir.yahoo.com/.

      Una curiosità: il nome Yahoo! è acronimo di "Yet Another Hierarchical Officious Oracle" (Ancora un Altro Ufficioso Oracolo Gerarchico), anche se Filo e Yang sostengono di aver scelto questo nome più che altro per come onomatopeicamente suona un "yahoo": "immediato, schietto, non sofisticato".

    • Aol Search
      (http://search.aol.com/)

      Aol (acronimo di America On Line) fornisce agli utenti liste editoriali ricavate dagli indici compilati automaticamente di Google. Dunque, la medesima ricerca effettuata con Google e con Aol darà risultati molto simili.

      Aol mette a disposizione due tipi di ricerca: quella "interna" (http://aolsearch.aol.com/) restituisce anche risultati esclusivi del direttorio Aol; quella "esterna" (http://search.aol.com/) omette questi risultati.

      Nel 2000 il colosso dei media Time Warner e il gigante Internet America On Line si sono uniti in un'unica compagnia, la Aol Time Warner.

    • Msn Search
      (http://search.msn.com/)

      L'acronimo Msn sta per "Microsoft Network" e l'omonimo sito voleva essere un'alternativa a Internet per scalzare la leadership di servizi on line come Aol. Sfumate le velleità iniziali, Microsoft ha ripensato Msn in linea con la tendenza dei servizi Internet, ossia quella dei cosiddetti portali.

      Msn Search, oltre a essere un motore di ricerca, è un contenitore di collegamenti verso i servizi Microsoft. Nella videata iniziale c'è la classica barra per inserire i termini di ricerca, ma l'obiettivo è anche quello di fungere da raccordo tra le sorgenti informative di casa Microsoft, e mettere un po' di ordine tra i mille rivoli del progetto originario.

      Del motore Msn Search si iniziò a parlare all'inizio del 1997. Microsoft prevedeva la nascita di un motore di ricerca classico, basato su una tecnologia sviluppata internamente. A novembre 1997 ci fu l'annuncio ufficiale che il motore si sarebbe invece appoggiato a una tecnologia esterna. Solo dal primo febbraio del 2005, si parla di una tecnologia proprietaria che promette di fornire un accesso migliorato alle informazioni e risposte più precise alle domande.

    • Google
      (http://www.google.com/)

      Anche Google vide i natali all'Università di Stanford e precisamente si sviluppò da un progetto degli studenti Larry Page e Sergey Brin chiamato BackRub. Dal 1998 il nome fu cambiato in Google e il progetto uscì dal campus universitario e si trasformò in una società privata.

      Il servizio completamente automatizzato fornito da Google attraverso il suo motore assicura un'ottima copertura della rete unitamente a un'ottima rilevanza dei risultati prodotti.

      Il punto di forza di Google è quello di selezionare i risultati di ricerca valutando l'importanza di ogni pagina Web con metodi matematici, in base ad un controllo di oltre cinquecento milioni di variabili e di due miliardi di termini. Questa tecnologia, denominata "PageRank", controlla non solo il contenuto della pagina Web, ma verifica anche altri eventuali siti che hanno un collegamento verso la pagina: in base alla quantità ed al tipo di link, la pagina riceve una valutazione più o meno alta secondo la logica che qualcosa di molto citato dovrebbe essere rilevante.

      Altre caratteristiche di Google sono la sua velocità di esecuzione, con un tempo medio dichiarato per ogni ricerca di 0,29 secondi, e la grandezza del suo archivio che, stando a quanto dichiarato sul sito, ha oltre otto miliardi di pagine censite.

      "Googol" è il termine matematico per indicare un uno seguito da cento zeri. Il termine fu coniato da Milton Sirotta, nipote del matematico americano Edward Kasner, ed è stato diffuso nel libro "Mathematics and the Imagination" di Kasner e James Newman. L'uso del termine da parte di Google riflette la missione dell'azienda, volta a organizzare l'immensa quantità di informazioni disponibili sul Web.

    • Arianna
      (http://www.arianna.it/)

      Il nome è quello della mitica figlia di Minosse re di Creta. Usando il famoso stratagemma del filo, riuscì a far ritrovare all'amato Teseo l'uscita del labirinto in cui questi era stato introdotto in sacrificio al mostro Minotauro. Arianna, dunque, saprebbe indicare il giusto percorso per la meta.

      Il motore di ricerca Arianna venne creato nel 1996 come servizio di ricerca di Italia On Line, uno dei maggiori fornitori di accesso a Internet del nostro paese. Nel 1998, Italia On Line è acquistata da Infostrada S.p.A. che a sua volta, nel 2002, viene acquisita da Wind S.p.A. Prende il via Libero, il portale che riunisce i mondi di Italia On Line (Arianna compreso) e Inwind. Nel 2003 i servizi di ricerca del portale sono ribattezzati Libero Ricerca.

      La spina dorsale rimane comunque Arianna che amplia le sue performance grazie a tre diverse tecnologie: analisi testuale, polarità dei link e analisi del linguaggio. Libero Ricerca introduce anche il servizio di ricerca Web testuale attraverso Google.

      La missione di Arianna, che si mantiene al di là del cambio di ragione sociale, è quella di essere il principale motore di ricerca specializzato nel censire i siti in lingua italiana.

      Una funzionalità esclusiva di Arianna (già presente in alcuni motori di ricerca, ma solo per la lingua inglese) è quella di catalogare le pagine secondo la sintassi della lingua italiana. Questo significa che nell'eseguire le ricerche, Arianna considera le variabili dei temini (singolari e plurali, maschili e femminili), le declinazioni dei verbi e applica un filtro alle cosiddette "stop words", ossia gli articoli, le preposizioni, ecc. In termini pratici, se un utente cerca la frase "motore di ricerca", Arianna effettua un'analisi considerando anche i termini "motori", "ricerche" e ignorando il termine "di".

      Uno degli aspetti su cui punta Arianna, è l'attendibilità dei dati censiti, sia dal punto di vista qualitativo che quantitativo. Per fare ciò, un programma realizzato con tecnologia sviluppata in Italia, cerca automaticamente le pagine Web in lingua italiana e le controlla ad intervalli regolari, così da mantenere aggiornato il database, scartando le pagine non più disponibili. Nel contempo, la procedura aggiunge all'archivio principale le pagine non ancora censite, provvedendo a risalire a tutti gli altri documenti che fanno capo o sono conseguenti alla pagina in esame.

    • Virgilio
      (http://www.virgilio.it/)

      Il nome riprende quello del poeta latino posto da Dante a guida del suo viaggio in Inferno e Purgatorio. Virgilio ti guida, ti fa trovare la via.

      Il motore di ricerca Virgilio, appartenente al gruppo Telecom Italia Media, ha tutti i numeri per risultare una delle più importanti guide Internet. Censisce migliaia di siti italiani con l'aggiunta di siti nuovi ogni giorno e offre una vastissima gamma di servizi funzionali e di orientamento.

      Il cuore di Virgilio è la sua directory, un elenco di siti suddiviso in base alla loro tipologia, e strutturato in macro categorie a loro volta distinte in gruppi più analitici.

      La registrazione dei siti è effettuata manualmente da uno staff interno a Virgilio e ciò permette una classificazione efficiente e coerente con la suddivisione in categorie. Sono censiti solo i siti in lingua italiana, con esclusione di quelli i cui contenuti sono ritenuti non idonei.


Sommario


Capitolo 4 - Le home page

  1. Premessa

    In questo capitolo esplorerò le home page dei motori di ricerca scelti nel capitolo precedente e cercherò di metterne in evidenza i punti di forza e di debolezza.

    Per le immagini delle home page, ho adottato questo metodo: ho inserito nella finestrella di ricerca la parola "Supercalifragilisticoespiralidoso" (che ho scelto per la sua lunghezza di 33 caratteri) e ho scattato l'istantanea della home page a pieno schermo (usavo un computer con schermo da quindici pollici, lo stesso per tutte le istantanee).

    Per i motori di ricerca stranieri ho scattato un'istantanea anche della pagina italiana, così da annotare, qualora ve ne fossero, eventuali differenze oltre alla lingua.

  2. Descrizione delle home page

    Le home page considerate sono quelle di Yahoo!, Aol Search, Msn Search, Google, Arianna e Virgilio.

    • Yahoo!
      (http://www.yahoo.com)

      La prima pagina di Yahoo! si propone come un vero e proprio portale ricchissimo di servizi e di informazioni.

      CLICK PER INGRANDIRE
      Home page di Yahoo!

      Il logo rosso campeggia in alto al centro e trasmette immediatamente accoglienza e simpatia. Ai suoi lati le icone (figurine divertenti, forse un po' kitsch: un guantone da baseball, due note, una faccina che ride) collegano ad alcuni dei servizi proposti dal portale: finanza, musica, posta elettronica ecc.

      Nel resto della pagina, sullo sfondo bianco, i colori dominanti sono l'azzurro e il blu (usato per i testi) mentre un certo magenta fa capolino qua e là nelle intestazioni.

      Subito sotto il logo, al centro, su sfondo azzurrino, la finestrella per inserire i termini da cercare. È molto lunga, la parola inserita viene visualizzata per intero e s'avanza spazio in abbondanza. Per la precisione, scorrendo il codice Html della pagina, scopro che recita: "input type=text size=42 name=p id=fp" e i manuali di Html ([16]) mi insegnano che ciò significa che la finestrella si estende per 42 caratteri.

      Viene così rispettata una delle regole dell'usabilità in generale ([13.3 e 13.4]): bisogna evitare che la frase da cercare scorra verso sinistra durante la digitazione scomparendo dalla vista in quanto risulta scomodo per l'utente.

      A destra della finestrella, il tasto per l'avvio della ricerca che contiene non il semplice testo "Search" (Cerca), bensì "Yahoo! Search" e ci ricorda che stiamo usando un software di proprietà Yahoo!

      Appena sopra la finestrella, in forma di testo, i possibili ambiti della ricerca: siti Web oppure immagini, video, notizie. Da notare la presenza della voce "Directory" che consente di cercare nel famoso catalogo Yahoo!, progetto originale di questo strumento di ricerca. Quasi a dire: "Ci lasciamo il passato dietro, ma non lo rinneghiamo!".

      Una particolarità interessante è che cliccando sulle voci di ricerca disponibili non si aprono nuove finestre (come accade invece in tutti gli altri motori esaminati), ma cambia solo il riquadro intorno alla finestrella di ricerca (cambiano colore e scritte), il resto della pagina rimane uguale, il tempo di ricarica della pagina è ridotto al minimo. Un espediente molto ingegnoso e certamente degno di un sito all'avanguardia.

      Appena sotto, in un riquadro a sfondo azzurro più chiaro, un elenco di alcuni dei molti servizi offerti dal portale.

      Molto più sotto, fuori campo, anch'essi inclusi in un box azzurrino (ma più piccolo del precedente), i collegamenti ad alcune delle categorie del direttorio Yahoo! (collegano direttamente a http://dir.yahoo.com/).

      E poi tutto intorno e giù, giù fino a fondo pagina un proliferare di banner pubblicitari, collegamenti, news, foto, citazioni, riferimenti, informazioni, servizi, siti, superofferte, attività e chi più ne ha più ne metta!

      Questo è lo stile Yahoo!, lo dice il nome stesso. Mi ricordo della definizione degli autori: "immediato, schietto, non sofisticato".

      Un paio di note ancora.

      Innanzitutto la home page di Yahoo! è molto lunga, non viene visualizzata per intero alla prima schermata e bisogna scorrerla con la barra verticale per vederne la fine. I manuali di Web design ([14.1]) dicono che la home page è come la prima pagina di un giornale: nell'impaginato, ciò che sta "sopra la piega" della pagina è più visibile e balza all'occhio del lettore anche quando il giornale è ripiegato.

      Le voci e i servizi lasciati nella prima parte immediatamente visibile della home page sono quanto gli autori reputano più importante e più interessante per i visitatori.

      I collegamenti diretti alle categorie sono nella perte fuori campo della pagina e forse è indicativo del fatto che Yahoo! vuole sempre più promuovere il suo motore di ricerca automatico rispetto all'originale direttorio (ma non dimentichiamo il collegamento a "Directory" proprio sopra la finestrella!).

      Secondariamente, è interessante notare dove la pagina italiana si distingue da quella americana.

      CLICK PER INGRANDIRE
      Home page di Yahoo! Italia

      Il tasto per l'avvio della ricerca ora contiene solo il testo "Cerca", Yahoo! è scomparso.

      Tra le icone ai lati del titolo, quelle di destra (Mail, MyYahoo! e Messenger) sono le stesse, quelle di sinistra sono diverse: finanza in italiano diventa shopping e il guantone da baseball un dado da gioco.

      La finestra del meteo, poi, collocata per gli americani in basso a destra, in Italia è stata sostituita con la finestra dedicata allo sport (e al momento della mia istantanea comprendeva la foto di un calciatore in azione).

      Infine, un particolare su cui vale la pena di aprire un inciso: nella pagina italiana è inclusa la possibilità di cercare le sole pagine in italiano.

      Mi chiedo: perché non è prevista l'opzione "Cerca pagine in inglese" per gli americani come in generale "Cerca pagine nella mia lingua" per ogni Yahoo! nel mondo?

      Probabilmente i curatori del sito hanno ritenuto che, essendo la maggior parte dei documenti pubblicati in Internet in lingua inglese, l'opzione di selezione delle pagine non fosse necessaria per questa lingua come invece per altre meno diffuse sul Web (come appunto l'italiano).

    • Aol Search
      (http://search.aol.com)

      Con la home page di Aol Search, com'era prevedibile, mi trovo di fronte a qualcosa di completamente diverso non foss'altro perchè qui non si tratta di un portale, bensì del servizio di un portale.

      CLICK PER INGRANDIRE
      Home page di Aol Search

      La pagina appare a prima vista molto più semplice di quella di Yahoo!. Il logo è posizionato anche qui in alto al centro. Una lente di ingrandimento stilizzata tranquillizza sull'efficacia del servizio di ricerca offerto. La precisazione, poi, che il sito è Aol "Search", lascia intendere che questo sia solo un servizio, per l'appunto, di un portale più grande e più ricco.

      Lo sfondo è bianco, i colori dominanti, per inserti grafici e testi, verde e blu.

      La finestrella di ricerca è messa bene in evidenza, isolata subito sotto il logo e con una sottile cornice grigia.

      È molto estesa (dal codice non si capisce quanto, ma almeno come quella di Yahoo!) e il tasto "Search", grande, di un bel verde brillante sfumato, è accattivante, invoglia a premerlo.

      Sotto la finestrella, in forma di testo, i possibili ambiti di ricerca: Web, immagini, notizie ecc. suddivisi, come si faceva un tempo, dal semplice segno tipografico dell'asticella, "|", il buon vecchio "pipe" (unico caso tra quelli qui considerati, gli altri adottano tutti solo gli spazi oppure soluzioni grafiche più sofisticate).

      Durante la visita mi accorgo che la semplicità della pagina è solo apparente. In realtà le funzionalità aggiunte alla mera ricerca sono tante, anche se non tutte propriamente funzionali.

      Vengono ad esempio visualizzati, in due box sulla destra, le ultime ricerche effettuate e i termini più cercati recentemente dagli utenti (la lista viene aggiornata ogni 12 secondi).

      La finestrella stessa si presenta con un menu a tendina (è visibile la freccina sulla destra) che propone le ultime parole cercate (vengono mantenute in memoria anche quelle delle visite precedenti). Questa complicazione, pur tecnicamente evoluta, non risulta particolarmente felice: è ridondante rispetto all'elenco delle ricerche recenti riportato appena sotto e potrebbe dare problemi di accessibilità a utenti disabili (non vedenti).

      A sinistra in basso c'è anche il rimando al direttorio Aol, cioè a categorie compilate manualmente e impaginate da editori.

      A pié di pagina, infine, i collegamenti ad altri servizi Aol come mappe o pagine gialle.

    • Msn Search
      (http://search.msn.com)

      La home page di Msn Search (che come precisa il nome è solo un servizio del portale Msn) ha un'impaginazione originale rispetto alle altre qui considerate.

      CLICK PER INGRANDIRE
      Home page di Msn Search

      È stato creato un riquadro (con cornice grigia) a sfondo celeste sfumato, posizionato nella parte più visibile in assoluto della pagina (quindi al centro in alto, ma a una certa distanza dal bordo superiore). Una piccola pagina nella pagina.

      Nel riquadro sono stati collocati il logo e la finestrella per la ricerca (che entrambi spiccano bianchi in contrasto sullo sfondo) con i relativi collegamenti accessori (Web, immagini, notizie ecc.), ancora una volta in formato testo.

      Logo e finestrella non sono messi a caso o uniformemente nel riquadro, bensì ammassati in basso a sinistra. Un probabile espediente per attirare l'attenzione dei visitatori: tutte le linee di fuga della pagina tendono alla finestrella di ricerca e vi focalizzano l'attenzione dell'utente.

      Anche qui il tasto "Search" è verde brillante e dotato di un menu a tendina che però ora propone gli ambiti possibili della ricerca (Web oppure immagini oppure notizie ecc.). Soluzione ancora una volta ridondante rispetto agli stessi collegamenti riportati anche in formato testo e inoltre poco accessibile.

      Sopra e sotto, infine, i collegamenti d'obbligo ai servizi Microsoft: Encarta, Hotmail, Messenger... I testi sono in vari colori, dal grigio all'azzurro al blu, ma sempre molto leggibili.

      Attenzione! Contrariamente agli altri motori esaminati, Msn Search offre una finestrella relativamente corta: la parola inserita esce verso destra. Dal codice della pagina ("input id="q" size="20" value="" name="q"") vedo che la finestrella è lunga solo 20 caratteri. Si tratta di un'altra scelta controcorrente, peraltro abbandonata nella home page del portale Msn (dove la finestra di ricerca è ben più lunga) e, dunque, un po' incomprensibile.

      È pur vero che, stando alle statistiche di chi si occupa di usabilità ([13.4]), la lunghezza media, in parole, delle ricerche effettuate in Internet è 2,0, quindi anche la finestrella di Msn Search potrebbe risultare adatta.

      La home page italiana è di scarso interesse in quanto è pressoché identica a quella americana. La riporto comunque.

      CLICK PER INGRANDIRE
      Home page di Msn Search Italia

      Rispetto alla home page in iglese, mancano solo alcune funzioni, come la ricerca "Desktop" e l'opzione "Near Me". E ritorna la possibilità di cercare pagine in italiano o provenienti dall'Italia.

    • Google
      (http://www.google.com)

      Google è da sempre specializzato nella pura ricerca in Internet attraverso un motore completamente automatico basato su sofisticati algoritmi di programmazione.

      E ogni scelta fatta nella sua home page è una espicita dichiarazione del suo profilo.

      CLICK PER INGRANDIRE
      Home page di Google

      Il design è purissimo, asettico. La pagina è perfettamente simmetrica, eccezion fatta per i collegamenti alla ricerca avanzata e agli strumenti per le lingue sulla destra e la simmetria accentua ancora di più la matematicità dell'insieme.

      Lo sfondo bianco ospita il minimo indispensabile di elementi grafici. I testi sono in nero o blu scuro. Al centro in alto domina il logo Google, unica nota di colore. Ma anche i colori del logo paiono disposti con regolarità matematica: due blu, due rossi, un verde, un giallo. L'ombreggiatura che la scritta riflette sullo sfondo enfatizza la leggerezza e il distacco dalla pagina.

      Celeberrima, ormai, la trovata di modificare il logo in occasione di ricorrenze importanti (l'inizio dell'anno o l'anniversario di qualche personaggio o di qualche scoperta famosi). Il logo diventa mezzo di comunicazione e attesta l'aggiornamento supertempestivo del sito e la sua attenzione in tempo reale al mondo esterno.

      Questo espediente serve di certo anche a movimentare un po' la pagina che altrimenti sarebbe praticamente sempre uguale a se stessa.

      CLICK PER INGRANDIRE
      Home page di Google con logotipo speciale dedicato a Van Gogh

      Appena sotto il logo si trova la finestra di ricerca: è lunghissima, il codice della pagina ("input maxLength=256 size=55 name=q value=""") ci dice che ha una lunghezza di ben 55 caratteri! I tasti per la ricerca non sono sulla destra, ma sotto e sono due.

      Il primo, quello cui siamo abituati, è stranamente sulla sinistra e contiene il testo "Google Search" ricordandoci, come avveniva per Yahoo!, che stiamo usufruendo di un software di proprietà del sito.

      Accanto a questo tasto, ce n'è un altro che recita "I'm Feeling Lucky", "Mi sento fortunato" e che collega direttamente al primo risultato della ricerca effettuata. Google è confidente che il primo risultato delle sue ricerche sia, nella maggior parte dei casi, quello cercato dall'utente.

      Questo secondo tasto, insieme al logo colorato e cangiante, serve anche per stemperare la seriosità di questa home page. Fa sembrare ogni ricerca un gioco, un'avventura. Il collegarsi alla cieca a un sito senza sapere quale sia dà carattere ludico all'operazione e ti invoglia a ripetere l'esperienza.

      Intorno alla finestra, in forma di testo come pare essere d'uso assodato, gli ambiti della ricerca e molti collegamenti a servizi aggiuntivi, ma tutti di ricerca: per lo shopping, per ricerche ristrette a una particolare area geografica, per ricerche in ambito educativo e scolastico ecc.

      Da notare il collegamento a Google Italia: compare, presumo, perché in qualche modo viene rilevata automaticamente la provenienza geografica di chi è collegato e gli viene proposta la versione locale del sito. È l'unica home page, tra quelle visitate, in cui viene implementato questo espediente.

      Chiude la pagina il monito "Searching 8,058,044,651 web pages": il numero delle pagine attualmente censite, più di otto miliardi. Non viene indicato il numero totale delle pagine esistenti.

      La pagina italiana è praticamente uguale a quella americana.

      CLICK PER INGRANDIRE
      Home page di Google Italia

      Per la precisione, il design è identico.

      Cambiano alcuni collegamenti e in particolare: è inclusa anche da Google la possibilità di cercare pagine in lingua italiana o provenienti dall'Italia e, tra le ricerche possibili, c'è anche quella nel direttorio di categorie dell'Open Directory Project (http://dmoz.org/), l'indice che usa editori volontari per catalogare tutto il Web (il collegamento non c'è per gli americani). Il collegamento a Google Italia si è poi trasformato in quello al Google americano.

      Infine, il tasto per l'avvio della ricerca (quello di sinistra) riporta, come nella versione americana, il testo "Cerca con Google" e non semplicemente "Cerca".

    • Arianna
      (http://www.arianna.it)

      Il sito di Arianna non esiste più! È stato completamente fagocitato e digerito dal portale Libero che ora ci ritroviamo davanti quando digitiamo l'indirizzo "http://www.arianna.it".

      CLICK PER INGRANDIRE
      Home page di Arianna (Libero)

      Il nome Arianna non si legge da nessuna parte. Lo sfondo della pagina è giallino e ospita in bella fila in alto le icone di collegamento ai vari servizi del portale (posta elettronica, comunità ecc.) tra i quali c'è quello di ricerca che sto visitando. Tra le scritte dominano il blu e il nero.

      Il logo è posizionato in alto a sinistra e subito sotto un riquadro bianco che contiene la finestrella (lunga 40 caratteri, come indica il codice: "input type="text" name="query" size="40" style="width:405px"", anche se sembra più lunga perchè visualizzata con larghezza di 405 pixel) con tasto arancione alla sua destra e una quantità di opzioni di ricerca possibili: a parte i soliti ambiti (Web, immagini, audio ecc.), anche mappe, aziende e altro.

      Ritorna anche l'opzione "Pagine in italiano" o "Provenienti dall'Italia" (vedi le osservazioni alla fine della sezione dedicata a Yahoo!), nonostante ora si tratti di un motore di ricerca tutto italiano.

      Più sotto altri riquadri rimandano a ulteriori possibili ricerche (rassegne di notizie o shopping) e ad altri siti del gruppo aziendale cui Libero (e quindi Arianna) appartiene.

      Interessante l'indicazione (proprio sotto il titolo "Ricerca") che il meccanismo è "Enhanced", cioè rinforzato, da Google. Ma allora, che c'entra Arianna?

      La poverina (Arianna) è finita nella pagina "secondaria" cui si accede cliccando su "Directory": ecco le categorie in bella fila, ecco finalmente la nota "Powered by Arianna"!

      CLICK PER INGRANDIRE
      Home page del direttorio Arianna

      E al mito greco da cui l'idea iniziale del sito trasse nome e ispirazione, il mito di Arianna, del labirinto e del Minotauro, nessun benché minimo richiamo, nemmeno, come mi sarei atteso, iconografico. Peccato.

      Un'ultima nota, che varrà pure per Virglio: il tasto "Search", "Cerca" dei motori stranieri diventa per Arianna Libero "Trova": una precisazione etimologica tutta italiana volta a prospettare all'utente non un semplice tentativo di ricerca, ma un'azione che andrà a buon fine con successo: il risultato non sarà solo cercato, ma anche trovato.

    • Virgilio
      (http://www.virgilio.it)

      Anche Virgilio si presenta come un portale pieno di servizi aggiunti, foto, collegamenti, banner pubblicitari. Uno gigantesco campeggia in alto nel mezzo e potrebbe essere confuso con il logo del portale, che invece è quello relegato abbastanza piccolino sulla sinistra.

      CLICK PER INGRANDIRE
      Home page di Virgilio

      I colori ricorrenti per gli sfondi dei diversi settori sono l'azzurro, il grigio perla, il rosa e li si ritrova coerentemente anche nei testi.

      Il disegno della pagina, recentemente rinnovato, è in effetti moderno e originale: un contenitore ellittico centrale, infatti, taglia i riquadri dando loro forme originali e irregolari e li muove con un ritmo tutto particolare.

      Nella parte alta di questo uovo, quella più in evidenza (dopo il banner di intestazione), l'area per la ricerca con finestrella (il codice ce la descrive di 32 caratteri: "input type="text" id="input-web" name="qs" maxlength="100" size="32" title="Virgilio Ricerca"/", ma come può allora contenere per intero Supercalifragilisticoespiralidoso che di caratteri ne ha 33 e avanzare tutto quello spazio?), possibili settori in cui cercare (che collegano ad altrettante nuove pagine) e tasto arancione "Trova" (non già "Cerca" come nei siti americani) sulla destra.

      Subito sopra vengono proposte le parole più cercate (anche se non viene specificato quando sono aggiornate).

      Noto poi che, sulla destra, accanto al tasto per la ricerca, c'è il collegamento al servizio meteorologico, lo stesso che scompariva passando dallo Yahoo! americano a quello italiano.

      Anche per Virgilio, infine, nessuna citazione al personaggio (stavolta storico) da cui il progetto prese il nome. Forse gli autori hanno creduto che un riferimento al passato guastasse l'immagine di modernità del sito.



Sommario


Capitolo 5 - Motorabilità

  1. Precisazioni

    Devo ammettere di avere un po' sottovalutato il lavoro che mi accingevo a svolgere. Ho scoperto che i motori di ricerca in Internet, anche solo quelli principali, sono davvero tanti e con caratteristiche molto diverse tra loro.

    È stato difficile sceglierli (alla fine mi sono basato sulle classifiche dei più visitati, ma avrei potuto adottare altri criteri, come la tecnologia dei software impiegati, la capacità di scandagliare quale e quanto Web o altro) e risulta altrettanto difficile trarre delle conclusioni che abbiano una valenza oggettiva assoluta.

    Prima di lasciarmi andare alle note finali, quindi, sento di dover fare alcune precisazioni:

    • la valutazione e il confronto delle home page devono necessariamente limitarsi ad alcuni elementi comuni e sostanziali della tipologia di siti esplorata. Non è significativo, per un motore di ricerca, mettere a confronto il colore dello sfondo o il numero di foto o di banner. Mi sembra più corretto limitarmi a considerare questi tre parametri:

      • la finestrella di ricerca (dimensioni, posizione ecc.);
      • il tasto di avvio ricerca (dimensioni, posizione, ecc.);
      • i collegamenti agli ambiti di ricerca (formato, colore, ecc.),

      che sono presenti in ognuna delle home page esaminate e anzi costituiscono, alla fine, il cuore della home page di un motore di ricerca.

    • la valutazione di una pagina Web si basa su alcune considerazioni tecniche e oggettive (di usabilità e di funzionalità della pagina, per esempio) e su altre che sono invece puramente soggettive (di gusto o estetiche). Queste ultime sono sempre opinabili;

    • molte delle indicazioni di Web design, grafica o funzionalità che possono scaturire dall'esame di una pagina Web raramente possono estendersi ad altre pagine in generale. Più probabilmente risulteranno non applicabili a contesti diversi dall'originale (per esempio, se la finestrella al centro sembra più funzionale, potrebbe comunque non adattarsi in una pagina con un'impostazione grafica volutamente asimmetrica e tutta spostata verso sinistra (come quella di Msn Search). Ancora: se pare più raffinato mantenere la finestrella ben isolata e staccata in un riquadro dal resto dei contenuti, ciò potrebbe essere impossibile per un portale (ad esempio Yahoo!) nel quale ogni millimetro quadrato della home page immagino abbia un valore commerciale e strategico enorme);

    • valutazioni sul meccanismo di funzionamento dei motori di ricerca, sulla loro valenza in quanto strumenti di comunicazione e sulla loro efficacia nello scandagliare una porzione più o meno vasta del Web e di restituire risultati più o meno pertinenti, esulano un po' dall'oggetto di questo lavoro. Tuttavia, è doveroso aggiungere a riguardo qualche breve considerazione finale a cui dedicherò gli ultimi paragrafi di questo capitolo. In effetti, i motori di ricerca da una parte sono strumenti di comunicazione e come tali rischiano di incorrere in conflitti di interesse o deontologici; dall'altra, fisiologicamente tralasciano di esplorare la maggior parte delle informazioni pubblicate in Internet (contenuto di database dinamici, documenti non testuali e altro), senza precisarlo nelle loro home page.

  2. Valutazione di alcuni parametri delle home page

    • Finestrella di ricerca

      La tabella che segue mostra la sintesi di quanto rilevato:

      FinestrellaPosizione orizz.rispetto al logoPosizione vert.rispetto al logoLunghezza [car.]Funzioni speciali (menu a tendina)
      Yahoo!CentroSotto42No
      Aol SearchCentroSotto---
      Msn SearchSinistraSotto20No
      GoogleCentroSotto55No
      AriannaDestraSotto40No
      VirgilioDestraSotto32No
      Finestrella di ricerca: sintesi

      Ritengo che la soluzione più funzionale e usabile sia quella senza funzioni speciali che non danno molto valore aggiunto (tant'è che sono inserite solo da Aol Search) e, anzi, potrebbero risultare poco accessibili per utenti disabili (non vedenti). E posizionata centralmente, subito sotto al logo (fatta salva la terza delle premesse di cui sopra).

      La distanza spaziale dal resto dei contenuti aiuta a dare la giusta enfasi a questo elemento che è il più importante perché, come dicono gli studi sull'argomento ([13.4]), il visitatore per prima cosa cerca "il piccolo box in cui poter scrivere".

      Per quanto riguarda la lunghezza, una quarantina di caratteri sono probabilmente più che sufficienti per soddisfare quasi tutte le ricerche. I venti caratteri di Msn Search sono, invece, sicuramente troppo pochi.

    • Tasto di avvio ricerca

      Relativamente al tasto di avvio ricerca, il quadro d'insieme è il seguente:

      TastoPosizione orizz.rispetto alla finestrellaPosizione vert.rispetto alla finestrellaTesto contenutoFunzioni speciali (menu a tendina)
      Yahoo!DestraCentroYahoo! SearchNo
      Aol SearchDestraCentroSearch
      Msn SearchDestraCentroSearch
      GoogleSinistraSottoGoogle SearchNo
      AriannaDestraCentroTrovaNo
      VirgilioDestraCentroTrovaNo
      Tasto di avvio ricerca: sintesi

      Anche per il tasto, la soluzione più semplice è la più funzionale (e in effetti la più gettonata): a destra della finestrella (perché il testo durante la digitazione va verso questa direzione e porta a premere sulla destra, non dall'altra parte), senza funzioni speciali e con l'unico, universale testo "Search" ("Cerca" per gli italiani). "Trova" suona veramente male.

    • Collegamenti agli ambiti di ricerca

      La situazione rilevata è la seguente:

      CollegamentiPosizione orizz.rispetto alla finestrellaPosizione vert.rispetto alla finestrellaFormatoFunzioni speciali (no cambio pagina)
      Yahoo!CentroSopraGrafico
      Aol SearchCentroSottoTestoNo
      Msn SearchSinistraSopraTestoNo
      GoogleCentroSopraTestoNo
      AriannaCentroSopraTestoNo
      VirgilioCentroSopraGraficoNo
      Collegamenti agli ambiti di ricerca: sintesi

      Per questi collegamenti la trovata geniale è quella di Yahoo! che consente di "spostarsi" da un ambito di ricerca all'altro rimanendo nella home page e, quindi, con il minimo disagio di ricarica della pagina per l'utente.

      La posizione ergonomicamente più azzeccata potrebbe essere al centro della finestrella, ma sotto di essa, non sopra come succede quasi sempre (con l'unica eccezione di Aol Search).

      Certo, tutto dipende dalla sequenza logica della azioni chieste all'utente: scelgo l'ambito, inserisco la parola da cercare, premo il tasto "Cerca" oppure inserisco la parola, poi scelgo l'ambito e premo? Nel primo caso, forse, è più coerente lasciare i collegamenti sopra la finestrella.

      Il formato testo è la soluzione più semplice e quella meno pesante in termini di byte, quindi quella vincente. Due spazi o al limite un "pipe" separano efficacemente i collegamenti l'uno dall'altro senza bisogno di ulteriori complicazioni.

    Come ho premesso all'inizio, i suggerimenti citati non intendono dettare un modello per i siti di ricerca né è mia intenzione indicare come impostare o costruire in sito di ricerca.

    Ho voluto semplicemente condividere alcune sensazioni di usabilità e di funzionalità delle home page visitate e il desiderio di capire meglio e con più attenzione gli strumenti della comunicazione che utilizziamo quotidianamente.

  3. Motori di comunicazione

    Visitando le home page dei motori di ricerca più popolari ho avuto la conferma che essi sono a tutti gli effetti strumenti di comunicazione, veicoli di informazione, media strutturati in modo da risultare il più possibile funzionali, fruibili e accattivanti per gli utenti.

    I motori di ricerca sono strumenti di comunicazione nella misura in cui si pongono tra chi ha necessità di informazioni e chi possiede queste informazioni ed è disponibile a condividerle.

    Per stabilire se questo flusso sia virtuoso, sarebbe necessario rispondere ad alcune tra le domande più dibattute del Web.

    I motori di ricerca presentano i risultati in base alla loro rilevanza e alla qualità della fonte oppure applicano altri criteri di selezione? I proprietari delle informazioni le mettono a disposizione dei motori di ricerca oppure le proteggono deliberatamente con barriere virtuali (password di accesso, script ecc.)? E chi cerca le informazioni, che cosa mette in gioco per avere risultati più pertinenti e più interessanti? È disposto a fare qualche "click" in più o vuole avere tutto e subito al primo tentativo (tasto "I'm feeling lucky" di Google)?

    Queste domande non hanno una risposta univoca e un approfondimento richiederebbe uno spazio che va oltre il presente lavoro.

    È comunque auspicabile che le strategie di indicizzazione dei motori di ricerca siano rese pubbliche e trasparenti (e poi applicate in maniera coerente con quanto dichiarato); che i proprietari delle informazioni trovino il modo di condividerle ai motori di ricerca eliminando tutti gli ostacoli tecnici alla loro divulgazione; che gli utenti di Internet si impegnino per un approccio più maturo alla rete.

  4. Un'ultima considerazione. E un appello

    Alla fine del Capitolo 2 ho inserito una nota sui limiti dei motori di ricerca e sulla loro attuale incapacità di scandagliare l'intera profondità del Web.

    Ora, posso constatare come in nessuna delle home page considerate (che sono quelle dei siti più visitati al mondo e che, quindi, vengono cliccate ogni giorno da migliaia di persone) si faccia cenno a questa situazione.

    La pagina di Google è, come ho verificato, l'unica a riportare esplicitamente e visibilmente il numero aggiornato delle pagine censite, ma non precisa che quegli otto miliardi e passa sono meno del due per cento dell'intero Web.

    Veramente non ho esplorato nel dettaglio tutti i documenti collegati alla home page di ciascun motore, può anche darsi che vi sia, da qualche parte nel sito, una dichiarazione di quante pagine risultino censite. Ma certamente non c'è nulla del genere sulla home page.

    Quanti, tra i normali utilizzatori dei motori di ricerca, hanno coscienza di questi limiti, di questi valori, di questa situazione?

    Certo, i motori di ricerca sono aziende, devono vendere il loro prodotto e non possono denigrarlo, ma credo ugualmente che potrebbe esserci più trasparenza a riguardo della loro potenzialità di ricerca nel Web.

    Il valore aggiunto del motore di ricerca, la sua capacità di filtrare, per l'utente allo sbaraglio, informazioni pertinenti, attendibili, aggiornate e provenienti da fonti accertate e di qualità, non sarebbe intaccata se anche fossero pubblici i limiti e i vincoli del suo funzionamento.

    Dopo questo viaggio, userò i motori di ricerca con più consapevolezza. Sarò più attento alle evoluzioni delle soluzioni grafiche e funzionali delle loro home page. Continuerò certamente a utilizzare i risultati che mi proporranno, ma saprò di poterli completare con l'uso di altri strumenti e l'esplorazione di zone meno battute del Web.

    Desidero, per concludere, lanciare un appello:

    Google! Tu che sembri più sulla strada della trasparenza, in fondo alla tua home page, accanto alla frase "Searching 8,058,044,651 Web pages" aggiungi: "of 550,000,000,000 total Web pages"! Thank You!


Sommario


Bibliografia

  1. Fabbri M., Noceti F., Internet per la ricerca e la produzione di informazioni scientifiche, Università degli Studi di Ferrara - C.A.R.I.D., 2003

    Dispensa del Master in Giornalismo e comunicazione scientifica e istituzionale dell'Università degli Studi di Ferrara - C.A.R.I.D.

  2. Search Engine Guide
    (
    http://www.searchengineguide.com/)

    Guida completa agli strumenti di ricerca

    1. Panoramica degli strumenti di ricerca disponibili in rete
      (http://www.searchengineguide.com/searchengines.html/)

  3. Search Engine Watch
    (
    http://searchenginewatch.com/)

    Osservatorio permanente dedicato agli strumenti di ricerca

    1. Descrizione dei motori di ricerca più popolari
      (http://searchenginewatch.com/links/article.php/2156221)

  4. MotoriDiRicerca.IT
    (
    http://www.motoridiricerca.it/)

    Sito italiano dedicato alla ricerca di informazioni on line

    1. Descrizione dei motori di ricerca più popolari
      (http://www.motoridiricerca.it/importan.htm)
    2. Classifiche dei siti più visitati
      (http://www.motoridiricerca.it/classi2.htm)
    3. Pagina monografica dedicata a Yahoo!
      (http://www.motoridiricerca.it/yahoo.htm)
    4. Pagina monografica dedicata a Msn
      (http://www.motoridiricerca.it/msn.htm)
    5. Pagina monografica dedicata a Google
      (http://www.motoridiricerca.it/google.htm)
    6. Pagina monografica dedicata ad Arianna
      (http://www.motoridiricerca.it/arianna.htm)
    7. Pagina monografica dedicata a Virgilio
      (http://www.motoridiricerca.it/virgilio.htm)

  5. Search Engine Forums
    (
    http://www.searchengineforums.com/)

    Interventi e commenti sul mondo dei motori di ricerca

  6. Search Engine Colossus
    (
    http://www.searchenginecolossus.com/)

    Utile lista di motori di ricerca organizzata per paesi

  7. Needle in a Cyberstack - Un ago in un cyber-pagliaio
    (
    http://home.mchsi.com/~albeej/)

    Sito unico di ricerca on-line, fornisce i link per i principali siti di consultazione

  8. Finder Seeker
    (
    http://www.finderseeker.com/)

    Permette di cercare un motore di ricerca per argomento, parola, chiave o paese

  9. Beaucoup
    (
    http://www.beaucoup.com/)

    Raccoglie migliaia di motori di ricerca, elenchi e indici di tutto il mondo, organizzati per categorie

  10. Linkness
    (
    http://www.linkness.com/)

    Azienda di Web design

    1. Motori di ricerca più visitati in Usa
      (http://www.linkness.com/web_agency/motori_ricerca_stranieri.htm)
    2. Motori di ricerca più visitati in Italia
      (http://www.linkness.com/web_agency/statistiche_motori.htm)
    3. Fonte classifica Usa - Comscore
      (http://www.comscore.com/)
    4. Fonte classifica Italia - Audiweb
      (http://www.audiweb.it/)

  11. Motori di ricerca

    Motori di ricerca analizzati in questo lavoro

    1. Yahoo!
      (http://www.yahoo.com/)
    2. Yahoo! Italia
      (http://www.yahoo.it/)
    3. Aol Search
      (http://search.aol.com/)
    4. Msn Search
      (http://search.msn.com/)
    5. Msn Search Italia
      (http://search.msn.it/)
    6. Google
      (http://www.google.com/)
    7. Google Italia
      (http://www.google.it/)
    8. Arianna Libero
      (http://www.arianna.it/)
    9. Virgilio
      (http://www.virgilio.it/)

  12. Presentazione dei motori di ricerca

    Tipicamente, la pagina "Who we are" dei siti di ricerca esaminati

    1. Presentazione di Yahoo!
      (http://docs.yahoo.com/info/misc/history.html)
    2. Presentazione di Aol Search
      (http://http://www.corp.aol.com/whoweare/history.shtml)
    3. Presentazione di Msn Search
      (http://www.microsoft.com/presspass/newsroom/msn/factsheet/search.asp)
    4. Presentazione di Google
      (http://http://www.google.com/intl/it/corporate/index.html)
    5. Presentazione di Arianna Libero
      (http://http://about.libero.it/storia.phtml)
    6. Presentazione di Virgilio
      (http://http://www.virgilio.it/chisiamo/index.html?pmk=hpfoot)

  13. Manuali di usabilità

    Che cos'è e come si valuta l'usabilità di un sito Internet

    1. Dal sito Html.it
      (http://www.html.it/usabilita/)
    2. Dal sito Usabilityfirst.com
      (http://www.usabilityfirst.com/intro/index.txl)
    3. Dal sito Useit.com - Suggerimenti per la home page
      (http://www.useit.com/alertbox/20020512.html)
    4. Dal sito Useit.com - Suggerimenti per finestrella di ricerca
      (http://www.useit.com/alertbox/20010513.html)

  14. Web Style Guide
    (
    http://www.webstyleguide.com/)

    Guida di Web design

    1. Suggerimenti per la home page
      (http://www.webstyleguide.com/site/home.html)
    2. Suggerimenti per gli strumenti di ricerca
      (http://www.webstyleguide.com/site/search.html)

  15. Articoli sui motori di ricerca

    1. Dal sito Boostmarketing.com"Msn, Yahoo! Catching Up With Google" - 14 gennaio 2005
      (
      http://www.boostmarketing.com/story.php?id=417)
    2. Da Search Engine Journal"Search engine industry expanding" - 28 marzo 2004
      (http://www.searchenginejournal.com/index.php?p=1489)

  16. Manuali di Html

    1. Web Guide
      (
      http://www.webguide.it/corsohtml/)
    2. Html.it
      (http://www.html.it/)
    3. Dal sito Html.it - Il tag "Input"
      (http://freeasp.html.it/guide/lezione.asp?id=97)

  17. Search Engine Journal
    (
    http://www.searchenginejournal.com/)

    Giornale on line sui motori di ricerca

  18. Indire
    (
    http://www.indire.it/)

    Istituto nazionale di documentazione per l'innovazione e la ricerca educazionale

    1. Sezione didattica sui motori di ricerca e sul Web profondo
      (http://puntoeduft.indire.it/160mila/b/moduli/lab/lab_fortic/b3/lab2/premessa/prem0.htm)

  19. Articoli sul Web profondo

    1. Dal sito di Bright Planet, azienda leader in ricerche di informazioni in Internet
      "The Deep Web: Surfacing Hidden Value" - 24 settembre 2001
      (
      http://www.brightplanet.com/technology/deepweb.asp)
    2. Da Bright Planet
      Tasso di crescita del Web
      (http://www.brightplanet.com/technology/deepweb.asp#GrowingFaster)
    3. Dal sito Html.it
      "Nel profondo Web, con Yahoo" - 4 marzo 2004
      (http://webnews.html.it/focus/369.htm)
    4. Dal sito della biblioteca dell'Università di Albany (Stato di New York, Usa)
      "The Deep Web" - 6 dicembre 2004
      (http://library.albany.edu/internet/deepweb.html)
    5. Dal sito Psicopolis.com
      "Deep Web Search Tools (Strumenti per navigare nel Web profondo)"
      (http://www.psicopolis.com/synaptica/profonw.htm)
    6. Dal sito About.com
      "What is the Invisible Web?"
      (http://websearch.about.com/od/invisibleweb/a/invisible_web.htm)
    7. Dal sito della biblioteca dell'Università della California Berkeley (Usa)
      "Invisible Web: What it is, Why it exists, How to find it, and Its inherent ambiguity"
      (http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/InvisibleWeb.html)


Sommario