|
2.1 Introduzione
La ricerca semplice è quella proposta nella pagina di apertura di un qualunque motore. Quella avanzata offre, spesso con appositi campi, delle opzioni in più per definire la ricerca o utilizzare gli operatori booleani (AND, OR...).
Ricerca Semplice e Ricerca Avanzata hanno spesso alcune funzioni comuni: esclusione di maiuscole e minuscole, di punteggiatura e accenti; uso delle virgolette o del carattere jolly [* ].
Entrambe utilizzano, inoltre, alcune parole chiave speciali che servono a definire l’ambito della ricerca. Ad esempio con [link:URL ] si trovano pagine contenenti link alla pagina dell’URL specificato.
In pratica, si tratta delle stesse funzioni selezionabili con la Ricerca Avanzata, ma che possono anche essere direttamente inserite nella finestra di Ricerca Semplice proprio con le varie parole chiave.
2.2 Maiuscole e minuscole; i caratteri accentati
Se una parola viene scritta in minuscolo, verrà cercata sia la versione minuscola che quella maiuscola [casa ] trova: «CASA», «casa», «Casa». Se la parola contiene una qualsiasi maiuscola, AltaVista cercherà solo le corrispondenze di quella forma: [Casa ] trova solamente «Casa»; mentre Google di nuovo non farà alcuna differenza. Tuttavia con Google si può ottenere lo stesso risultato aggiungendo un più [+Casa ] davanti alla parola scritta esattamente nella grafia cercata.
Questa capacità di distinzione è utile per cercare marchi, o nomi propri di persone o città... In questi casi è bene usare l’iniziale maiuscola.
Allo stesso modo si procede per i caratteri non standard, perché gli accenti vengono trattati come maiuscole e minuscole: ad esempio scrivendo una parola senza accenti, verrà cercata sia la versione accentata sia quella senza accento. Se invece si scrive solo la versione accentata, la ricerca si restringerà a quest’ultima e con Google bisognerà sempre ricordare di mettere il più: [+München ].
I crawler parlano tutte le lingue: infatti, indicizzano tutte le parole delle pagine, in qualsiasi lingua.
2.3 Punteggiatura
Normalmente non si considera la punteggiatura: virgola (,), punto (.), tratto basso o underscore (_), barra o slash (/) e trattino (-).
La punteggiatura, soprattutto se parte di una parola, tende infatti ad essere un elemento arbitrario e spesso viene ricordata male. Un esempio clamoroso è quello del marchio Coca-Cola che può presentarsi nelle forme «Coca-Cola», «Coca Cola» o «CocaCola».
Se i motori cercassero delle esatte corrispondenze per la punteggiatura, molti risultati sarebbero esclusi.
2.4 Come usare le virgolette
Se si scrive un gruppo di parole fra virgolette, viene cercata la frase, ossia le parole in quell’ordine preciso. Si tratta di una funzione molto potente, resa possibile dal fatto che i crawler indicizzano ciascuna parola trovata nei siti e ne ricordano l'ordine esatto.
Questa funzione consente la ricerca di qualsiasi citazione celebre o di concetti elaborati non esprimibili solo con una o due parole. Ovviamente, però, una frase leggermente diversa non entrerà nei risultati.
2.5 Uso del carattere jolly (*)
L’asterisco (*) può sostituire altre lettere in una interrogazione. Vanno seguite però le regole di ciascun motore: ad esempio in AltaVista l’asterisco può comparire solo dopo minimo tre caratteri e può sostituire da zero a cinque caratteri. Mentre in Google non può essere usato.
Come utilizzarlo?
1. Chi cerca la forma inglese e americana di una parola come color (colour) può inserire l’asterisco al posto dell’eventuale 'u': [colo*r ]
2. Al posto dell'ultima lettera di una parola per cercare forme maschili e femminili, plurali o singolari: [buon* gatt* ]
3. In caso di dubbio sulla presenza di una doppia o di diverse grafie: [ob*iettivo ]
4. Può essere utile con i nomi e i loro diminutivi. O con i cognomi, soprattutto quelli di origine antica che presentano diverse varianti della stessa radice: [Borrom* ] trova come risultati sia «Borromeo» che «Borromei» o «Borromi».
2.6 La parola chiave «link:»
La parola chiave «link:» seguita da un nome di dominio o da un URL completo trova ogni pagina contenente un link ad uno specifico sito, o a una sua directory o pagina.
Ad esempio: [link:racine.ra.it ] Trova tutti i siti che presentano un link a RaCine.
Per chi gestisce un sito web la funzione «link:» è preziosa perché permette di capire quali siti hanno inserito un collegamento al proprio sito; con questo scopo, però, è bene escludere i link interni utilizzando con AltaVista un’interrogazione del tipo: [link:racine.ra.it AND NOT host:racine.ra.it ] mentre con Google si può scrivere: [link:pippo.it -site:pippo.it ].
Ogni volta che si fa una ricerca utilizzando in AltaVista «link:» o «host:» o «url:» i risultati non sono ordinati secondo alcun criterio e valgono tutti allo stesso modo. Mentre Google li ordina comunque col suo PageRank.
2.7 Ricerca di un dominio
Unibo.it è un «nome di dominio», mentre la parte finale di questo indirizzo (ovvero .it) è il «dominio» vero e proprio.
Il dominio serve a circostanziare il Paese di appartenenza o l’attività svolta dal sito. Eccone degli esempi non legati ai paesi di registrazione ma al tipo di attività svolta dal sito:
.com per una società commerciale; .net per una società di servizi Internet;
.edu per istituzioni didattico-formative; .gov per una organizzazione governativa non militare;
.mil per un’organizzazione militare; .org per un altro tipo di organizzazione (di solito non-profit).
In realtà, però, i tre domini .com, .net, e .org sono intercambiabili perché chiunque può acquistare nomi di dominio con questi suffissi. Mentre .edu, .gov e .mil sono generalmente statunitensi.
Per i domini dei singoli Paesi, invece, le cose funzionano diversamente. Ad eccezione degli Stati Uniti, tutti possiedono un registro di dominio composto da due lettere codice del paese. Eccone alcuni: it = Italia, uk = Regno Unito, fr = Francia, de = Germania, no = Norvegia, es = Spagna, se = Svezia, jp = Giappone, nz = Nuova Zelanda...
E’ possibile restringere la ricerca ad uno qualsiasi di questi domini utilizzando la parola chiave speciale «domain:» con AltaVista o l’equivalente in Google che è «site:».
Ad esempio: ["sicurezza di internet" site:.net ];
o nella Ricerca Avanzata di AltaVista: [domain:edu AND "medical equipment" ]
Se tutte le pagine di un sito sono indicizzate, si può poi utilizzare una semplice ricerca del dominio per ottenerne un indice.
2.8 Ricerca di un'immagine o di file particolari
Molti motori consentono di cercare file particolari come quelli di immagini, o i file PDF o quelli MP3 o di altri tipi ancora.
Ad esempio Google tiene conto automaticamente anche del contenuto dei file PDF, mentre per le immagini (o gli MP3) generalmente si hanno delle sezioni dedicate che magari già alla prima ricerca presentano delle miniature per i file di immagine che hanno un nome corrispondente.
Invece, nella Ricerca Semplice di AltaVista occorre inserire la parola chiave «image:» per far capire al motore che si desiderano solo foto. Esempi: [image:cometa ] o [image:cometa.gif ]
Il primo esempio spiega come trovare tutte le immagini chiamate «cometa». Con il secondo, invece, si restringe il risultato ai soli file con estensione .gif (indica il formato dell’immagine).
Se si conoscono già i siti in cui cercare determinate foto o si desidera limitare la ricerca a un unico Paese basta utilizzare la combinazione di ricerca immagini e specifica del dominio.
AltaVista indicizza anche i nomi di file creati per gli Applet Java o da altri Object che si trovano nei siti web, ma non il loro contenuto. Dunque, è possibile trovare uno di questi file solo se il suo nome è noto o già riesce a esprimerne contenuto o funzione.
E’ possibile trovare i rispettivi programmi mediante le parole chiave speciali, cioè «applet:» e «object:». Ad esempio: [applet:tree ] o [object:banner ]
Chi ha creato questi Applet o Object può permettere di utilizzarne i file, generalmente a patto che i loro nomi o il loro contenuto non siano modificati. E’ ovviamente possibile associare l’asterisco al nome o la specifica del dominio per controllare l’utilizzo di applet all’interno di uno specifico sito web.
2.9 Come utilizzare gli «anchor»
Con il termine «anchor» si indicano le due estremità di un link ipertestuale. L'anchor di origine è il punto in cui si trova il link (sono parole sottolineate e in genere di colore blu o comunque diverso dal testo normale), mentre l'anchor di destinazione è la pagina che viene visualizzata una volta cliccato sul link.
Negli anni passati, molte pagine web utilizzavano come hyperlink l’espressione «click here» o «clicca qui». Oggi è più facile che vengano utilizzate espressioni più significative rispetto al contenuto delle pagine collegate. Queste parole possono essere ricercate utilizzando la chiave «anchor:» con AltaVista o «allinanchor:» con Google seguita dalla parola o dall'espressione ricercata tra virgolette.
Dunque, potrebbe essere utile fare una ricerca che selezioni solo gli anchor perché in questo modo si ottengono con precisione pagine che trattano dell’argomento specificato, basta scrivere: [anchor:"storia moderna" ] o [allinanchor:fenomenologia ]. Si otterranno solo pagine che trattano specificamente dell’argomento «storia moderna» perché sono state indicate su altre pagine web con un link «storia moderna».
Allo stesso modo, se un sito ha delle informazioni rilevanti sulla fenomenologia, la probabilità che la pagina compaia in cima alla lista dei risultati aumenta se altre pagine web contengono un link a quel sito mediante l'espressione «fenomenologia» come anchor.
2.10 Ricerca nel corpo del documento
Per fare una ricerca mirata la parola chiave «text:» di AltaVista o «allintext:» di Google può essere molto utile. La sua funzione è cercare solo nello scritto all’interno di una pagina web senza considerare tutte le informazioni che fanno cornice alla pagina (i METAtag).
Spesso i METAtag contengono termini per ingannare i motori di ricerca anche se in realtà i siti a cui si riferiscono non hanno nulla a che vedere con quelli: eliminandoli dalla ricerca si ottengono spesso meno risultati ma più precisi. Ecco un esempio: [text:"musica pop" ]
2.11 Ricerca nel titolo dei documenti
Quando l’oggetto di una ricerca è molto generico i risultati possono essere migliaia, o addirittura milioni. I motori privilegiano alcuni elementi di una pagina nell’ordinamento dei risultati, e uno dei più importanti è il titolo HTML. Non è il nome del documento o la prima frase scritta in grande (come il titolo di un articolo di giornale), ma si tratta del titolo che compare nella barra del Browser.
All’interno di una ricerca è possibile selezionare il titolo HTML utilizzando la parola chiave «title:» per AltaVista o «allintitle:» con Google.
Così si trovano tutte le pagine espressamente dedicate a un preciso argomento (dal cantante famoso a un filosofo).
2.12 Parole chiave per l’host e l’URL
Alcune parole chiave, oltre al nome del dominio, consentono di selezionare elementi specifici di un indirizzo web.
- «url:» di AltaVista o «allinurl:» di Google selezionano l’URL, ovvero l’indirizzo preciso della pagina;
- «host:» di AltaVista seguita da un nome di dominio cerca tutte le pagine web presenti in uno specifico server web.
Esempio: [host:unico.it ] Ricerca tutte le pagine web presenti nel dominio dell'università di Como.
Url: funziona in modo analogo, ma permette di specificare meglio l’indirizzo web.
Esempio: [url:www.iue.it/LIB/SISSCO ]
Trova tutte le pagine web nella directory /LIB/SISSCO del dominio www.iue.it.
Se si vogliono ad esempio cercare tutte le occorrenze del termine «petrolio» nel sito di Greenpeace:
- con la ricerca semplice [+host:greenpeace.org +petrolio ]
- con la ricerca avanzata [host:greenpeace.org AND petrolio ]
2.13 Ricerca per lingua e... traduzioni automatiche
Se il motore dà questa opzione basta selezionare l’idioma dal menu a tendina della ricerca. Se invece non viene selezionata una determinata lingua, la ricerca avverrà automaticamente in tutte le lingue.
NB: se si seleziona una lingua con alfabeto non latino (ad es. cinese, giapponese, coreano, russo o greco) bisogna controllare che il Browser sia in grado di codificare queste pagine e mostrare i caratteri correttamente.
Inoltre, si può ricordare che AltaVista già da tempo offre un servizio di traduzione automatica (Babel Fish): non è perfetto, ma spesso è utile specie se non si conosce la lingua del sito che si sta visitando e si vuole avere almeno una idea del contenuto. Purtroppo, può bastare un modo di dire o un termine con diversi significati (ad esempio testi=scritti o testi=testimoni) per ottenere una traduzione non adeguata.
Anche Google sta iniziando a offrire un servizio simile, ma esso è ancora in fase sperimentale.
2.14 Alcune ulteriori osservazioni
In fase di ricerca, viene data maggiore importanza alle parole non comuni.
Se si inserisce in AltaVista [filosofia, neoplatonic*, questo ], i risultati della ricerca saranno così distribuiti: prima le pagine che contengono entrambe le parole (filosofia e neoplatonic*) e poi quelle che ne contengono solo una, di cui quella più rara (neoplatonic*) verrà privilegiata. Tra le pagine che contengono entrambe le parole, quelle in cui «neoplatonic*» appare all’inizio o nel titolo compariranno in cima alla lista. La parola «questo» verrà infine ignorata perché troppo ricorrente.
Google si comporta in modo leggermente diverso dato che presenta solo le pagine contenenti tutte le parole, escludendo sempre le parole di uso troppo comune. Inoltre nell’ordine tiene conto dei link verso ciascuna pagina dei risultati: quelle che ne hanno di più sono probabilmente più importanti.
I più consultano solo la prima o la seconda pagina dei risultati della ricerca, vale a dire da 10 a 20 voci ed è estremamente raro che qualcuno controlli più di 200 risultati. L’idea dei motori è quindi quella di trovare il modo di convogliare le informazioni più importanti e utili nelle prime pagine.
Tuttavia, una volta trovata una pagina che interessa, Google offre un’altra opzione di ricerca: il link «pagine simili» (parola chiave «related:») che mostra pagine con contenuti relazionabili a quella trovata.
Mentre «pagina cache» consente di visualizzare la pagina come è stata trovata l’ultima volta da Google e lo si usa nel caso ci siano problemi per vederla sul server originale.
Nella Ricerca Avanzata si ha, invece, il pieno controllo dell’interrogazione. Il motore non tenta di anticipare le intenzioni.
Le parole immesse nel campo della formula booleana sono considerate una frase intera purché non collegate da un operatore (NEAR, AND, OR ecc.); quelle nel campo «Ordina per», a meno che siano scritte tra virgolette, sono invece considerate separatamente (come se fossero divise da OR). Gli operatori booleani non sono riconosciuti nel campo «Ordina per» e vengono trattati come parole comuni. |