The Max Planet

Le
  Basi dell'Internauta


  Il WWW
  La Storia
  Cosa serve
  Collegamento
  Il Browser
  E-Mail
  Newsgroup
  FTP
  Telnet
  Error Message!

IL
World Wide Web
avanti


space
  • Le prime definizioni


  •   Il termine World Wide Web, letteralmente 'Ragnatela ad estensione Mondiale', è l'insieme delle pagine Web, composte principalmente di testo e immagini, visibili dagli utenti tramite la rete di Internet.
    Internet e WWW vengono spesso considerati sinonimi, ma in realtà Internet identifica la grande rete di computer grazie alla quale si anima il WWW.

    Questa rete utilizza il protocollo TCP/IP (Transfer Control Protocol/Internet Protocol), che consente una semplice comunicazione fra i vari server e le reti basate su diversi sistemi operativi, permettendo così l'indipendenza e la decentralizzazione dei vari nodi.

    La definizione degli standard di questa ragnatela cominciò nel lontano 1969, quando la rete aveva ancora scopi universitari e militari, e continua ancora oggi. Con esse si arrivò alla definizione dello scheletro di World Wide Web nel 1990 ad opera di un ricercatore del Cern, Tim Berners-Lee, considerato ancora oggi il fondatore del WWW.
    Tutte queste specifiche sono raccolte negli RFC (Request For Comments), pubblicazioni ufficiali dell'autorità americana che standardizza il funzionamento della rete, la IETF (Internet Engineering Task Force). Ad esse tutti i ricercatori del WWW devono far riferimento; ma non occorre essere un ricercatore, chiunque può proporre nuovi standard che, sottoposti ad una necessaria discussione di gruppo, potranno essere raccolti in nuovi RFC.
    Tutti gli RFC possono essere visionati liberamente presso il sito dell'autorità responsabile della stesura finale e dell'archiviazione dei documenti (www.rfc-editor.org), con ampie descrizioni sull'argomento.

    Per navigare su Internet occorre l'utilizzo di un apposito programma chiamato Browser, che letteralmente significa 'Sfogliatore'.
    Il primo Browser grafico fu inventato nel 1993 dal futuro fondatore di Netscape, Marc Andreessen, con il nome di 'Mosaic', che rese la navigazione per la prima volta agevole e divertente.

    Prima di allora la navigazione veniva effettuata mediante l'uso di applicazioni molto più semplici, che permettevano una visualizzazione soltanto testuale dei documenti.
    Erano una sorta di Browser testuali, il primo dei quali fu il Lynx che girava sotto Unix quando ancora non esistevano i computers dotati si sistemi operativi come il DOS; ne fecero in seguito una versione capace di girare in una finestra DOS sotto Windows che è sopravvissuta fino ai nostri giorni, ed è scaricabile dal sito proprietario.
    Per esplorare la rete si utilizzavano protocolli di trasferimento diversi. Uno di questi è il Gopher, che consente di accedere a vari servizi Internet tramite i menu basati sul testo. Ogni qualvolta ci si collega ad server Gopher, appare un menu di apertura, che attraverso le sue selezioni permette di accedere ad altri menu, fino ad arrivare direttamente ai files di quella risorsa.
    Esistono ancora dei Server Gopher sparsi per la rete, i cui indirizzi si identificano con il prefisso gopher://; questo ne è un'esempio:
    CSP - Centro Supercalcolo Piemonte - Torino
    Per la ricerca dei testi veniva utilizzato un sistema chiamato Wais, che significa Wide Area Information Server, e consente di ricercare vari database su Internet, articoli specifici e altre risorse. Su di un Wais gateway server si opera come su un normale motore di ricerca. Attraverso il modulo di ricerca Wais si introduce l'elemento chiave desiderato e si avvia la ricerca; posto che Wais trovi alcuni articoli ed altre risorse che corrispondono alla voce, consente di sapere in quale database li si può trovare tramite dei links.
    Ancora oggi è possibile utilizzare la ricerca Wais collegandosi ad alcuni server, eccone un esempio:
    IT NET Wais Gateway
    Questi sistemi di navigazione sono così stati gradualmente abbandonati con l'apparizione dei primi Browser grafici e dei molteplici motori di ricerca per i siti Web.

  • I contenuti del Web


  • Grazie all'impiego di un Browser, che da ora in poi verrà sempre sottinteso come Browser grafico, è possibile visualizzare le pagine Web ed interagire con esse; sono pagine scritte in linguaggio HTML, la lingua di Internet.
    HTML significa Hyper Text Markup Language ed è, più che un linguaggio, un codice dalla sintassi relativamente semplice che consente di predisporre documenti ipertestuali, composti da testo, immagini, suoni e animazioni e di definire Link attivi (o Hyperlinks) di collegamento tra un documento e l'altro.
    Il risultato finale è un interfaccia grafica di semplice utilizzo con la quale accedere attraverso l'attivazione dei link alle svariate pagine presenti in rete.
    Posizionando il puntatore (mouse) sopra un link (associato di solito ad un immagine o ad un testo sottolineato all'interno della pagina), il cursore si modifica diventando in genere una "manina", che con un click ci può condurre oltre che ad altre parti di testo ad immagini, suoni o filmati.

    L'InternautaUn Sito Web è una creazione, realizzata da un unico utente o da un gruppo in cooperazione, costituita da un insieme di pagine Web collegate tra loro e riguardanti un particolare tema. E' come se si trattasse di un 'libro elettronico' completo di indici per poter saltare da una parte all'altra al suo interno e dal quale quasi sempre è possibile uscire per visionare altri libri di riferimento sparsi per la rete.
    Nei casi più comuni, un sito è composto principalmente di pagine testuali in formato .HTML (oppure .HTM, è un'espressione più obsoleta), corredate di immagini in formato .GIF o .JPG, e di file audio di tipo .MID o .WAV.

  • Com'è composto un'indirizzo Web


  • Per accedere ad un sito Web occorre conoscere il suo indirizzo, che viene specificato nei link attivi dei documenti ipertestuali. Questo indirizzo viene chiamato URL (Uniform Resource Locator) e identifica univocamente qualsiasi tipo di risorsa su Internet con un formato standard.
    La specifica al Browser di un indirizzo Web per il caricamento di una pagina viene effettuata anteponendovi il prefisso HTTP:// (es.: http://www.nasa.gov), che significa Hyper Text Transfer Protocol; questa sigla identifica quale protocollo utilizzare per il trasferimento dei dati richiesti, nel nostro caso quelli relativi ad un documento ipertestuale.
    Se questo prefisso viene omesso nell'apposito campo di Location del Browser, viene di solito aggiunto da quest'ultimo in automatico poichè si assume per default che il protocollo più utilizzato sia appunto l'HTTP.
    Esistono tuttavia altri tipi di protocolli di trasferimento la cui specifica richiede l'utilizzo di nuovi prefissi, come FTP:// o NEWS: di cui parleremo in seguito.

    Ogni computer connesso ad Internet in protocollo TCP/IP possiede un proprio numero di identificazione univoco chiamato IP Address, composto da quattro gruppi di numeri decimali compresi tra 0 e 255, e separati fra loro da un punto; un esempio: 194.86.35.01. Questo indirizzo è proprio di ogni utente che naviga su Internet così come di ogni server fornitore di servizi; solo con questa espressione viene riconosciuto e intercettato dai vari componenti di rete.
    Per poter utilizzare l'indirizzo di una pagina nel formato URL sopra descritto, molto più semplice e facile da ricordare, diventa così necessaria una sua traduzione in IP Address; questo viene realizzato da appositi server sparsi per la rete chiamati DNS ('Domain Name Server') che a fronte della richiesta di una pagina associano all'URL, definito al loro interno come indirizzo Fqdn ('Full Qualificate Domain Name'), il corrispondente e univoco indirizzo IP.
    Proprio per questo motivo è anche possibile inserire nel campo di Location del Browser un'indirizzo in formato TCP/IP, preceduto dal prefisso di protocollo, anzichè il corrispettivo sotto forma di URL; non si farebbe altro che utilizzare quella che sarà l'espressione finale dell'indirizzo, risparmiando il lavoro di traduzione al DNS.

    Per comprendere il significato di un indirizzo Web bisogna analizzarne la sintassi, che nella maggioranza dei casi corrisponde all'espressione:

    PROTOCOLLO + HOST.SOTTODOMINIO.DOMINIO

    Leggendo l'indirizzo al contrario, da destra verso sinistra, è possibile capire dov'è localizzato il sito o che tipo di informazioni contiene, l'ente fornitore del servizio e il nome del server di riferimento, attraverso l'interpretazione dei vari campi:

  • DOMINIO

  • Può rappresentare il settore di appartenenza del sito, che definisce il tipo di informazioni in esso contenute. In questo caso i domini più diffusi sono:
    • COM = commerciale (società o aziende private con interessi commerciali)
    • EDU = educazione (università, centri di ricerca)
    • GOV = governativo (amministrazioni statali, istituzioni nazionali)
    • MIL = militare;
    • NET = network (gateway e altri host della rete Internet)
    • ORG = organizzazioni (organizzazioni private, fondazioni, associazioni)
    Oppure rappresenta il Codice Paese, che fornisce informazioni sulla localizzazione geografica del sito. In questo caso i domini più comuni sono:

    ar Argentina lu Lussemburgo
    at Austria mx Messico
    au Australia nl Olanda
    be Belgio no Norvegia
    ca Canada nz Nuova Zelanda
    ch Svizzera pl Polonia
    cs Cecoslovacchia pr Portorico
    de Germania pt Portogallo
    es Spagna ru Fed. Russa
    fi Finlandia se Svezia
    fr Francia sm San Marino
    gr Grecia th Thailandia
    jp Giappone tn Tunisia
    kr Corea tw Taiwan
    ie Irlanda uk Regno Unito
    il Israele us Stati Uniti
    it Italia va Città del Vaticano

  • SOTTODOMINIO

  • In genere definisce il provider, l'organismo o l'azienda che fornisce il servizio.

  • HOST

  • Rappresenta il nome del computer che ospita quel particolare sito. Molto spesso i Server Web su cui sono memorizzati i documenti vengono chiamati WWW; da questo deriva l'espressione iniziale, a noi molto familiare, di un indirizzo Web.

  • PROTOCOLLO

  • E' la specifica del protocollo di trasferimento da utilizzare in relazione al tipo di risorsa a cui si vuole accedere. Può assumere i seguenti formati:
    • http:// (Hyper Text Transfer Protocol) nel caso di un documento ipertestuale, cioè una pagina in formato HTML.
    • ftp:// (File Transfer Protocol) per il trasferimento di files da Server FTP.
    • news: per la lettura delle news sui Newsgroup; apre automaticamente il client per le News predefinito.
    • telnet:// per una connessione terminale remota con un Server Telnet; apre il Client Telnet predefinito.
    • mailto: per l'invio di posta elettronica, seguito dall'E-mail address del destinatario; apre direttamente il client di E-mail predefinito.
    • gopher:// nel caso di collegamento ad un sito Gopher.
    • wais:// (Wide Area Information Server) per collegarsi ad un motore di ricerca Wais;
    Provate ad immaginare quanti computers collegati ad Internet esistono al mondo, sicuramente una quantità dalle proporzioni impressionanti! Pensate, ognuno di essi deve entrare in rete proponendosi con un indirizzo, che abbiamo visto chiamarsi IP address, assolutamente univoco così da evitare sovrapposizioni... ma come può essere realizzato tutto ciò?
    In ogni Paese sono state istituite delle autorità garanti per lo sviluppo e il buon funzionamento della rete sul territorio, per l'Italia questo organismo si chiama GARR (Gruppo Armonizzazione Reti della Ricerca). Questa autorità si preoccupa anche di assegnare e registrare i nomi dei server fornitori di servizi per il dominio italiano (.IT), regolamentando in tal modo la distribuzione degli IP address e dei DNS Server sparsi per la rete in base a delle normative internazionali.
    Questa attività veniva fino a poco tempo fa svolta in nome e per conto del GARR da un'apposito organismo, la Registration Authority Italiana gestita dall'Istituto CNUCE del Consiglio Nazionale delle Ricerche, che attualmente, con la crescita della rete, è stato configurato come servizio autonomo.
    L'organismo equivalente per l'America opera per conto della IETF e viene chiamato IANA (Internet Assigned Numbers Authority).
    Tutti i fornitori di servizi devono riferirsi a questo tipo di organismo operante sul proprio territorio per richiedere la registrazione del proprio server. Quando un utente si collega ad Internet, gli viene assegnato dal server un IP address dinamico, cioè a scelta fra quelli non ancora "in linea" e compresi nel range a lui concesso dall'autorità di registro.
    A questo punto, com'è possibile che un DNS server possa contenere tutte le associazioni possibili tra URL e IP address esistenti al mondo? In realtà non è proprio così, poichè le tabelle all'interno di questi server fondamentali per la navigazione sono in genere ristrette agli URL presenti sul territorio di competenza, cioè facenti parte di un solo dominio (ad esempio il nostro .IT); ma essendo tutti connessi tra di loro a livello globale sono in grado di risolvere qualsiasi URL inoltrando in caso di necessità le richieste degli utenti ad altri server DNS sparsi per il pianeta.

  • La trasmissione dei dati


  • La lettura delle pagine Web viene realizzata utilizzando un'architettura client/server. Il documento scritto in codice HTML risiede fisicamente in un server che dispone di un software specializzato nel rispondere alle richieste formulate da altri computer, i client, che utilizzano il browser per il recupero del documento scelto.
    La trasmissione dei dati in Internet viene considerata affidabile poichè avviene in una modalità chiamata a commutazione di pacchetto, che garantisce l'integrita dei dati inviati da un computer all'altro sulla rete. Con questo meccanismo i dati vengono frazionati in pacchetti da trasmettere, ciascuno dei quali segue autonomamente un percorso che può essere diverso da quello degli altri pacchetti.
    Una volta giunti tutti i pacchetti a destinazione, l'informazione inviata viene ricomposta sul computer client dell'utente destinatario.





    Accesso diretto


    | Contatto || Strumenti || Risorse || Creare || Utilità || Links || Search |

    Realizzazione di Massimo Martelli - 1998-99
    Tutti i marchi citati in questo sito sono copyrights dei rispettivi proprietari
    Visualizzazione ottimale mediante Netscape Navigator versione 3.0 o superiore, risoluzione 800x600