Browser e motori di ricerca

I browser sono quei software di tipo client (come ad esempio Firefox) che interagendo con i server web (come il progetto Open Source Apache) ci permettono di visualizzare ed utilizzare il Web cosí come lo conosciamo; i motori di ricerca sono interfacce web utilizzabili da browser che ci permettono di semplificare l'accesso all'informazione su Web interrogando poderosi basi di dati che ci offrono una selezione di informazioni utili in maniera ordinata. Browser e motori di ricerca condividono analoghe incombenze di interazione con i server web dai quali sono riconosciuti ed identificati attraverso una stringa di codice testuale detta anche user agent che a volte è determinante nel visualizzare od interpretare in maniera diversa il Web ospitato sul server di riferimento. Nello scambio dati fra client e server soprattutto per quanto riguarda i browser gli http headers sono file di testo importantissimo che includono - codifica dei caratteri, controllo della cache, ultima data di modifica, referrer ovvero pagina di provenienza eccetera compresi i cookies che registrano una serie di informazioni circa le navigazioni sul Web con implicazioni delicate sul fronte della privacy ma di indubbia comodità a livello funzionale. I motori di ricerca sono spesso integrati nei browser a livello di plugin, come funzioni attivate direttamente nell'address url o attraverso moduli di ricerca adiacenti alla address url principale. L'address url e la sua visibilità nel browser rimane dunque un importante fattore di qualità nell'utilizzo di questi strumenti di navigazione del Web.
Ancora, browser e motori di ricerca rappresentano in qualche maniera le due facce, una umana e l'altra caratterizzata dal funzionamento di automatismi, della ricerca di informazione in Rete: mentre i browser sono utilizzati dagli utenti finali (umani) per comprendere l'informazione su Web e classificarla magari attraverso procedure di tagging e bookmarking, gli spider (anch'essi browser ma governati da automatismi) vengono utili per indicizzare ed ordinare opportunamente la Rete di informazioni che si dipana sul Web secondo precisi algoritmi matematici. Per i browser si può parlare di esplorazione e navigazione di dati mentre per i motori di ricerca di attività di ricerca, appunto, su specifiche basi dati.

Browser

Il browser è uno strumento essenziale per la navigazione sul Web. Il Web fa parte della più ampia rete di comunicazione Internet composta da svariati servizi comunicativi caratterizzati tutti da uno specifico protocollo (insieme di regole): tutti i servizi comunicativi di Internet vengono erogati da specifici computer fornitori di servizi denominati come server interrogati allo scopo da computer desiderosi di ricevere il servizio attraverso specifici software che vengono denominati client e che cercano il servizio sul server su determinati indirizzi specifici noti anche come porte (ecco perchè per la comunicazione Internet si parla di modello client-server). Tutti i computer per esistere e comunicare in Internet devono essere identificati da un indirizzo detto anche numero IP per comodità spesso tradotto in un indirizzo alfabetico (attraverso il noto servizo DNS). Molti servizi internet come ad esempio quello della posta elettronica o del trasferimento file (ftp) sono erogati solo attraverso una sessione di autenticazione (login) durante la quale sono forniti nome utente e password.

Il browser è il software client che ottiene (senza autenticazione) dalla porta 80 del server Web la possibilità di interagire con una pagina Web attraverso il protocollo di comunicazione http. Per poter interagire al meglio con una pagina Web è molto importante avere piena consapevolezza di ciò che stiamo visualizzando ed utilizzando ricordandosi di abilitare l'address bar del browser, avere accesso a tutti i menù e funzionalità interne del browser magari prendendo dimestichezza a tal scopo con le scorciatoie da tastiera utili, ad esempio, per una immediata visualizzazione del codice sorgente E' importante ricordare che a seconda dell'interfaccia hardware e software che abbiamo a disposizione l'interazione con la pagina web può cambiare significativamente: un click destro del mouse, ad esempio, può offrire possibilità diverse di interazione rispetto ai diversi movimenti delle dita su un touchscreen a cominciare dalle funzionalità visualizza sorgente ed analizza elemento. Assolutamente importante prendere visione del codice sorgente di una pagina web: il codice sorgente visualizzabile dal browser è il risultato (output) dell'interazione client-server fra browser e server ed è il file di testo dove è possibile capire l'origine della struttura, la formattazione e gli script di funzionamento di una pagina Web. In sintesi nel file sorgente di una pagina web è contenuto il codice di marcatura html che definisce la struttura di una pagina web, il linguaggio di editing css che ne determina la formattazione e il linguaggio di scripting (javascript) che ne determina il funzionamento in relazione ai meccanismi di interazione con l'utente finale della pagina Web: salvare una pagina web in locale (file sorgente), modificare il file sorgente e verificare l'effetto delle modifiche è una ottima maniera per sperimentare il reale funzionamento del Web (esistno delle funzionalità insite nel browser come analizza elemento oppure plugin specifici di analisi del codice e del rendering di una pagina Web come il noto Firebug).
Se si considerano i tantissimi dispositivi di tipo diverso che accedono al Web (console, smartphone, desktop, netbook, WebTv, eccetera) si arriva facilmente alla conclusione che non solo esistono tantissimi browser di tipo diverso ma anche che è impossibile realizzare una pagina Web che venga visualizzata alla stessa maniera da tutti i dispositivi e conseguentemente da tutti i browser (è interessante notare come in alcune regioni geografiche ci sono massicce adozioni di browser di tipo drasticamente diverso da quelli universalmente noti). Diventa cosí importante poter provare e testare la pagina Web su più piattaforme possibili ed in mancanza di meglio su simulatori ed emulatori delle medesime. I computer desktop NON possono essere più considerati i privilegiati interlocutori del Web e agli ormai imperanti smartphone e tablet si stanno affiancando le soluzioni da salotto come le Web TV oppure le consolle alla kinect con proprie funzionalità e nuove interfacce di comando perlopiù basate su comandi vocali oppure gesti del corpo o della mano.
Qualora non sia possibile testare un sito Web con i tantissimi tipi diversi di browser esistenti al mondo (calcolate anche le versioni diverse per i diversi sistemi operativi...) è possibile avvalersi di specifici servizi di test messi liberamente a disposizione per webmaster scrupolosi.

occhialini google — Occhiali alla Google come esempio di come la realtà aumentata interagisce con la navigazione Web attraverso comandi vocali ma anche con l'esperienza quotidiana fisica: immaginatevi cosa vuol dire girare per una città come Firenze con questo tipo di gadget tecnologico alla moda...

esempio di comando gestuale — Comandi gestuali alla kinect: videogiochi ma anche navigazione Web a portata di gesto della mano.

Possono essere considerati browser anche quei dispositivi che ci permettono di accedere alla cosiddetta realtà aumentata ovvero alla realtà aumentata di informazioni digitali peraltro perlopiù ricavabili in tempo reale dal Web stesso. La realtà aumentata può ricavare informazioni dal nostro geoposizionamento, dalle immagini e dai suoni acquisibili dai nostri dispositivi digitali adempiendo ad esigenze comunicative così come di reperimento dell'informazione in base alla esperienza del nostro vissuto nell'ambiente reale.
E' importante tenere sempre presente le diverse possibilità di utilizzo offerte da dispositivi come smartphone, tablet touchscreen e viceversa quelle a disposizione su computer veri e propri con dispositivi di input completi (tastiere fisiche e mouse) riservando agli impegni di tipo professionale il solo utilizzo di computer veri e propri che consentono funzionalità di analisi e controllo realmente complete della comunicazione digitale di tipo Web.

Motori di ricerca

Il Web è comunemente inteso come lo spazio informativo e comunicativo comunemente indicizzato dai motori di ricerca di utilizzo comune mentre per Deep Web si intende la porzione del Web non indicizzato o non indicizzabile dai più noti motori di ricerca.
E' importante rendersi conto se ci si trova davanti ad una interfaccia di ricerca che utilizza spider, database e algoritmo di un altro motore di ricerca oppure di un vero e proprio motore di ricerca completo in ogni sua parte (tecnologica e grafica) di soluzioni originali.

Un motore di ricerca può essere rappresentato come una interfaccia alla quale è possibile sottoporre una query che induce una ricerca in un data base strutturato costituito da informazioni raccolte attraverso il lavoro automatizzato di spider (detti anche crawler o bot): il risultato della ricerca viene fornito in maniera ordinata (ranking) sulla base di un algoritmo matematico che tiene di conto delle caratteristiche informative del sito Web visitato dallo spider ma anche della sua ecologia di collegamenti con gli altri siti Web esistenti su Internet (quest'ultima idea di un ricercatore italiano che ha fatto la fortuna di Google consentendone il sorpasso su Altavista ed altri motori di ricerca affermatisi negli anni '90).

L'interfaccia grafica diventa quindi importante per conquistare l'attenzione dell'utente finale ma senza impegnarlo esageratamente: pensate alla semplicità dell'interfaccia di Google abbinata però all'idea fanstatica di modificare il proprio logo in un Doodle variabile a seconda dell'attualità. La base dati è altrettanto importante perchè consta delle informazioni (tante o poche raccolte dagli isntancabili spider, informazioni magari utili e originali oppure inutilmente duplicate) che possiamo interrogare. L'ordinamento dei risultati è forse l'elemento più strategico perchè è il meccanismo che ci consente di filtrare e selezionare l'informazione che veramente ci interessa rispetto alla query espressa.

Esistono molti motori di ricerca nel mondo oltre ai soliti noti che dominano il panorama nord-occidentale e tutti risultano molto più complessi della struttura relativamente semplificata di cui sopra proposta: ad esempio molti di loro si integrano con il lavoro di redazioni umane che sviluppano appositi alberi gerarchici informativi (directory) il cui contenuto viene miscelato nelle risposte innescate dalle interrogazioni svolte dall'utenza finale sui motori di ricerca.

Vi sono poi motori di ricerca speciali (aggregatori) capaci di indicizzare non il Web generico ma porzioni specifiche di esso come le immagini, i suoni, i video, i blog, eccetera. I motori di ricerca sono infatti sempre più in grado di interpretare gli oggetti multimediali per come sono realizzati affidandosi sempre meno alle alternative testuali per la loro corretta interpretazione. Alcuni motori di ricerca speciali, ad esempio, sono in grado di realizzare ricerche di immagini partendo da una immagine simile a quella che stiamo cercando, altri ancora miscelano i risultati raccolti con la posizione geolocalizzata dell'utente che sta svolgendo l'interrogazione sul motore di ricerca oppure con le attiità di ricerca informazione svolta precedentemente.
Quando si svolge una ricerca su un determinato argomento converrebbe esplicitare la ricerca su più canali informativi specifici, non fermandosi solo al Web generico ma indagando sull'ambito multimediale così come sui libri e documenti online, sui bookmark (segnalibri) scambiati fra utenti sull'argomento, sugli scambi comunicativi di tipo social, sulle novità dei blog magari estrapolabili tramite feed che ne sintetizzano il contenuto; vi possono poi essere delle ricerche con finalità molto specifiche come ad esempio quelle necessarie per individuare un nuovo brand ed allora tornano utili basi dati etimologiche, collezioni di nomi social e di domini Web nonchè elenchi di brevetti e marchi registrati.

Memoria digitale

La tecnologia digitale è naturalmente propensa a una comoda e facile riproducibilità dell'informazione su supporti digitali ma non a una inevitabile conservazione della medesima a causa del decadimento di interoperabilità di supporti fisici (hardware) e linguaggi (software).

I motori di ricerca sono uno degli strumenti principali per cercare di affrontare un problema emergente che è quello di salvaguardare la memoria collettiva ed individuale di noi tutti attraverso meccanismi ripetuti di riproducibilità nel tempo e nello spazio (backup sincronizzati fra server di località diverse) che finiscono per essere una buona strategia di conservazione.

Il problema infatti di un uso solo saltuario di formati e standard aperti, l'estrema volatilità dell'informazione digitale (facilmente riproducibile certo ma difficilmente conservabile a lungo) fa sí che il nostro vissuto e narrato sia a rischio di un inaspettato ma certo oblio. Fortunatamente esistono molte iniziative accademiche ed istituzionali ma anche associative e private (gli stessi motori di ricerca) che stanno tentando di affrontare il problema istituendo veri e propri archivi della conoscenza sviluppati attraverso tecnologie interoperabili tra di loro.
L'informazione digitale deve infatti essere considerata facilmente riproducibile ma non necessariamente conservabile a tempo indefinito dipendendo, la sua conservazione, dallo stato di salute dei supporti digitali utilizzati ma anche dalla capacità informatica di interrogare i medesimi (da qui l'importanza di standard informatici aperti ed interoperabili come il movimento del software libero).
Sarà interessante scoprire se avremo fisicamente la possibilità di conservare tutta l'informazione digitale prodotta oppure dovremmo necessariamente fare una selezione della medesima e se questa selezione sarà affidata a redazioni umane come nel caso delle directory oppure ad algoritmi come nel caso dei motori di ricerca. Nel frattempo è importante prendere coscienza dei motori di ricerca che mettono a disposizione un servizio di cache, dei motori di ricerca specializzati nella conservazione di memorie digitali e visuali, delle pratiche esistenti di deposito e validazione legale dei file digitali così come delle pagine Web e soprattutto approfittare di tutte quelle procedure e comandi speciali messi a disposizione da Google e compagnia come

cache:HTTP://WWW.DOMINIOCASUALE.COM/DIR/PAGINA_SINGOLA.HTML

che possono consentire quanto meno una collocazione storica della pagina Web relativamente alla tempistica di indicizzazione del motore di ricerca in uso così come a quelle pratiche di deposito e validazione magari supportati da protocolli di sicurezza crittografici (per finalità, ad esempio, di firma digitale).