I browser sono quei software di tipo client (come ad esempio Firefox) che interagendo con i server web (come il progetto Open Source Apache) ci permettono di visualizzare ed utilizzare il Web cosí come lo conosciamo; i motori di ricerca sono interfacce web utilizzabili da browser che ci permettono di semplificare l'accesso all'informazione su Web interrogando poderosi basi di dati che ci offrono una selezione di informazioni utili in maniera efficacemente ordinata.

Browser e motori di ricerca

Browser e motori di ricerca condividono analoghe incombenze di interazione con i server web dai quali sono riconosciuti ed identificati attraverso una stringa di codice testuale detta anche user agent che a volte è determinante nel visualizzare od interpretare in maniera diversa il Web ospitato sul server di riferimento. Nello scambio dati fra client e server soprattutto per quanto riguarda i browser gli !http headers sono file di testo importantissimo che includono - codifica dei caratteri, controllo della !cache, ultima data di modifica, !referrer ovvero pagina di provenienza eccetera compresi i !cookies che registrano una serie di informazioni circa le navigazioni sul Web con implicazioni delicate sul fronte della #privacy ma di indubbia comodità a livello funzionale. I motori di ricerca sono spesso integrati nei browser a livello di plugin, come funzioni attivate direttamente nell'!address url o attraverso moduli di ricerca adiacenti alla address url principale. L'address url e la sua visibilità nel browser rimane dunque un importante fattore di qualità nell'utilizzo di questi strumenti di navigazione del Web.

Ancora, browser e motori di ricerca rappresentano in qualche maniera le due facce, una umana e l'altra caratterizzata dal funzionamento di automatismi, della ricerca di informazione in Rete: mentre i browser sono utilizzati dagli utenti finali (umani) per comprendere l'informazione su Web e classificarla magari attraverso procedure di !tagging e !bookmarking, gli spider (anch'essi browser ma governati da automatismi e detti anche bot oppure crawler) vengono utili per indicizzare ed ordinare opportunamente la Rete di informazioni che si dipana sul Web secondo precisi algoritmi matematici. Per i browser si può parlare di esplorazione e navigazione di dati mentre per i motori di ricerca di attività di ricerca, appunto, su specifiche basi dati.

Browser

Il !browser è uno strumento essenziale per la navigazione sul Web. Il Web fa parte della più ampia rete di comunicazione Internet composta da svariati servizi comunicativi caratterizzati tutti da uno specifico protocollo (insieme di regole): tutti i servizi comunicativi di Internet vengono erogati da specifici computer fornitori di servizi denominati come server interrogati allo scopo da computer desiderosi di ricevere il servizio attraverso specifici software che vengono denominati client e che cercano il servizio sul server su determinati indirizzi specifici noti anche come porte (ecco perchè per la comunicazione Internet si parla di modello client-server). Tutti i computer per esistere e comunicare in Internet devono essere identificati da un indirizzo detto anche numero IP per comodità spesso tradotto in un indirizzo alfabetico (attraverso il noto servizo DNS). Molti servizi internet come ad esempio quello della posta elettronica o del trasferimento file (ftp) sono erogati solo attraverso una sessione di autenticazione (login) durante la quale sono forniti nome utente e password.

Il browser è il software client che ottiene (senza autenticazione) dalla porta 80 del server Web la possibilità di interagire con una pagina Web attraverso il protocollo di comunicazione http. Per poter interagire al meglio con una pagina Web è molto importante avere piena consapevolezza di ciò che stiamo facendo ricordandosi di abilitare l'!address bar del browser, avere accesso a tutti i menù e funzionalità interne del browser magari prendendo dimestichezza a tal scopo con le scorciatoie da tastiera utili (ad esempio, per una immediata visualizzazione del codice sorgente). E' importante ricordare che a seconda dell'interfaccia hardware e software che abbiamo a disposizione l'interazione con la pagina web può cambiare significativamente: un click destro del mouse, ad esempio, può offrire possibilità diverse di interazione rispetto ai diversi movimenti delle dita su un touchscreen a cominciare dalle funzionalità !visualizza sorgente ed !analizza elemento. Assolutamente importante prendere visione del codice sorgente di una pagina web: il codice sorgente visualizzabile dal browser è il risultato (output) dell'interazione client-server fra browser e server ed è il file di testo dove è possibile capire l'origine della struttura, la formattazione e gli script di funzionamento di una pagina Web. In sintesi nel file sorgente di una pagina web è contenuto il codice di marcatura html che definisce la struttura di una pagina web, il linguaggio di editing css che ne determina la formattazione e il linguaggio di scripting (javascript) che ne determina il funzionamento in relazione ai meccanismi di interazione con l'utente finale della pagina Web: salvare una pagina web in locale (file sorgente), modificare il file sorgente e verificare l'effetto delle modifiche è una ottima maniera per sperimentare il reale funzionamento del Web (esistono allo scopo delle funzionalità insite nel browser come analizza elemento oppure plugin specifici di analisi del codice e del rendering di una pagina Web come il noto !Firebug).

Se si considerano i tantissimi dispositivi di tipo diverso che accedono al Web (console, smartphone, desktop, netbook, WebTv, eccetera) si arriva facilmente alla conclusione che non solo esistono tantissimi browser di tipo diverso ma anche che è impossibile realizzare una pagina Web che venga visualizzata alla stessa maniera da tutti i dispositivi e conseguentemente da tutti i browser (è interessante notare come in alcune regioni geografiche ci sono massicce adozioni di browser di tipo drasticamente diverso da quelli universalmente noti). Diventa cosí importante poter provare e testare la pagina Web su più piattaforme possibili ed in mancanza di meglio su simulatori ed emulatori delle medesime. I computer desktop NON possono essere più considerati i privilegiati interlocutori del Web e agli ormai imperanti smartphone e tablet si stanno affiancando le soluzioni da salotto come le Web TV oppure le consolle alla kinect con proprie funzionalità e nuove interfacce di comando perlopiù basate su comandi vocali oppure gesti del corpo o della mano. Qualora non sia possibile testare un sito Web con i tantissimi tipi diversi di browser esistenti al mondo (uno per tutti il cinese Maxthon) è possibile avvalersi di specifici servizi di test messi liberamente a disposizione per webmaster scrupolosi. Alcuni di questi servizi sono gratuiti e permettono di verificare il rendering di browser come Internet Explorer, altre piattaforme di test come Browser Shots consentono di verificare il rednering di numerosi browser su svariate piattaforme mentre altre ancora come BrowserStack consentono test di verifica sia su dispositivi desktop che mobili. Non manca neanche la possibilità di concentrarsi sui browser per dispositivi mobili comprendenti simulatori per iOS ma anche Firefox OS ed emulatori per Android. I fantastici laboratori di Opera offrono soluzioni multipiattaforma non solo per emulare il loro, per ora, diffuso Opera Mobile ma anche per emulare il contenuto Web per Smart TV. Assolutamente interessanti i cosiddetti Open Device Lab che, diffusi in tutto il mondo (Italia compresa), mettono a disposizione nei propri locali numerosissimi device per testare il proprio operato digitale.

Possono essere considerati browser anche quei dispositivi ed app come la performante Layar, la storica wikitude oppure l'emergente Goggles per il visuale e Shazam per l'informazione audio che ci permettono di accedere alla cosiddetta !realtà aumentata ovvero alla realtà... aumentata di informazioni digitali peraltro perlopiù ricavabili in tempo reale dal Web stesso. La realtà aumentata può ricavare informazioni dal nostro geoposizionamento, dalle immagini e dai suoni acquisibili dai nostri dispositivi digitali adempiendo ad esigenze comunicative così come di reperimento dell'informazione in base alla esperienza del nostro vissuto nell'ambiente reale. E' importante tenere sempre presente le diverse possibilità di utilizzo offerte da dispositivi come smartphone, tablet touchscreen e viceversa quelle a disposizione su computer veri e propri con dispositivi di input completi (tastiere fisiche e mouse) riservando agli impegni di tipo professionale il solo utilizzo di computer veri e propri che consentono funzionalità di analisi e controllo realmente complete della comunicazione digitale di tipo Web. Gli occhiali alla Google sono un esempio di come la realtà aumentata interagisce con la navigazione Web attraverso comandi vocali ma anche con l'esperienza quotidiana fisica: immaginatevi cosa vuol dire girare per una città come Firenze con questo tipo di gadget tecnologico alla moda...

Motori di ricerca

Il Web è comunemente inteso come lo spazio informativo e comunicativo comunemente indicizzato dai motori di ricerca di utilizzo comune mentre per !Deep Web si intende la porzione del Web non indicizzato o non indicizzabile dai più noti motori di ricerca. E' importante rendersi conto se ci si trova davanti ad una interfaccia di ricerca che utilizza spider, database e algoritmo di un altro motore di ricerca oppure ad un vero e proprio motore di ricerca completo in ogni sua parte (tecnologica e grafica) di soluzioni originali. Un motore di ricerca può essere rappresentato come una interfaccia alla quale è possibile sottoporre una !query (ultimamente definite anche come entità sotto un profilo semantico) che induce una ricerca in un data base strutturato costituito da informazioni raccolte attraverso il lavoro automatizzato di spider (detti anche crawler o bot): il risultato della ricerca viene fornito in maniera ordinata (ranking in inglese) sulla base di un algoritmo matematico che tiene di conto delle caratteristiche informative del sito Web visitato dallo spider (in primis la quantità e la qualità dei contenuti) ma anche della sua ecologia di collegamenti con gli altri siti Web esistenti su Internet (quest'ultima idea del ricercatore italiano Marchiori che, col suo hypersearch, ha fatto la fortuna di Google consentendone il sorpasso su Altavista ed altri motori di ricerca affermatisi negli anni '90 come ad esempio Yahoo! integrato poi da Bing).

L'interfaccia grafica è importante per conquistare l'attenzione dell'utente finale ma senza impegnarlo esageratamente: pensate alla semplicità dell'interfaccia di Google abbinata però all'idea fantastica di modificare il proprio logo in un doodle variabile a seconda dell'attualità. La base dati è altrettanto importante perchè consta delle informazioni (tante o poche raccolte dagli instancabili spider, informazioni magari utili e originali oppure inutilmente duplicate) che possiamo interrogare. L'ordinamento dei risultati è forse l'elemento più strategico perchè è il meccanismo che ci consente di filtrare e selezionare l'informazione che veramente ci interessa rispetto alla query espressa.

La !query può essere espressa in maniera semplice oppure attraverso l'interfaccia di modalità avanzata di ricerca Oltre alla modalità avanzata di ricerca e ai conseguenti comandi di ricerca è utile fare conoscenza dei principali canali di ricerca offerti da Google oltre al Web generico e in particolare con il canale immagine.

Esistono molti motori di ricerca nel mondo oltre ai soliti noti Google e Bing che dominano il panorama nord-occidentale e tutti risultano molto più complessi della struttura relativamente semplificata di cui sopra proposta: ad esempio molti di loro si integrano con il lavoro di redazioni umane che sviluppano appositi alberi gerarchici informativi (directory) il cui contenuto viene miscelato nelle risposte innescate dalle interrogazioni svolte dall'utenza finale sui motori di ricerca. Sopratutto ad Oriente c'è un fiorire di motori di ricerca che cercano eda a volte riescano a contrastare il predominio di Google (assoluto nell'area nord-occidentale) come ad esempio i sud-coreani Daum e Naver ma soprattutto il gigante Baidu, l'emergente 360Search e i minori soso e sogou per la Cina e dintorni e l'emergente Yandex per la aree russofone (in Italia per la cronaca esiste il tentativo di motore di ricerca istella nonché l'esperimento francese Qwant come ambiziosa alternativa europea).

Vi sono poi !motori di ricerca speciali ed aggregatori capaci di indicizzare non il Web generico ma porzioni specifiche di esso come le immagini, i suoni, i video, i blog, eccetera. I motori di ricerca sono inoltre sempre più in grado di interpretare gli oggetti multimediali per come sono realizzati anche se testo (ed alternative testuali) così come i meta-dati rimangano i riferimenti principali per una corretta interpretazione ed indicizzazione. Alcuni motori di ricerca speciali, ad esempio, sono in grado di realizzare ricerche di immagini partendo da una immagine simile a quella che stiamo cercando, altri ancora miscelano i risultati raccolti con la posizione geolocalizzata dell'utente che sta svolgendo l'interrogazione sul motore di ricerca oppure con le attività di ricerca informazione svolta precedentemente. Quando si svolge una ricerca su un determinato argomento converrebbe esplicitare la ricerca su più canali informativi specifici, non fermandosi solo al Web generico ma indagando sull'ambito multimediale - suoni compresi - così come sui libri e documenti online, sui bookmark (segnalibri) scambiati fra utenti sull'argomento, sugli scambi comunicativi di tipo social a cominciare dai canali cosidetti QA, sulle novità dei blog magari estrapolabili tramite feed che ne sintetizzano il contenuto; vi possono poi essere delle ricerche con finalità molto specifiche come ad esempio quelle necessarie per individuare un nuovo brand ed allora tornano utili basi dati etimologiche, collezioni di nomi social e di domini Web nonchè elenchi di brevetti e marchi registrati. Altri ancora, molto particolari, consentono di effettuare ricerche molto precise su basi dati scientifiche, consentono di suddividere semanticamente gli argomenti in cluster, ricercano fra i meta dati di fotografie online (quei dati visualizzabili pubblicamente sulle foto-account di Google+ per capirsi...) per individuare macchine fotografiche smarrite o derubate, si candidano come piattaforme distribuite su tecnologia basata su software libero oppure offrono la possibilità di verificare contenuti eventualmente duplicati su altri siti Web.

Qualsiasi sia il motore di ricerca che ci troviamo di fronte è sempre importante andare ad indagare la sua modalità di !advanced search con i !search commands e carpire la vision che lo rappresenta come ad esempio quella particolarissima di DuckDuckGo che promette il rispetto della privacy dei propri utenti evitando l'adozione di qualsiasi procedura di !tracking così come riflettere sulla commistione fra piattaforme social e motori di ricerca come nel caso dell'interfaccia avanzata di ricerca di Twitter che presenta delle interessantissime modalità di ricerca in ambito social relative anche a topic ed opzioni di geolocalizzazione.

Memoria digitale

La tecnologia digitale è naturalmente propensa a una comoda e facile riproducibilità dell'informazione su supporti digitali ma non a una inevitabile conservazione della medesima a causa del decadimento di supporti fisici (hardware) e linguaggi (software). I !motori di ricerca sono uno degli strumenti principali per cercare di affrontare un problema emergente che è quello di salvaguardare la memoria collettiva ed individuale di noi tutti attraverso meccanismi ripetuti di riproducibilità nel tempo e nello spazio (backup sincronizzati fra server di località diverse) che finiscono per essere una buona strategia di conservazione delle nostra memoria digitale che rimane comunque una delle tante emergenze socio-culturali della nostra contemporaneità in diretto antagonismo con altre pulsioni ed esigenze emergenti come quelle del diritto all'oblio. Il problema, infatti, di un uso solo saltuario di formati e standard aperti, l'estrema volatilità dell'informazione digitale (facilmente riproducibile certo ma difficilmente conservabile a lungo) fa sí che il nostro vissuto e narrato sia a rischio di un inaspettato ma certo oblio. Fortunatamente esistono molte iniziative accademiche ed istituzionali ma anche associative e private che stanno tentando di affrontare il problema istituendo veri e propri archivi della conoscenza sviluppati attraverso tecnologie interoperabili tra di loro. L'informazione digitale deve infatti essere considerata facilmente riproducibile ma non necessariamente conservabile a tempo indefinito dipendendo, la sua conservazione, dallo stato di salute dei supporti digitali utilizzati ma anche dalla capacità informatica di elaborare i medesimi (da qui l'importanza di standard informatici aperti ed interoperabili e del movimento del !software libero).

Sarà interessante scoprire se avremo fisicamente la possibilità di conservare tutta l'informazione digitale prodotta oppure dovremmo necessariamente fare una selezione della medesima e se questa selezione sarà affidata a redazioni umane come nel caso delle directory oppure ad algoritmi come nel caso dei motori di ricerca. Nel frattempo è importante prendere coscienza dei motori di ricerca che mettono a disposizione un servizio di cache come il famoso Archive (che promuove tantissime iniziative legate alla problematica della memoria digitale compresa l'opportuntià di depositare e convertire in vari formati qualsiasi tipo di informazione digitale), così come delle pratiche esistenti di deposito legale ma anche di validazione delle pagine Web (o di altre tipologie di file digitali tramite sistemi crittografici di firma digitale).

Esistono molti strumenti software utili per la conservazione della memoria digitale sul Web come gli !offline browser capaci di scaricare ed archiviare interi siti Web così come alcuni plugin di browser come Resurrect Pages per Firefox che consentono di visualizzare la pagina Web nelle sue versioni passate ed archiviate nella !cache di motori di ricerca ed archivi digitali speciali come il già citato !Archive.

La tematica della memoria digitale impatta per tutte le forme di espressione che possono trovare nei moderni ritrovati della comunicazione e tecnologia digitale delle soluzioni al loro rapido o lento oblio: è il caso dei graffiti conservati a futura memoria da graffyard anche quando cancellati dai muri oppure i libri cartacei che possono tovare nuove forme e nuove opportunità di condivisione (digitali) grazie al movimento !hacker dei book scanner. Particolarmente intrigante la possibilità di acquisire libri in forma di immagine tramite quel fantastico connubio di meccanica-falegnameria-ottica-elettronica che è il !bookscanner da trasformare in fase di post-produzione tramite apposito software ad hoc come ScanTailor in immagini tif e quindi in file pdf tramite altro software specifico come gscan2pdf per renderli infine accessibili tramite i portentosi servizi di !Archive comprensivi anche di opzione ocr per la loro trasformazione in testo vero (e comunque possibile anche con software specifico come OCRFeeder).

Contatti

IVA 01801060979
ebisenzi on skype
classe virtuale su Edmodo
profilo su linkedin
bisenzi@accademiacarrara.it

infoA services pack

Un pacchetto di servizi indispensabili per valorizzare la propria comunicazione digitale ad un prezzo imbattibile: scopri l'offerta infoA services pack

Lavori in corso per soluzioni industriali