Browser
Browser e motori di ricerca condividono analoghe incombenze di interazione con i server web dai quali sono riconosciuti ed identificati attraverso una stringa di codice testuale detta anche !User Agent che a volte è determinante nel visualizzare od interpretare in maniera diversa il Web ospitato sul server di riferimento. Nello scambio dati fra client e server soprattutto per quanto riguarda i browser gli !http headers sono file di testo importantissimo che includono - codifica dei caratteri, controllo della !cache, ultima data di modifica, !referrer ovvero pagina di provenienza eccetera compresi i !cookies che registrano una serie di informazioni circa le navigazioni sul Web con implicazioni delicate sul fronte della #privacy ma di indubbia comodità a livello funzionale. I motori di ricerca sono spesso integrati nei browser a livello di plugin, come funzioni attivate direttamente nell'!address url o attraverso moduli di ricerca adiacenti alla address url principale. L'address url e la sua visibilità nel browser rimane dunque un importante fattore di qualità nell'utilizzo di questi strumenti di navigazione del Web che pure possono conoscere, ad esempio grazie ai QR Code, possibili alternativi meccanismi di navigazione e conseguenti UX soprattutto tramite smart-devices.
chiudi approfondimento+ browsing
Ancora, browser e motori di ricerca rappresentano in qualche maniera le due facce, una umana e l'altra caratterizzata dal funzionamento di automatismi, della ricerca di informazione in Rete: mentre i browser sono utilizzati dagli utenti finali (umani) per comprendere l'informazione su Web e classificarla magari attraverso procedure di !tagging e !bookmarking, gli spider (anch'essi browser ma governati da automatismi e detti anche bot oppure crawler) vengono utili per indicizzare ed ordinare opportunamente la Rete di informazioni che si dipana sul Web secondo precisi !algoritmi matematici. Per i browser si può parlare di esplorazione e navigazione di dati mentre per i motori di ricerca di attività di ricerca, appunto, su specifiche basi dati: la differenza a livello di !UX non è banale perché puo voler dire subire l'effetto !filter bubble sui social ovvero essere circondati di relazioni ed informazioni comode e prevedibili sia per l'utente che per l'ambiente social che lo ospita così come decidere autonomamente - grazie ai motori di ricerca - quale patrimonio informativo a cui accedere attraverso l'opportuna !parola chiave Abracadabra. Il meccanismo del filter bubble può incidere non solo a livello individuale nei meccanismi di navigazione ma anche a livelli più profondi ed importanti e soprattutto di livello collettivo considerando come l'attuale !narrazione orale di tipo social può inficiare meccanismi di preservazione della memoria collettiva fino a mettere in dubbio asserite verità di tipo storiche (che per essere tali necessitano di processi collettivi di maturazione del dibattito sociale). Il !browser è uno strumento essenziale per la navigazione sul Web. Il Web fa parte della più ampia rete di comunicazione Internet composta da svariati servizi comunicativi caratterizzati tutti da uno specifico protocollo (insieme di regole): tutti i servizi comunicativi di Internet vengono erogati da specifici computer fornitori di servizi denominati come server interrogati allo scopo da computer desiderosi di ricevere il servizio attraverso specifici software che vengono denominati client e che cercano il servizio sul server su determinati indirizzi specifici noti anche come porte (ecco perché per la comunicazione Internet si parla di modello client-server). Tutti i computer per esistere e comunicare in Internet devono essere identificati da un indirizzo detto anche numero IP per comodità spesso tradotto in un indirizzo alfabetico (attraverso il noto servizo DNS). Molti servizi internet come ad esempio quello della posta elettronica o del trasferimento file (ftp) sono erogati solo attraverso una sessione di autenticazione (login) durante la quale sono forniti nome utente e password. Il browser è il software client che ottiene (senza autenticazione) dalla porta 80 del server Web la possibilità di interagire con una pagina Web attraverso il protocollo di comunicazione http. Per poter interagire al meglio con una pagina Web è molto importante avere piena consapevolezza di ciò che stiamo facendo ricordandosi di abilitare l'!address bar del browser, avere accesso a tutti i menù e funzionalità interne del browser magari prendendo dimestichezza a tal scopo con le scorciatoie da tastiera utili (ad esempio CTRL o CMD + U per una immediata visualizzazione del codice sorgente). Un click destro del mouse può offrire possibilità diverse di interazione a cominciare dalle funzionalità !visualizza sorgente ed !analizza elemento. Il codice sorgente visualizzabile dal browser è il risultato (output) dell'interazione client-server fra browser e server ed è il file di testo dove è possibile capire l'origine della struttura, la formattazione e gli script di funzionamento di una pagina Web. In sintesi nel file sorgente di una pagina web è contenuto il codice di marcatura html che definisce la struttura di una pagina web, il linguaggio di editing css che ne determina la formattazione e il linguaggio di scripting (javascript) che ne determina il funzionamento in relazione ai meccanismi di interazione con l'utente finale della pagina Web: salvare una pagina web in locale (file sorgente), modificare il file sorgente e verificare l'effetto delle modifiche è una ottima maniera per sperimentare il reale funzionamento del Web (esistono allo scopo delle funzionalità insite nel browser come analizza-ispeziona elemento per analisi del codice e del rendering di una pagina Web dopo lo sviluppo del cosiddetto DOM - Document Object Model. Se si considerano i tantissimi dispositivi di tipo diverso che accedono al Web (console, smartphone, desktop, netbook, WebTv, eccetera) si arriva facilmente alla conclusione che non solo esistono tantissimi browser di tipo diverso ma anche che è impossibile realizzare una pagina Web che venga visualizzata alla stessa maniera da tutti i dispositivi e conseguentemente da tutti i browser (è interessante notare come in alcune regioni geografiche ci sono massicce adozioni di browser di tipo drasticamente diverso da quelli universalmente noti). Diventa cosí importante poter provare e testare la pagina Web su più piattaforme possibili ed in mancanza di meglio su simulatori ed emulatori delle medesime. I computer desktop NON possono essere più considerati i privilegiati interlocutori del Web e agli ormai imperanti smartphone e tablet si stanno affiancando le soluzioni da salotto come le Web TV oppure le consolle alla kinect con proprie funzionalità e nuove interfacce di comando perlopiù basate su comandi vocali oppure gesti del corpo o della mano. Qualora non sia possibile testare un sito Web con i tantissimi tipi diversi di browser esistenti al mondo è possibile avere una percezione affidabile del rendering su altri dispositivi e browser modificando il proprio user agent ad esempio attraverso User Agent Switcher. In ogni caso è consigliabile prendere in considerazione i seguenti browser: Firefox per la sua natura Open Source garanzia di sicurezza ed interoperabilità; Chrome per la sua ampia offerta di tool di analisi Web; Opera molto interessante per il suo motore di rendering proprietario per il javascript e per le sue innumerevoli e funzionali soluzioni di interfaccia utente; Brave per le sue opzioni avanzate di protezione della privacy ed ad-blocking.
MOTORI DI RICERCA
Il Web è comunemente inteso come lo spazio informativo e comunicativo comunemente indicizzato dai motori di ricerca di utilizzo comune - social inclusi - mentre per !Deep Web si intende la porzione del Web non indicizzato o non indicizzabile dai comuni motori di ricerca essendo necessario un software di sicurezza per varcarne la soglia. E' importante rendersi conto se ci si trova davanti ad una interfaccia di ricerca che utilizza !spider, !database e !algoritmo di un altro motore di ricerca oppure ad un vero e proprio motore di ricerca completo in ogni sua parte (tecnologica e grafica) di soluzioni originali. Un motore di ricerca può essere rappresentato come una interfaccia alla quale è possibile sottoporre una !query (ultimamente definite anche come entità sotto un profilo semantico) che induce una ricerca in un data base strutturato costituito da informazioni raccolte attraverso il lavoro automatizzato di spider (detti anche crawler o bot). Il risultato della ricerca viene fornito in maniera ordinata (ranking in inglese) sulla base di un algoritmo matematico che tiene di conto delle caratteristiche informative del sito Web visitato dallo spider (in primis la quantità e la qualità dei contenuti) ma anche della sua ecologia di collegamenti con gli altri siti Web esistenti su Internet (quest'ultima idea del ricercatore italiano Marchiori che, col suo hypersearch, ha fatto la fortuna di Google consentendone il sorpasso su Altavista ed altri motori di ricerca affermatisi negli anni '90 come ad esempio Yahoo! integrato poi da Bing). E' importante sapere come presentare le informazioni ai motori di ricerca in termini di meta-descrizioni ma è altrettanto prendere atto che gli algoritmi sono sempre più in grado, attraverso anche meccanismi di !pattern recognition, di interpretare ed addirittura imparare ad interpretare (!machine learning) schemi molto complessi di dati ed ancor più se hanno grandi moli di dati ovvero !Big Data a disposizione. Ovviamente, per facilitare questi meccanismi è necessario rapportarsi a questi veri e propri strumenti di !A.I. sottoponendo informazione - sia essa in forma vocale, visuale o scritta - nella maniera più chiara e comprensibile possibile. L'interfaccia grafica è importante per conquistare l'attenzione dell'utente finale ma senza impegnarlo esageratamente: pensate alla semplicità dell'interfaccia di Google abbinata però all'idea fantastica di modificare il proprio logo in un doodle variabile a seconda dell'attualità. La base dati è altrettanto importante perché consta delle informazioni (tante o poche raccolte dagli instancabili spider, informazioni magari utili e originali oppure inutilmente duplicate) che possiamo interrogare. L'ordinamento dei risultati è forse l'elemento più strategico perché è il meccanismo che ci consente di filtrare e selezionare l'informazione che veramente ci interessa rispetto alla query espressa. La !query può essere espressa in maniera diretta - magari conoscendo sintassi ed opzioni di ricerca oppure attraverso l'interfaccia di modalità avanzata di ricerca. Oltre alla modalità avanzata di ricerca e ai conseguenti comandi di ricerca è utile fare conoscenza dei principali canali di ricerca offerti da Google oltre al Web generico e in particolare con il canale immagine.
chiudi approfondimento+ bot robot ai
Vi sono poi !motori di ricerca speciali ed aggregatori capaci di indicizzare non il Web generico ma porzioni specifiche di esso come le immagini, i suoni, i video, i blog, eccetera: fra tutti merita citare necessariamente quella fantastica raccolta di immagini, testi e suoni del patrimonio culturale raccolto e digitalizzato da 'europei' e che corrisponde al nome di Europeana che, come altri, mette a disposizione molto materiale di tipo Creative Commons. I motori di ricerca sono inoltre sempre più in grado di interpretare gli oggetti multimediali per come sono realizzati anche se testo (ed alternative testuali) così come i meta-dati rimangano i riferimenti principali per una corretta interpretazione ed indicizzazione. Alcuni motori di ricerca speciali, ad esempio, sono in grado di realizzare Reverse Image Search partendo da una immagine simile a quella che stiamo cercando, altri ancora miscelano i risultati raccolti con la posizione geolocalizzata dell'utente che sta svolgendo l'interrogazione sul motore di ricerca oppure con le attività di ricerca informazione svolta precedentemente. Quando si svolge una ricerca su un determinato argomento converrebbe esplicitare la ricerca su più canali informativi specifici, non fermandosi solo al Web generico ma indagando sull'ambito multimediale - suoni compresi. vi possono poi essere delle ricerche con finalità molto specifiche come ad esempio quelle necessarie per individuare un nuovo brand ed allora tornano utili basi dati etimologiche, collezioni di nomi social e di domini Web nonchè ricerche nei database di marchi registrati. Altri ancora, molto particolari, consentono di effettuare ricerche molto precise su basi dati scientifiche e in merito a pubblicazioni in pdf, ricercano fra i meta dati di fotografie online (quei dati visualizzabili pubblicamente sulle foto-account di Google+ per capirsi...) per individuare macchine fotografiche smarrite o derubate, si candidano come piattaforme distribuite su tecnologia basata su software libero oppure offrono la possibilità di verificare contenuti eventualmente duplicati su altri siti Web. Per gli smanettoni ed amanti del codice sorgente delle pagine web publicWWW mentr per coloro che cercano ispirazioni in tema layout ed utilizzo dei colori Muzli Search. Qualsiasi sia il motore di ricerca che ci troviamo di fronte è sempre importante andare ad indagare la sua modalità di !advanced search con i !search commands e carpire la vision che lo rappresenta come ad esempio quella particolarissima di DuckDuckGo che promette il rispetto della privacy dei propri utenti evitando l'adozione di qualsiasi procedura di !tracking al pari del motore di ricerca Fair sviluppato dall'azienda di settore della visibilità suimotori di ricerca Ahrefs e del motore di ricerca Brave sviluppato dall'azienda produttrice dell'omonimo browser.
Esistono molti motori di ricerca nel mondo oltre ai soliti noti Google e Bing che dominano il panorama nord-occidentale. Sopratutto ad Oriente c'è un fiorire di motori di ricerca che cercano eda a volte riescano a contrastare il predominio di Google (assoluto nell'area nord-occidentale) come ad esempio il sud-coreano Naver ma soprattutto il gigante Baidu, l'emergente 360Search oppure sogou per la Cina e dintorni e l'emergente Yandex per la aree russofone (in Italia per la cronaca esiste il tentativo di motore di ricerca istella così come in Francia si sta portando avanti un motore di ricerca sperimentale molto interessante di respiro europeo di nome Qwant).
Memoria digitale
La questione della memoria digitale è una problematica complessa che nasce dall'obsolescenza dei supporti hardware stimabile in moli casi in poco più di dieci anni di durata: i formati software possono viceversa avere vita anche più lunga ma non indeterminata soprattutto se si ragiona di accesso e fruibilità di software proprietario (il !software libero, viceversa, è per sua definizione interoperabile a tempo indeterminato). Per risolvere questa problematica della conservazione del digitale oltre ad una serie di competenze diffuse preziosissime per il restauro di hardware obsoleto esistono numerosi standard internazionali come il noto Open Archival Information System nonché iniziative locali per la preservazione degli strumenti di comunicazione. L'informazione digitale deve essere infatti considerata facilmente riproducibile ma non necessariamente conservabile a tempo indefinito: la teoria della conservazione deve prendere in considerazione lo stato di salute dei supporti digitali utilizzati ma anche la capacità informatica di elaborare i medesimi da cui l'importanza di standard informatici aperti ed interoperabili e del movimento del !software libero. Numerosi sono i tool di analisi (e molti di loro multipiattaforma ed Open Source) dei numerosissimi formati di file esistenti che garantiscano non solo l'accesso da parte dell'utenza ma la piena funzionalità delle interfacce relativamente alla sostenibilità dei formati stessi maggiormente garantita a lungo termine dai file facenti riferimento alla tipologia FOSS per la loro caratteristica di standard aperto: !ExifTool permette di visualizzare e metadati, DROId, come esplicita l'acronimo, consente di identificare la natura dei file esaminati, !XENA facilita la conversione di file in formati aperti, !ARCHIVEMATICA è una una suite integrata di strumenti open source che consente di archiviare oggetti digitali secondo il modello funzionale !OAIS. Ma quali sono gli ambiti applicativi specifici per l'archiviazione del Web?
chiudi approfondimento+ Memoria digitale
Moltissimi strumenti software utili per la conservazione della memoria digitale sul Web ruotano intorno all'apposito standard WARC utilizzato ad esempio da molti !offline browser capaci di scaricare ed archiviare interi siti Web come il popolare HTTrack Website Copier che ha un proprio standard di archiviazione ma che può essere convertito nel formato arc tramite il tool httrack2arc sviluppato dall'attivissimo servizio di conservazione digitale portoghese ARQUIVO.PT (standard peraltro adottati anche da altri progetti di archiviazione come quello inglese oppure il Pandora australiano). La questione dei formati di file è peraltro centrale e quindi risultano utili strumenti come ExifTool per il trattamento dei meta dati (fondamentali per descrivere e catalogare la risorsa da archiviare) ma ancor prima tool come "Digital Record Object IDentification" (DROID) utili per l'identificazione del formato dei file ed eventuale loro conversione in formati standard ed adatti per la preservazione a lungo termine. cache:www.infoaccessibile.com è una query di esempio che consente di visualizzare la pagina Web nelle sue versioni passate ed archiviate nella cache di motori di ricerca che possano funzionare anche come validazione delle pagine Web (o di altre tipologie di file digitali tramite sistemi crittografici di firma digitale). L'iniziativa più autorevole ed utile a livello internazionale per la salvaguardia a lungo termine di file multimediali è il noto ed autorevole portale di conservazione digitale Archive che offre la possibilità di accedere e scaricare varie tipologie di opere digitali (dai film ai videogiochi) così come di poter creare delle collezioni private di opere da salvaguardare nel tempo. In Italia deposito legale è finalizzata a salvaguardare nel tempo pubblicazioni digitali quali tesi di dottorato.
Webrecorder offre una serie di tool utili che consentono di archiviare in formati standard siti web mentre si navigano con appositi browser per registrare un'esperienza utente sul Web comprensiva di evenutali sessioni di login (pensate all'esperienza utente social) che peraltro rappresentano delle vere e proprie barriere all'archiviazione per le procedure di offline-browser essendo quest'ultime in grado di salvare solo ciò che è pubblicamente accessibile senza pratiche di autenticazione (peraltro molti social network offrono procedure di backup di pagine ed account così come di poter nominare altri account "eredi digitali").
La tematica della memoria digitale impatta per tutte le forme di espressione che possono trovare nei moderni ritrovati della comunicazione e tecnologia digitale delle soluzioni al loro rapido o lento oblio: è il caso dei graffiti conservati a futura memoria da graffyard tramite apposizione di QR-Code (anche quando cancellati dai muri come nel caso del percorso Bambina Precoce n. 8 - 1985 di !street art ideato su Wikitude) oppure i libri cartacei che possono tovare nuove forme e nuove opportunità di condivisione (digitali) grazie al movimento !hacker dei DIY book scanner. Particolarmente intrigante la possibilità di acquisire libri in forma di immagine tramite quel fantastico connubio di meccanica-falegnameria-ottica-elettronica che è il !bookscanner da trasformare in fase di post-produzione tramite apposito software ad hoc come ScanTailor in immagini tif e quindi in file pdf tramite altro software specifico come gscan2pdf per renderli infine accessibili tramite i portentosi servizi di !Archive comprensivi anche di opzione ocr per la loro trasformazione in testo vero (e comunque possibile anche con software specifico come OCRFeeder).