jblog: news e appunti per webmaster
 

CommonTag logoA partire da oggi è stato reso pubblico il progetto Common Tag ed il sito commontag.org che ne rappresenterà il punto di riferimento.

Questo progetto si propone di creare un nuovo standard per migliorare il collegamento fra i contenuti web sfruttando il significato delle parole e dei tag.

Il tagging attuale

Per loro natura, i tag servono a etichettare e organizzare i contenuti sul web e, di conseguenza, migliorare i risultati di ricerca. Tuttavia, in assenza di uno standard comune i vantaggi dei tag risultano limitati in quanto software e siti web non riescono a interpretarli al meglio.

Un’altro problema è di tipo semantico. Poiché una parola può avere più di un significato non è possibile avere la certezza che dei contenuti collegati fra loro si riferiscano allo stesso argomento. Ad esempio, con il tagging attuale una foto di un ragno verrebbe collegata a un documento che parla di internet solo perché entrambi potrebbero riferirsi al tag “web” (ragnatela).

Da qui nasce il bisogno di definire uno standard che, oltre a gestire i tag, sappia tener conto dei significati delle parole in determinati contesti.

Il formato Common Tag

Il progetto è stato sviluppato per affrontare le attuali carenze del tagging e aiutare utenti, editori e sviluppatori a ottenere maggiori e più precisi collegamenti fra i propri contenuti e il resto del web. Ecco i punti chiave:

  • Common Tag si basa sul formato standard RDFa
  • Il significato dei singoli tag è memorizzato in grandi database gestiti come dizionari
  • Ai contenuti e ai tag vengono attribuiti i rispettivi significati, grazie ai quali potranno relazionarsi con altri contenuti del web

La precisione delle relazioni si ottiene grazie all’utilizzo di metadati e concetti ben definiti con cui vengono taggati i contenuti. Attualmente questo progetto si serve di due grandi dizionari da cui prelevare i significati dei vari tag:

  • FreeBase, un database sociale di concetti e argomenti che più interessano agli utenti
  • DBpedia, un server in cui le informazioni sono rappresentate come in Wikipedia e leggibile dall’esterno grazie all’interfaccia pubblica

Ecosistema dei Common Tag

Come funziona, tecnicamente

Modello Common TagIl formato Common Tag si basa sul formato standard RDFa, un meccanismo che consente di strutture il contenuto di documenti HTML. Lo standard RDFa è stato sviluppato dal W3C ed è supportato da Google e Yahoo! grazie al quale forniscono maggiori risultati nelle ricerche.

La struttura del modello Common Tag è molto semplice.

  • I contenuti (e le loro singole parole) possono essere taggati con uno o più tag
  • Ogni Common Tag può contenere la URL di un’altra risorsa che ne identifica univocamente il concetto descritto, cioè il suo significato
  • Opzionalmente potrebbe contenere altre informazioni come la data di creazione e l’etichetta

Il significato dei singoli tag è memorizzato in grandi database (come Freebase.com e dbpedia.org)  che di fatto vengono gestiti come dizionari; grazie a questi database è possibile effettuare collegamenti basati sul significato anziché sulla parola. In questi enormi database ogni tag ha una pagina composta da tutte le sue informazioni, strutturate secondo lo standard RDFa.

I database dei significati possono essere letti da siti e applicazioni esterne grazie alle interfacce pubbliche (o API), da imparare grazie alla relativa e approfondita documentazione. Guarda la documentazione di Freebase e la documentazione di DBpedia.

Maggiori informazioni. Se ti interessa approfondire il lato tecnico dei Common Tag non ti resta che consultare la Quick Start Guide e le Specifiche dei Common Tag, e lo standard RDFa (sul sito del W3C).

ESEMPIO. Ecco un semplice esempio preso da commontag.org. Con questo codice si indica che il documento corrente riguarda la band U2 (vedi l’attributo “resource”).

<body xmlns:ctag="http://commontag.org/ns#" rel="ctag:tagged">
   <span   typeof="ctag:Tag"
           rel="ctag:means"
           resource="http://rdf.freebase.com/ns/en.u2"/>
</body>

Contenuti più usabili

Man mano che i Common Tag saranno utilizzati i contenuti web verranno attribuiti a un numero sempre maggiore di tag e significati. Questo sarà vantaggioso sia per gli utenti, che avranno più contenuti fra i quali scegliere, sia per gli editori, che vedranno aumentare notevolmente le visite nel proprio sito.

Inoltre, il fatto che i principali motori di ricerca supportino adeguatamente il markup standard RDFa gioca a favore della diffusione dei Common Tag. Quindi gli sviluppatori non avranno molte scuse per non utilizzarli. Entrambi i motori di ricerca hanno sviluppato le proprie applicazioni che sfruttano i Common Tag per fornire maggiori e più dettagliati risultati di ricerca: SearchMonkey di Yahoo! e Rich Snippets di Google.

Maggiori relazioni fra i contenuti

Tutte le informazioni relative a un particolare concetto sono collegate fra loro e rappresentate da un singolo tag, sia all’interno dei singoli siti che in tutto il web. Questo consente, a editori e sviluppatori, di fornire molte più informazioni e risorse correlate al contenuto del proprio sito web.

Ad esempio, se un articolo parla di Tom Cruise, i Common Tag ci permettono di collegarvi articoli che parlano di Katie Holmes per il semplice fatto che sono sposati e non perché nei titoli e nel contenuto di questi articoli compaiono le parole “Tom” o “Cruise”. Se così fosse, tra questi comparirebbero tutti gli articoli che parlano del “Cruise control” e dell’automobile “Land Cruiser”!

Contenuti di qualità e applicazioni innovative

Il fatto che i computer capiscano il significato delle parole migliora l’esperienza dell’utente. Infatti, ciò permette a editori e sviluppatori di avere contenuti più completi e creare applicazioni innovative che lavorano sui contenuti taggati con i Common Tag.

Ad esempio, consideriamo un blog sul cinema e un sito per la vendita di biglietti, e supponiamo che entrambi abbiano i contenuti taggati con i Common Tag. Inoltre supponiamo che un utente stia leggendo un articolo riguardante Star Trek. Uno sviluppatore potrebbe creare un’applicazione che permetta a questo utente di acquistare i biglietti per Star Trek direttamente all’interno dell’articolo, basandosi sul fatto che l’articolo e la pagina per l’acquisto dei biglietti hanno il Common Tag relativo al film di Star Trek. Immagini quante applicazioni potrebbero nascere sulla falsa riga di questa? Moltiplica per 1000! :-)

Schema CommonTag

Conclusione

Adottare uno standard ben definito per descrivere i propri contenuti si rivelerà estremamente vantaggioso. Applicazioni e servizi web sapranno finalmente collegare innumerevoli risorse sulla base dell’argomento trattato e non più sull’analisi delle parole chiave. Senza grossi interventi da parte di editori e sviluppatori!

Per me, come ho scritto nel titolo, questo standard rappresenta un piccolo, ma fondamentale, passo per il web semantico, quello che tutti chiamano Web 3.0. In fondo, si chiama web semantico proprio perché si basa sull’analisi del significato delle parole e non più su una “ricerca di caratteri”. Mi piacerebbe sapere cosa ne pensi sui Common Tag: ritieni che siano così importanti tanto da utilizzarli fin da subito o preferisci aspettare in attesa di altre tecniche che siano più semplici da implementare?

Articoli correlati
Articoli casuali (stesse categorie)
Commenti
Trackbacks
.1
15 Giugno 2009 alle 16:22

Credo che questo sia solo l’inizio, il futuro ormai è web semantico. Con l’adozione da parte di google dei microformati e dello standard RDFa adesso diventa un nostro dovere iniziare ad applicare queste nuove tecnologie sin da subito.
Sull’argomenti c’ha fatto una interessante guida giancarlo d’urso.

.2
15 Giugno 2009 alle 20:19

Wow! Bella guida!
Grazie per la segnalazione…e per essere passato. :-)

Puoi usare questi tag:   <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

ATTENZIONE. Se inserisci più di 2 link il commento verrà messo in coda, quindi non sarà visibile subito.

jblog: news e appunti per webmaster