TASSONOMIA
I progetti che prevedono una grossa mole di contenuti richiedono l'implementazione di un vocabolario controllato o di un sistema di classificazione per identificare e codificare i termini.
Vocabolari controllati e tassonomie
Un vocabolario controllato è un sottoinsieme di termini del linguaggio naturale. Esistono diverse forme di vocabolari controllati e tra questi la lista dei sinomini, ovvero una lista di termini equivalenti utilizzati per facilitare la ricerca di informazioni. Dato lo scopo, spesso non si tratta di sinonimi effettivi ma ad esempio di parole che vengono utilizzate dagli utenti del sito per consultarlo.
Per costruire un lista di sinonimi si possono analizzare i termini inseriti dagli utenti nel log del motore di ricerca. Successivamente si crea una lista di termini da associare ad una parola. Quando l'utente utilizzerà di nuovo il motore, ampliato con la lista dei sinonimi, alla ricerca di una parola visualizzerà nei risultati anche tutte le parole equivalenti. Naturalmente è necessario presentare i risultati tenendo conto della ricerca fatta dall'utente e dei suoi bisogni affinché egli si ritrovi.
Un vocabolario controllato diventa una tassonomia o sistema di classificazione quando si applicano delle regole gerarchiche tra i termini. La relazione gerarchica divide le informazioni in categorie e sottocategorie dai concetti più ampi a quelli più specifici. Queste gerarchie possono essere utilizzate per molteplici scopi: dalla costruzione di una lista di gerarchie navigabili sul sito come nel caso di Yahoo, alla realizzazione di un tool di back end.
I sistemi di classificazione possono essere utilizzati anche nell'ambito di un motore di ricerca: alla ricerca di una parola si mostrano oltre ai risultati anche le categorie corrispondenti.
Thesaurus
Il thesaurus è un tipo di schema di classificazione in cui oltre a sinonimi e relazioni gerarchiche vengono stabilite relazioni associative tra i concetti. Ecco alcuni esempi di relazioni associative: il concetto e le sue proprietà, un campo di studio e un oggetto di studio, azione e prodotto dell'azione.
A differenza del thesaurus testuale, costruito per permettere alla gente di passare da una a più parole, lo scopo del thesaurus su Web è aiutare gli utenti a trovare meglio ciò che cercano e quindi mappare molti sinonimi o varianti di un termine (quelle usate dagli utenti) su un termine preferito.
I thesauri possono essere utilizzati come strumenti aggiuntivi per la navigazione o la ricerca in un sito, permettendo agli utenti di raffinare continuativamente le ricerche svolte. Esistono tre tipologie di thesauri:
- Il thesaurus classico
Serve sia agli indicizzatori per mappare le varianti dei termini, sia a chi fa ricerche per trovare le informazioni, anche se spesso gli utenti non ne sono consapevoli poiché il sistema propone automaticamente ad ogni ricerca, una lista di sinonimi o di link associativi o gerarchici.
- Il thesaurus utilizzato per indicizzare
Ci sono casi in cui non è possibile integrare il thesaurus nel motore di ricerca che è stato fatto da altri o non supporta questa funzionalità se non al prezzo di costose personalizzazioni. Il thesaurus permetterà in ogni caso di costruire indici navigabili di termini in modo che l'utente possa trovare tutti i documenti che riguardano un determinato argomento.
- Il thesaurus per la ricerca
In altri casi è impossibile indicizzare i contenuti perché prodotti da terzi o perché la loro mole non lo giustifica. In questo caso vale la pena integrare il thesaurus con il motore di ricerca: ad ogni parola cercata verranno proposti dei sinonimi o altri termini o la lista dei termini più specifici che stanno più in basso nella gerarchia. Il thesaurus può essere inoltre reso navigabile in modo da permettere di visualizzare tutti i termini equivalenti, gerarchici e associativi.
Attività
I primi passi per la realizzazione di un thesaurus comprendono:
- definire la forma del termine preferito, ad esempio se utilizzare un verbo un nome;
- selezionare il termine preferito;
- definire il termine: in base al contesto d'uso nel sito e in base allo scopo;
- definire la specificità di un termine: anche in questo caso contesto e scopo del sito aiutano;
- avvalersi di una gerarchia multipla: quando si trattano sistemi informativi molto ampi alcuni termini potranno essere inseriti in molteplici categorie;
- utilizzare molteplici tassonomie, ovvero considerare i diversi aspetti di un contenuto, i suoi attributi (es. argomento, target, prezzo, ecc.). Tali attributi posso essere visualizzati presentando molteplici modelli di navigazione, ad esempio essere presentati nei risultati della ricerca ed essere utilizzati per selezionare i risultati.
Un esempio: Thesaurus regionale toscano
Un interessante esempio di thesaurus italiano è il Thesaurus regionale toscano adottato dalla Giunta regionale nel 1996 come vocabolario controllato del sistema informativo regionale.
E' stato sviluppato sulla base della normativa internazionale per la costruzione di thesauri monolingui (ISO 2788/86), a partire dalla terminologia concretamente usata dalle strutture bibliotecarie e documentarie della Regione Toscana.
Il Thesaurus è un vocabolario di circa 8000 termini (compresi i non preferiti) nel quale ogni termine è definito dalle sue relazioni con gli altri termini ed organizzato in 16 categorie.
Per ogni termine preferito sono indicati, oltre la categoria di appartenenza, il termine sovraordinato, i termini sottordinati, i sinonimi, i termini associati, nonché la nota di ambito se necessaria. Per ogni termine non preferito è indicato il rinvio al relativo termine preferito.
Il Thesaurus regionale ha una struttura classificatoria di tipo monogerarchico: un termine appartiene ad una sola gerarchia (ha un solo termine sovraordinato).
Il Thesaurus regionale, in quanto strumento legato alla lingua naturale, richiede un costante aggiornamento.
|