We stand with Ukraine

Viaggio al centro della tecnologia semantica – Prima puntata

22 Maggio 2013

22 mag 2013

La parola a Marco Varone, “papà” della tecnologia Cogito di Expert System, che ci aiuta a capire cos’è e come funziona la tecnologia semantica.
In questa puntata, e in quelle che seguiranno, vedremo come può essere utilizzata concretamente nelle attività di gestione delle informazioni e quali vantaggi di business possono ottenere le aziende che scelgono di implementarla.

 


 

Prima puntata: Conoscenza e… mal di denti

Nella maggior parte dei casi l’uso del linguaggio, scritto o parlato, ha un unico obiettivo: trasmettere informazioni. Il nostro mondo è percorso da una miriade di flussi di notizie in costante interscambio, che scorrono tra snodi e incroci lungo una rete che avvolge tutto il pianeta.
Contrariamente a quanto avviene nella percezione di suoni, colori o odori, non possediamo un organo di senso che riconosce l’informazione. Per gestire le informazioni usiamo il cervello che, molto più di orecchie, occhi e naso, consente alla mente di conoscere il mondo esterno e di capirne il senso.

Ecco perché la comprensione di un messaggio o di un testo non si può ricavare meccanicamente dalla comprensione delle singole parole, ma è sempre frutto di un’interpretazione del contesto in cui queste parole si inseriscono.
“Comprendere”, “farsi capire”, “comunicare” e “apprendere” sono tutte azioni umane qualificanti e non sempre ovvie, anche se per tutti noi risultano abbastanza innate e naturali: sappiamo farlo, punto e basta. Ci risulta più difficile spiegare “come” abbiamo fatto, ma qualunque sia la nostra risposta, ci siamo riusciti perché abbiamo capito il significato, cioè abbiamo fornito un’interpretazione corretta dei concetti e delle azioni.

Per avere successo sul terreno delle informazioni occorre dunque catturarne il senso e individuare solo le informazioni giuste, scartando quelle meno pertinenti che fanno perdere tempo e risorse. La nostra sfida quotidiana (in qualunque attività) è proprio usare solo la conoscenza che serve, dove serve e quando serve per ricavarne il massimo valore, che sarà tanto maggiore quanto importanti sono le decisioni da prendere. Capire la realtà è un processo articolato, che può compiersi per affinamenti successivi, salendo lungo una scala composta da livelli crescenti di informazione.

Consideriamo un semplice esempio di ricerca di informazioni. In termini generali, al livello più elementare si collocano i dati: immaginiamo di selezionare semplici sequenze di numeri a 10 cifre che, lì per lì, non ci dicono nulla.
Al primo cenno di comprensione da parte nostra, questi dati si trasformano in una debole informazione e siamo in grado di identificare il contesto di riferimento: sono numeri telefonici. 
Scalando a un livello successivo, aumenta il contenuto di informazione: sono numeri di Milano e fanno riferimento a studi medici.
Raggiungiamo il massimo valore informativo quando il contesto diventa così vicino ai nostri obiettivi che possiamo basare una decisione su di esso: sono a Milano e ho un forte mal di denti, seleziono nella lista il numero di un dentista, chiamo e prendo un appuntamento. Questa è informazione utile per prendere decisioni e un buon esempio di quello che abbiamo definito conoscenza.

Lo stesso percorso, dai dati fino alla conoscenza, viene fatto anche quando entra in campo il trattamento automatico delle informazioni (dei testi nel nostro caso) effettuato da un programma.
In questo caso una tecnologia può ritenersi davvero valida se non si limita a operare ai primi livelli della scala riconoscendo e manipolando solo dati o informazioni generiche (se ricordiamo l’esempio del dentista, sarebbe come riconoscere solo che si tratta di numeri di 10 cifre a al massimo capire che sono numeri di telefono), con comprensione del contesto pressoché nulla, superficiale e approssimativa; una tecnologia efficace deve invece percorrere più stadi possibili, distillando l’informazione attinente fino alla conoscenza, cercando di imitare il meccanismo del cervello umano. 

Pur sapendo che il livello di comprensione umana non è in realtà replicabile ad oggi da nessun programma, si può ottenere una buona approssimazione mediante tecnologie semantiche, capaci di capire il senso di un testo, analizzare i concetti e le loro interconnessioni. Quello che un testo esprime non è rappresentato infatti dalla semplice somma dei significati delle singole parole: il senso emerge dalla concatenazione dei termini in frasi, dalla successione delle frasi nelle proposizioni e, spesso, da una conoscenza preesistente. Tutti questi elementi sono intrecciati come fili in un arazzo di cui va colto il disegno complessivo. Non a caso uno scritto viene da secoli definito “testo”, in riferimento al termine latino che appunto significa “tessuto”.

Per questa volta mi fermo qui: nei prossimi post vedremo come fa un computer, nato “solo” per fare calcoli più velocemente possibile, ad aiutarmi a trovare il dentista 🙂

Marco Varone

Se vuoi seguire le prossime puntate del “Viaggio al centro della tecnologia semantica”

ISCRIVITI QUI