Versione 6.04 (002)

Deep Networks Applicate ai Sistemi di Content Managment

Progetto Attivo

Il recente progresso tecnologico dei sistemi di calcolo permette oggi di reperire sul mercato calcolatori dotati di capacità di elaborazione numerica estremamente avanzata. In particolare, l’utilizzo di GPU (Graphics Processing Unit) per l’elaborazione e classificazione di immagini e contenuti multimediali sta vivendo una fase di intenso sviluppo grazie alla ricerca scientifica condotta negli ultimi anni nel campo dell’apprendimento profondo (Deep Learning). Il Deep Learning è una branca del Machine Learning che utilizza reti neurali complesse per applicazioni più svariate. Tra queste, l’area di applicazione relativa alla classificazione automatica di contenuti audiovisivi è certamente tra quelle più interessanti dal punto di vista strategico per RAI.

Una rete neurale (Neural Network) è un oggetto matematico ispirato al funzionamento dei sistemi neurologici animali. Una rete neurale complessa (o profonda, da cui l’appellativo Deep Network e per estensione Deep Learning) è una rete neurale dotata di molti “strati” di calcolo, molti di più delle tradizionali reti neurali. Uno strato di calcolo applica semplici operazioni matematiche sui suoi input (tipicamente dei vettori di numeri reali) che producono come risultato dei nuovi vettori numerici, che sono a loro volta ingressi degli strati successivi della rete. Esistono molti tipi di strati di calcolo (layer) nella letteratura scientifica di settore. Nel campo della classificazione di immagini i layer che si sono rivelati fondamentali, contribuendo a fornire prestazioni di classificazione che avanzano nettamente lo stato dell’arte fornito dalle tecnologie tradizionali, sono i cosiddetti layer “convoluzionali” (vedi figura).

 

Un’altra caratteristica distintiva delle tecnologie Deep Learning consiste nella natura dei loro vettori di  ingresso, vale a dire i vettori numerici all’ingresso del primo layer. A differenza dei metodi di Machine Learning tradizionale – che utilizzano normalmente vettori numerici che surrogano alcune caratteristiche del contenuto che si ritengono importanti per lo specifico task – l’input alle reti complesse, nel caso della classificazione di immagini, sono le immagini stesse.

 

In questo contesto estremamente vitale e in continuo divenire, il progetto si prefigge di studiare nuovi metodi ed architetture di rete di tipo profondo applicabili al dominio degli oggetti video, che a tutt’oggi rappresentano una reale sfida per  queste tecnologie data la loro elevata dimensionalità e complessità semantica.

 

La realizzazione di queste architetture permetterebbe di rendere maggiormente efficiente il processo di metadatazione dell’archivio RAI, allo stesso tempo incrementando la qualità e la ricchezza delle informazioni associate ai contenuti. Le tipologie di informazioni estraibili efficacemente attraverso queste reti non si limitano infatti alla generica classificazione, anche se quest’ultima può essere realizzata di principio usando un arbitrario sistema di classificazione (orientato al contenuto, alle emozioni, al riconoscimento dei volti di personaggi noti). Versioni più articolate riescono ad estrarre annotazioni strutturate, riducendo sostanzialmente il gap con i sistemi di documentazione tradizionali.

Progetti correlati

Progetto attivo

Tecnologie a supporto delle attività di "Data Journalism"

Nella moderna era digitale, una sfida importante risiede nella capacità di raccogliere, collegare, analizzare e presentare flussi di contenuti eterogenei, accessibili attraverso diverse fonti, e pubblicati attraverso diverse modalità di presentazione. A tal proposito, il progetto mira all’ identificazione di un flusso di lavoro end-to-end a supporto di un giornalismo guidato dai dati.

Progetto attivo

Deep learning applicato ai sistemi di codifica video

I codificatori di nuova generazione sono chiamati ad affrontare la sfida di fornire video di qualità ad un bit rate di compressione sempre più basso attraverso diversi strumenti algoritmici, uno dei quali potrebbe essere quello rappresentato dall’intelligenza artificiale.