Versione 6.04 (002)

Deep learning applicato ai sistemi di codifica video

Progetto attivo

Scopo di questa attività basata sul deep learning è quello di sviluppare un algoritmo di compressione più efficiente rispetto allo standard MPEG HEVC (High Efficiency Video Coding)

Apprendimento profondo o deep learning è un sottoinsieme del machine learning, campo di ricerca sull’intelligenza artificiale, che cerca di ottenere livelli di rappresentazione astratti di informazione a partire da caratteristiche di livello più basso.

La caratteristica saliente di un soggetto che definiamo intelligente è la sua capacità di apprendere e questa caratteristica è propria dei paradigmi matematici detti reti neurali (artificiali). Le reti neurali artificiali, mimando il funzionamento delle reti neurali biologiche, sono in grado di modificare il loro comportamento in modo da adeguarsi agli input esterni.

Semplificando, le reti neurali sono modelli computazionali paralleli, costituiti da numerose unità di elaborazione fortemente interconnesse. L’attività del singolo nodo (neurone) è semplice e la potenza del modello risiede nella configurazione delle connessioni (architettura e pesi). Partendo dalle unità di input, a cui vengono forniti i dati del problema da risolvere (i pixel di un’immagine), la computazione si propaga in parallelo nella rete fino alle unità di output, che forniscono il risultato.

Attualmente vengono applicate a problemi di visione artificiale, riconoscimento vocale, veicoli autonomi, robot…

Nel mondo delle comunicazioni le tecniche per la riduzione del bit rate hanno lo scopo di ridurre le ridondanze presenti nel segnale audio video eliminando le ridondanze spaziali a livello di singolo frame e temporali tra frame successivi.  La trasmissione completa dell’informazioni richiederebbe un flusso dati con un bit rate estremamente elevato che eccederebbe la capacità del canale trasmissivo. Per ovviare a tale inconveniente è necessario adottare sistemi in grado di comprimere il segnale sorgente.

Scopo di questa attività basata sul deep learning è quello di sviluppare un algoritmo di compressione più efficiente rispetto allo standard MPEG HEVC (High Efficiency Video Coding) che richiede un’attività preliminare al fine di comprendere come scegliere ed ottimizzare i parametri della rete, la definizione stessa dell’architettura e la complessità computazionale.

Il Centro Ricerche si sta occupando sia dell’analisi teorica delle numerose architetture di reti (generative, reti con memoria, reti ricorrenti e convoluzionali), sia dell’implementazione usando tecnologie quali Tensorflow (rilasciato in open source da Google).

Progetti correlati

Progetto Attivo

Deep Networks Applicate ai Sistemi di Content Managment

Il recente progresso tecnologico dei sistemi di calcolo permette oggi di reperire sul mercato calcolatori dotati di capacità di elaborazione numerica estremamente avanzata. In particolare, l’utilizzo di GPU (Graphics Processing Unit) per l’elaborazione e classificazione di immagini e contenuti multimediali sta vivendo una fase di intenso sviluppo grazie alla ricerca scientifica condotta negli ultimi anni nel campo dell’apprendimento profondo (Deep Learning). Il Deep Learning è una branca del Machine Learning che utilizza reti neurali complesse per applicazioni più svariate. Tra queste, l’area di applicazione relativa alla classificazione automatica di contenuti audiovisivi è certamente tra quelle più interessanti dal punto di vista strategico per RAI.