Versione 6.04 (002)

Progetto ANTS

Sistema automatico di trascrizione dei notiziari

Progetto attivo

E’ stata realizzata una piattaforma, denominata ANTS, mirata all’analisi automatica di notiziari. Si tratta di un sistema modulare nel quale diversi strumenti di analisi del segnale audiovisivo vengono coordinati da un motore di gestione di processo, che ha il compito di rendere sequenziali le fasi di elaborazione e di aggregare i dati risultanti.

 

La tecnologia chiave impiegata è l’Automatic Speech Recognition (ASR) in grado di fornire una trascrizione testuale fedele di ciò che viene detto all’interno del programma.

Il riconoscitore ASR impiegato è stato ottimizzato per lavorare nel dominio delle news mediante addestramento su un consistente numero di telegiornali trascritti manualmente. La qualità di trascrizione ottenuta si aggira attorno al 90% di riconoscimento corretto. Poiché il testo è sincronizzato con il segnale multimediale, data una parola è possibile accedere immediatamente al brano in cui essa viene pronunciata. Inoltre il riconoscitore effettua una segmentazione del segnale in base all’impronta vocale di chi parla.Il trascritto che si ottiene si presta ottimamente alla ricerca in testo libero e alla rielaborazione con tecniche di intelligenza artificiale.

La segmentazione in notizie

La segmentazione automatica in notizie viene effettuata da un modulo ideato e realizzato dal Centro Ricerche, basato sull’analisi del contenuto audiovisivo.

Il concetto di base utilizzato è semplice, ma richiede una conoscenza a priori del formato del programma. Nel caso dei telegiornali Rai, una notizia è generalmente annunciata dal conduttore in studio e quindi approfondita con servizi esterni.

Riuscendo ad identificare le sequenze in cui compare il conduttore (o alternativamente lo studio) si ottengono quindi dei punti di taglio coincidenti con il cambio di notizia. L’identificazione di tali sequenze viene effettuata utilizzando un modulo che suddivide il video in scene dal contenuto omogeneo e, quindi, le raggruppa per similitudine.

Analizzando i raggruppamenti ottenuti è, poi, possibile selezionare quelli che presentano le caratteristiche più simili a quelle del modello prescelto.

Per rafforzare l’ipotesi effettuata si utilizza la segmentazione in voci effettuata dal modulo ASR, facendo l’ipotesi che la voce del conduttore in studio sia quella che si presenta più spesso. In questo modo vengono minimizzati gli errori di riconoscimento del singolo strumento. L’identificazione corretta di cambio notizie risultante ha una precisione media di circa l’80%. Effettuata la segmentazione in notizie, viene applicato un modulo di analisi semantica. Questo permette una classificazione automatica di un testo secondo lo schema utilizzato dai documentatori Rai, basato su 28 categorie principali relative al mondo giornalistico. La precisione ottenuta è comparabile a quella di un classificatore umano.

 

Riferimenti

  1. R. Del Pero, G. Dimino, M. Stroppiana, “Catalogo Multimediale: l’esperienza Rai”, Elettronica e Telecomunicazioni, n. 1, Aprile 2000.
  2. C. Anderson, “The Long Tail” Wired, October 2004.
  3. A. Messina, R. Borgotallo, G. Dimino, L. Boch, D. Airola Gnota, “An Automatic Indexing System for Television Newscasts”, IEEE ICME 2008, Hannover, June 2008.
  4. R. Borgotallo, G. Dimino, A. Messina, “ANTS: a complete system for automatic news programme
    annotation based on audiovisual content and text analysis”, EBU Technical Review nr. 313, Geneva, March 2008.
  5. A. Messina, M. Montagnuolo, “A Generalised Cross-Modal Clustering Method Applied to Multimedia News Semantic Indexing and Retrieval”, 18th International Conference on World Wide Web, Madrid, April 2009.
  6. M. Montagnuolo, M. Ferri, A. Messina, “HMNews: an Integrated System for Searching and Browsing Hypermedia News Content”, HyperText 2009, Torino, June 2009.
  7. L.R. Rabiner, “A tutorial on hidden Markov models and selected applications in speech recognition”, Proceedings of the IEEE, February 1989, Volume: 77, Issue: 2, page(s): 257-286.
  8. F. Brugnara, M. Cettolo, M. Federico, D.Giuliani, “A system for the segmentation and transcription of Italian radio news”, in
    Proceedings of RIAO, Content-Based Multimedia Information Access, Paris, France, 2000.
  9. R. Basili, M. Cammisa, E. Donati, “RitroveRAI: A Web Application for Semantic Indexing and Hyperlinking of Multimedia News”, in Proc. of “International Semantic Web Conference”, Lecture Notes in Computer Science, LNCS 3279, 97-111, Springer, 2005.

Progetti correlati

Progetto terminato

Progetto Europeo PrestoPrime

Keeping Audiovisual Content Alive

Il progetto europeo PrestoPRIME ha l’obiettivo di studiare e sviluppare soluzioni che contribuiscono alla realizzazione di una struttura per la preservazione a lungo termine dei prodotti audiovisivi digitali.

Progetto attivo

Hyper Media News

Sistema per l'analisi automatica dei contenuti

Hyper Media News è un sistema in grado di integrare le informazioni generate automaticamente da ANTS con le informazioni presenti sul web e rese disponibili attraverso i siti di informazione quotidiana online.
Il sistema Hyper Media News, assieme ad ANTS, è già stato dimostrato con successo in diverse occasioni durante conferenze scientifiche internazionali e durante il Prix Italia 2009.

Progetto attivo

Archivi e Teche digitali

Un archivio immenso e le tecnologie informatiche per trasformarlo in uno strumento di lavoro, in un deposito maneggevole, in un territorio familiare e a portata di click. E’ un’impresa complessa quella che si propone di informatizzare le Teche della Rai, con aspetti problematici sui quali si sta misurando un progetto aziendale pluriennale.

Progetto attivo

Sistema di digitalizzazione delle News

La produzione digitale informatizzata delle News è in corso di realizzazione. Il modello di produzione dei telegiornali e delle rubriche associate si basa sullo sfruttamento di contenuti acquisiti non molto prima della pubblicazione. Infatti un determinato tema è “caldo” per alcuni giorni, fintanto che non è scalzato da qualche nuovo evento.

Progetto attivo

Informatizzazione della Produzione

Bisogna passare da un modello di produzione televisiva basato su filiere verticali ad uno ad integrazione orizzontale. Da un assetto organizzativo e tecnologico basato su articolazioni separate e specializzate su di un particolare canale distributivo, a un modello integrato in grado di produrre e distribuire contenuti su canali eterogenei.