Tecnologie a supporto delle attività di “Data Journalism”
Questo progetto mira a progettare ed a realizzare le tecnologie necessarie a supportare le attività di data driven journalism
Nella moderna era digitale, le metodologie per le analisi dei Big Data rappresentano una necessità strategica per rendere disponibili risorse informative in modo più efficace ed efficiente ai giornalisti professionisti e consentendo nuove forme di produzione come il giornalismo dei dati (data driven journalism). La sfida risiede nella capacità di raccogliere, collegare, analizzare e presentare flussi di contenuti eterogenei accessibili attraverso diverse fonti, quali la TV digitale, Internet, agenzie di stampa, reti sociali e archivi di media, e pubblicati attraverso diverse modalità di presentazione, quali audio, testo e video , in un modo organizzato e semantico.
Questo progetto definisce e implementa componenti e sistemi per la produzione news professionale che affrontano queste sfide con un approccio uniforme e olistico. Al centro dell’approccio c’è un insieme di tecniche di intelligenza artificiale e strumenti statistici avanzati per automatizzare attività come l’estrazione di informazioni e l’analisi dei contenuti multimediali mirati alla scoperta di collegamenti semantici tra risorse, fornendo agli utenti testi, grafica e notizie video organizzate secondo la loro interessi individuali. Il sistema consente di definire profili di ricerca personalizzati aggiornati automaticamente e dinamicamente con i relativi contenuti provenienti dalle sorgenti di informazioni monitorate, che includono feed Web, canali televisivi e circuiti specializzati come l’Eurovision News Exchange Network (EVN) o archivi legacy.
Più recentemente, a partire dal 2016, il progetto (in stretta collaborazione con la Direzione Rai Digital) ha concentrato i propri sforzi sull’ identificazione di un flusso di lavoro end-to-end a supporto di un giornalismo guidato dai dati. Tale flusso di lavoro prevede la progettazione, la realizzazione e l’integrazione di importanti componenti legati alla gestione dei dati (tra questi il cosiddetto refining), alla analisi dei dati (con l’ausilio di metodi matematici-statistici), alla creazione strutturata e machine-readable delle storie, alla gestione degli open data ed alla visualizzazione avanzata.
Riconoscimenti
Premio Confindustria ICMT 2010 – Media Driven Convergence
Premio Giovanni Giovannini Nostalgia di Futuro 2010
Riferimenti
Sabino Metta, Alberto Messina: An end-to-end approach for delivering data-driven stories.
IBC 14-18 Settembre 2017
Giulia Dezi, Giorgio Dimino, Maurizio Mazzoneschi, Alberto Messina, Sabino Metta, Giuseppe Mondelli, Maurizio Montagnuolo, EBU MDN Workshop, 2016
Sabino Metta, Open Data e Data Journalism, Conferenza TAL & Open Data, 2014
Alberto Messina, Maurizio Montagnuolo, Riccardo Di Massa, Roberto Borgotallo: Hyper Media News: a fully automated platform for large scale analysis, production and distribution of multimodal news content. Multimedia Tools Appl. 63(2): 427-460 (2013)
Maurizio Montagnuolo, Alberto Messina: The RaiNewsbook: browsing worldwide multimodal news stories by facts, entities and dates. WWW (Companion Volume) 2012: 389-392
Alberto Messina, Maurizio Montagnuolo: A generalised cross-modal clustering method applied to multimedia news semantic indexing and retrieval. WWW 2009: 321-330
Alberto Messina, Roberto Borgotallo, Giorgio Dimino, Daniele Airola Gnota, Laurent Boch: ANTS: A Complete System for Automatic News Programme Annotation Based on Multimodal Analysis. WIAMIS 2008: 219-222
Progetti correlati
Progetto attivo
Sistemi di Raccomandazione per Contenuti Audio e Video
Un'esplorazione delle soluzioni per limitare l'information overload per i media radio televisivi
L’avvento di internet e la proliferazione dei servizi digitali hanno determinato un radicale cambiamento della modalità di fruizione della radio e della televisione. La miriade di prodotti, servizi e contenuti disponibili su Internet ha abituato i suoi utenti all’interattività, alla possibilità di ricercare e scegliere quando e quale contenuto multimediale fruire, trasformando il tradizionale ascoltatore televisivo in un attivo consumatore in grado di esprimere i propri gusti e le proprie preferenze. Paradossalmente, la grande quantità di contenuti disponibili ha creato un sovraccarico informativo e reso centrale il problema di trovare i più adatti all’utente.
I Recommender System rappresentano la risposta tecnologica alla domanda di rilevanza. In questo contesto, il broadcaster ha l’opportunità di far evolvere il proprio paradigma comunicativo: oltre a diffondere i propri contenuti, può proporre all’utente i più rilevanti.
Progetto Attivo
Deep Networks Applicate ai Sistemi di Content Managment
Il recente progresso tecnologico dei sistemi di calcolo permette oggi di reperire sul mercato calcolatori dotati di capacità di elaborazione numerica estremamente avanzata. In particolare, l’utilizzo di GPU (Graphics Processing Unit) per l’elaborazione e classificazione di immagini e contenuti multimediali sta vivendo una fase di intenso sviluppo grazie alla ricerca scientifica condotta negli ultimi anni nel campo dell’apprendimento profondo (Deep Learning). Il Deep Learning è una branca del Machine Learning che utilizza reti neurali complesse per applicazioni più svariate. Tra queste, l’area di applicazione relativa alla classificazione automatica di contenuti audiovisivi è certamente tra quelle più interessanti dal punto di vista strategico per RAI.