Unione Europea
E se trovare parti di ricambio o identificare un punto di riferimento fosse tanto facile quanto caricare e analizzare una foto digitale?
Presto sarà possibile grazie alla tecnologia sviluppata da un progetto dell’Unione Europea guidato dalla divisione di Ricerca IBM.
In collaborazione con un Consorzio dell’Unione Europea, i ricercatori IBM hanno sviluppato un motore di ricerca analitico che consente di trovare video, immagini e musica, non contrassegnati con informazioni descrittive (tag), che corrispondano a dati multimediali sottoposti come query.
Il consorzio ha ideato una tecnologia Web chiamata SAPIR (Search in Audio visual content using Peer-to-peer Information Retrieval) capace di analizzare e identificare i pixel in grandi archivi costituiti da contenuti audiovisivi. Ad esempio, è in grado di analizzare una foto digitalizzata o i bitstream in un file audio elettronico anche se non sono stati contrassegnati o indicizzati con tag. Il multimedia identificato viene automaticamente indicizzato e ordinato per essere poi facilmente reperito.
Il consorzio del progetto SAPIR comprende: IBM Research- Haifa, Israele; Istituto di Scienza e Tecnologie dell’Informazione, Consiglio Nazionale delle Ricerche (CNR), Italia; Max-Planck-Gesellschaft Zur Foerderung der Wissenschaften E.V. (MPG), Germania; Eurix S.R.L. (EURIX), Italia; Xerox – SAS (XRCE), Francia; Masarykova Univerzita (MU Brno), Repubblica Ceca; Telefonica Investigacion y Desarrollo sa Unipersonal (TID), Spagna; Telenor ASA (TELENOR), Norvegia; Università degli Studi di Padova (UPD), Italia.
SAPIR è in grado di indicizzare ed analizzare archivi costituiti da milioni elementi multimediali, estraendo i “descrittori base” da fotografie o video. Questi descrittori comprendono caratteristiche quali il colore, il layout, le forme o i suoni.
Come spiega una nota, se, ad esempio, un turista usa un telefono cellulare per fotografare una statua, SAPIR ne identifica i descrittori, li confronta con le fotografie esistenti ed aiuta a identificare
I file multimediali costituiscono la stragrande maggioranza dei dati disponibili su Internet e, da uno studio di IDC del maggio 2009, emerge che il 95% delle informazioni in formato elettronico, come ad esempio le foto digitali, non è ben categorizzato od identificato da tag. Le immagini, catturate da più di 1 miliardo di dispositivi nel mondo, costituiscono la parte maggiore dell’universo digitale. Ad esempio, nel 2006 il numero di immagini raccolte con telefoni cellulari ha quasi raggiunto i 100 miliardi e si prevede che si arrivi a 500 miliardi entro il 2010.
SAPIR attinge i suoi dati in questo vasto repertorio elettronico multimediale in continua crescita ed ha un’affidabilità eccezionale e capacità pressoché illimitate. E’ basato sulla stessa architettura peer-to-peer che viene utilizzata anche per lo scambio di audio e video su Internet. Con questo approccio, non esiste un singolo elemento che, a seguito di un guasto, possa portare al malfunzionamento dell’intero sistema ed è possibile aggiungere risorse per aumentarne la capacità a fronte di un aumento dei dati da analizzare. La “freschezza” del materiale indicizzato e ordinato è garantita dal fatto che i provider di contenuti inseriscano automaticamente il proprio materiale nell’archivio.