2012 Sistema digital probabilístic per a l'exploració eficient de grans bases de dades

Circuit digital capaç d'explorar de forma ràpida i eficient grans bases de dades en la cerca de patrons concrets. La tecnologia està adaptada per a la computació massiva en paral·lel i té una gran rellevància en moltes àrees on s'han d'explorar grans bases de dades per poder extreure informació útil.

Circuit digital capaç d'explorar de forma ràpida i eficient grans bases de dades en la cerca de patrons concrets. La tecnologia està adaptada per a la computació massiva en paral·lel i té una gran rellevància en moltes àrees on s'han d'explorar grans bases de dades per poder extreure informació útil.

La invenció és el resultat d'un projecte de recerca nacional "Desenvolupament i Implementació de Sistemes de Computació de molt alta Velocitat mitjançant Xarxes polsants i la seva aplicació a la cerca de nous fàrmacs", finançat pel Ministeri d'Economia i Competitivitat.

Descripció

A causa del gran paral·lelisme que s'aconsegueix gràcies a l'ús de metodologies de computació probabilística el sistema és capaç d'aconseguir un major rendiment en l'exploració de grans bases de dades. Les estructures de lògica poden ser replicades un centenar de vegades en un únic FPG per tal d'obtenir un gran paral·lelisme amb el mínim cost.

La present invenció pot ser aplicada a múltiples disciplines científiques on s'ha d'extreure informació útil de grans bases de dades.

Principals avantatges

  • Les tècniques propostes suposen una major velocitat de processament en relació amb les tècniques tradicionals basades en processadors, la qual cosa es tradueix en uns menors requisits de hardware i energia i, per tant, de costos, per a una velocitat de processament requerida
  • La tecnologia pot ser aplicada en diferents disciplines en les quals sigui necessari extreure informació útil a partir de grans quantitats d'informació

Aspectes innovadors

  • Sistema no convencional basat en la lògica probabilística, a diferència de la lògica binària tradicional i determinista
  • Resultats més probables com a sortida en lloc del resultat exacte
  • Precisió de la metodologia, on la diferència entre els resultats exactes i més probable es mínim
  • Ús de tècniques probabilístiques capaces d'augmentar la velocitat de processament, que són més apropiades per als processaments de grans quantitats d'informació

Estat actual

El prototip ha estat implementat en una taula basada en PCle que conté a gran escala FPGAs, obtenint un rendiment de més de 100 milions de comparacions per segon. Cada comparació implica el tractament de 16 descriptores de forma per a cada compost (amb un total de 128 bits per compost). Aquest prototip, així com el seu ús, estan protegits per una patent i estan disponible per a llicència.

El sistema pot ser adaptat a qualsevol tipus de descriptores. Els objectes a ser reconeguts poden ser de qualsevol naturalesa, l'únic requisit és que han de ser descrits per un vector de n dimensions (sent "n" qualsevol valor natural).

Amb la col·laboració de:

Logotipus del Ministeri de Ciència, Innovació i Universitats