2012 Sistema digital probabilístico para la exploración eficiente de grandes bases de datos

Circuito digital capaz de explorar de forma rápida y eficiente grandes bases de datos en la búsqueda de patrones concretos. La tecnología está adaptada para la computación masiva en paralelo y tiene una gran relevancia en muchas áreas donde se han de explorar grandes bases de datos para poder extraer información útil.

Circuito digital capaz de explorar de forma rápida y eficiente grandes bases de datos en la búsqueda de patrones concretos. La tecnología está adaptada para la computación masiva en paralelo y tiene una gran relevancia en muchas áreas donde se han de explorar grandes bases de datos para poder extraer información útil.

La invención es el resultado de un proyecto de investigación nacional "Desarrollo e Implementación de Sistemas de Computación de muy alta Velocidad mediante Redes pulsantes y su aplicación a la búsqueda de nuevos fármacos", financiado por el Ministerio de Economía y Competitividad.

Descripción

El sistema es capaz de conseguir un mayor rendimiento en la exploración de grandes bases de datos, debido al gran paralelismo que se consigue gracias al uso de metodologías de computación probabilística. Las estructuras de lógica pueden ser replicadas un centenar de veces en un único FPG para obtener un gran paralelismo con el mínimo coste.

La presente invención puede ser aplicada a múltiples disciplinas científicas donde se debe extraer información útil de grandes bases de datos.

Principales ventajas

  • Las técnicas propuestas suponen una mayor velocidad de procesamiento en relación con las técnicas tradicionales basadas en procesadores, lo cual se traduce en unos menores requisitos de hardware y energía y, por tanto, de costes, para una velocidad de procesamiento requerida
  • La tecnología puede ser aplicada en diferentes disciplinas en las cuales sea necesario extraer información útil a partir de grandes cantidades de información

Aspectos innovadores

  • Sistema no convencional basado en la lógica probabilística, a diferencia de la lógica binaria tradicional y determinista
  • Resultados más probables como salida en lugar del resultado exacto
  • Precisión de la metodología, donde la diferencia entre los resultados exactos y los más probables es mínima
  • Uso de técnicas probabilísticas capaces de aumentar la velocidad de procesamiento, que son más apropiadas para los procesamientos de grandes cantidades de información

Estado actual

El prototipo ha sido implementado en una tabla basada en PCle que contiene a gran escala FPGAs, obteniendo un rendimiento de más de 100 millones de comparaciones por segundo. Cada comparación implica el tratamiento de 16 descriptores de forma para cada compuesto (con un total de 128 bits por compuesto). Este prototipo, así como su uso, están protegidos por una patente y están disponible para licencia.

El sistema puede ser adaptado a cualquier tipo de descriptores. Los objetos a ser reconocidos pueden ser de cualquier naturaleza, el único requisito es que deben ser descritos por un vector de n dimensiones (siendo "n" cualquier valor natural).

Con la colaboración de:

Logotipo del Ministerio de Ciencia, Innovación y Universidades