Análisis financiero con cálculo en streaming

Los superordenadores procesan grandes cantidades de datos utilizando múltiples núcleos que trabajan en paralelo, pero la mayoría de ellos bucean en una base de datos para encontrar información, procesar los datos y, a continuación, producir un resultado; un proceso que puede llevar minutos o días, dependiendo de la tarea. Sin embargo, en los últimos años, los investigadores han empezado a estudiar el potencial del cálculo en streaming, un tipo de enfoque de cálculo que permite procesar un flujo de datos en tiempo real en microsegundos. Con esto se podría utilizar la información de las cámaras de tráfico, informes de accidentes y el tiempo para predecir el tráfico; y el audio en streaming se podría transcribir o traducir más rápido.

Ahora, IBM ha mostrado que se puede utilizar el cálculo en streaming para analizar los datos del mercado más rápido que nunca. El resultado es una máquina que ayuda a los sistemas de comercio automatizados a determinar el precio de los valores en función de los eventos financieros que se hayan producido. Para construir el sistema, la compañía informática se asoció con TD Securities, una empresa de banca de inversiones, para adaptar su software InfoSphere Streams a los datos financieros. El software se ejecutó en uno de los últimos superordenadores de IBM, conocido como Blue Gene/P.

El sistema de IBM perfecciona el tipo actual de sistemas de los mercados financieros, que recoge los datos de numerosas fuentes diferentes de todo el mundo, incluidos los volúmenes de mercado y los precios de las acciones en constante fluctuación. Esta información se divide en trozos, llamados mensajes, que se envían a través de los sistemas de los mercados. Cuantos más mensajes puede analizar un sistema, más precios de valores puede determinar y más acciones se pueden vender utilizando las máquinas de mercado automatizadas que relacionan a los compradores con los vendedores.

El avance más importante, según Nagui Halim, científico jefe del proyecto de cálculo en streaming de IBM, es que los ingenieros optimizaron el software para que funcionara en el Blue Gene/P, de modo que fuese posible analizar los flujos (streams) de datos más rápido que con otros sistemas de análisis financieros. La información llegó a una velocidad de 5 millones de mensajes por segundo, señala Halim, y el sistema logró procesar un mensaje en menos de 200 microsegundos. El resultado: un superordenador que produce precios de valores 21 veces más rápido que cualquier otro sistema de comercio financiero.

En algunos casos, señala Halim, es fundamental procesar los datos a medida que entran. Otro sistema construido por IBM monitoriza las constantes vitales de los pacientes, como los niveles de gas en sangre, y lleva un registro de estadísticas de cada paciente, entre las que se incluyen su peso o régimen de medicación. Los datos de estos hilos de información, que se cuentan en cientos, se analizan y correlacionan, produciendo un gráfico de la salud del paciente imposible de obtener únicamente a partir de las observaciones de los médicos y enfermeras.

Fuente: Technology Review