Big Data: ¿Reto y Oportunidad?

Big Data es un concepto que cada día se escucha más. De hecho, a pesar de no haber leído aun nada de él, seguramente cualquiera que se mueva en el sector de los sistemas de información entiende la problemática que plantea: cada día hay más datos y más información que procesar y almacenar. Encontramos ejemplos en todos los ámbitos. Incluso en un ámbito totalmente doméstico utilizamos diariamente redes sociales en las que cargamos fotografías, blogs y webs en las que vamos almacenando documentos, videos que subimos a la red para luego compartir, cuentas de correo con cada vez mayor capacidad… O por ejemplo, un vuelo transoceánico de un Jumbo pude generar hasta 640 terabytes durante su recorrido. Así pues, según IBM, el 90% de los datos que existen hoy han sido creados en los últimos dos años. Toda esta información requiere ser almacenada adecudamente para luego poder gestionarla.

Por lo tanto, entenderemos Big Data como el conjunto de herramientas, procesos y procedimientos por los cuales podemos llevar un orden en la creación, manipulación y administración y análisis de grandes volúmenes de datos.

La peculiaridad que tienen estos volúmenes de datos es que son extremadamente grandes. Sólo en Facebook se suben 250 millones de fotografías diarias (6 Agosto 2011, Facebook News), cada minuto se suben 60 horas de video a Youtube (Press Statics, Youtube), etc. Con estos datos descubrimos otra peculiaridad: la velocidad. Estos datos colgados en “la nube”  requieren que los subamos  rápidamente, y que podamos encontrarlos a una velocidad aún mayor. Big data también tiene la peculiaridad de componerse de una gran variedad de tipos de datos. Atrás quedan las bases de datos estructuradas en las que sólo se almacenan números o textos.

Una frase interesante es la que dijo Eric Schmidt, director General de Google: “entre el nacimiento del mundo y el año 2003, hubo cinco exabytes de información creada. Ahora creamos cinco exabytes cada dos días”. ¡Contundente!

Pero si creemos que Big Data es simplemente algo “grande”, “rápido”, “variado” y, por lo tanto, “complicado de almacenar”, nos estaremos quedando sólo con una parte del concepto. Lo interesante de todo este volumen de datos es saber explotarlo de una forma estratégica con el fin de que aporte algún valor añadido a las organizaciones.

Existen herramientas como Google Analytics o Piwik, entre otras, que permiten analizar información consultada en bases de datos, o incluso sacan información valiosa relacionando lo que se almacena y quién lo almacena. Sin embargo, estas herramientas no aportan todo el valor que se cree que Big Data puede ofrecer. Nos referimos al análisis inmediato de grandes volúmenes de información que permitan a las organizaciones tomar decisiones correctas de una forma casi inmediata: prevenir una crisis, elaborar planes de negocio, etc.

Podemos hacer la siguiente lectura: Los volúmenes de datos están creciendo a una velocidad que no estamos sabiendo aprovechar. No tenemos aún las herramientas que lo hagan. Al menos no en toda la medida que se cree. Por ello empresas como Oracle, IBM, entre otras han comenzado a hacer apuestas reales en Big Data.

Se trata de conseguir nuevas herramientas que no analicen los datos como hasta ahora de forma pregunta-respuesta, o incluso, pregunta con condiciones, y recibir una respuesta, sino un análisis mucho más amplio. Una postura más acercada a un viejo concepto, el datamining: la extracción no trivial de información que ya reside implícita en un conjunto de datos.

El concepto de Big Data ha llegado incluso al cine. En la última película de Brad Pitt, “MoneyBall”, basada en hechos reales, el actor interpreta a William Lamar, manager del equipo de Baseball de los Athletics de Oakland. Este manager fue el pionero en aprovechar los datos disponibles de todos los equipos, emplear conceptos estadísticos sobre el rendimiento de los jugadores y no centrarse en su nombre, figura o fama. De esta forma consiguió ahorrarse mucho dinero fichando a jugadores que se consideraban “agotados” y conseguir un hito histórico: 20 victorias seguidas.

Resumiendo, los retos y oportunidades que envuelve Big Data son muy interesantes. Jordi Torres en su presentación Retos del Big Data, categoriza estos retos en cuatro grupos:

  • Almacenamiento: hacen falta nuevas tecnologías de almacenamiento.
  • Bases de datos: Como hemos visto, las BBDD convencionales no están preparadas para estos volúmenes de información.
  • Procesado: La exigencia de la velocidad y el aumento de información requiere nuevos modelos de programación.
  • Obtención de valor: como hemos visto, disponer de los datos sin más no es sinónimo del valor que estos tengan. Necesitamos nuevos modelos de interpretación de los datos, que consigan obtener información para luego conseguir el conocimiento.

El Big Data por lo tanto, no debe plantearse como un problema sino como una oportunidad llena de retos. Aquellas organizaciones que consigan analizar de una forma más inteligente y eficiente la información conseguirán controlar el sector o destacarse en sus mercados anticpándose con sus decisiones, etc.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *