El desafío del Big Data

Big Data es un concepto anglosajón que designa a un conjunto de datos de gran tamaño y que se encuentran desestructurados. El verdadero desafío de esta disciplina consiste en intentar manejar esta ingente cantidad de información para poder interpretarla y lo hace con ayuda de la estadística y de la ingeniería de datos (Data mining).

En el post anterior conocimos de forma introductora las cifras más importantes de esta nueva disciplina y a continuación nos centraremos en conocer sus objetivos y los beneficios que obtienen las empresas que invierten en esta nueva tecnología.

Las técnicas actuales de procesamiento de datos se han quedado obsoletas. Los expertos en tecnologías de la información trabajan como Penélope en el telar, una tarea que nunca acaba, pues el 80 % de los datos que se generan están desestructurados y estos crecen hasta 15 veces más rápido que los que están estructurados. Por ello hace falta nuevos programas que analicen la información, lo que hoy se conoce como OLAP (On-line Analytical Processing) y que permite agilizar la consulta de grandes cantidades de datos estructurados de forma multidimensional (cubos OLAP).

Algunas de las razones que han permitido la evolución en el almacenamiento de datos para su posterior análisis ha sido el descenso del precio de los costes de almacenamiento, la reducción de los formatos y la variedad de los mismos (hay que destacar este sentido la valiosa herramienta que proporciona el Cloud Computing).

Capturar, analizar y explotar

El objetivo último del Big data es mejorar la productividad y la competitividad de las empresas y su valor reside en la capacidad para proporcionar información precisa y objetiva sobre el comportamiento real de las personas y los sistemas.  Conociendo estos datos la toma de decisiones será más fácil porque se podrán calcular millones de datos para, por ejemplo:

  • Optimizar precios y maximizar beneficios
  • Recalcular riesgos y descubrir futuras oportunidades
  • Crear nuevas estrategias para atraer clientes
  • Identificar consumidores más importantes rápidamente
  • Generar ofertas teniendo en cuenta las necesidades del cliente, últimas compras…
  • Enviar recomendaciones y ofertas personalizadas justo cuando un usuario está cerca de la tienda
  • Analizar nuevas tendencias en el mercado de demanda
  • Detectar comportamientos fraudulentos
  • Determinar la causa del problema en cada sesión de acceso del ecommerce

Existen tres conceptos que ayudan a configurar y entender el Big Data. Se trata del volumen, la variedad y la velocidad.

Con respecto al volumen existen muchos factores que influyen en el desarrollo exponencial de los datos. La explosión de las redes sociales es una de los aspectos que más han influido en el desarrollo de los datos. Twitter, Facebook, Youtube, Pinterest, FourSquare… son algunos de los ejemplos de producción imparable de información en forma de vídeos, tuits, post, fotografías, vídeos… pero hay otros sistemas que almacenan y transmiten datos gracias a la automatización de servicios como el gas, la luz, sensores de equipos atmosféricos, astronómicos o militares. Todos estos datos no sin un contexto y una interpretación no valen nada y es ahí donde el Big Data pone a trabajar a sus centros de datos..

La variedad hace referencia a la gran cantidad de formatos en la que podemos encontrar la información: vídeo, audio, porcentajes, transacciones financieras, documentos de texto, imágenes… Cada día surge una nueva codificación de datos (un pin, un tuit, un hashtag…) Hay que estar atento e incluirlo en los análisis para poder identificarlos.

La velocidad en la que se producen los datos y se difunden es el último factor del Big Data. El tiempo de reacción de las empresas para identificar oportunidades, errores, éxitos… resulta fundamental para lograr destacar entre las demás y seguir evolucionando frente a sus competidores. Por ejemplo, la compañía estadounidense Sears analiza la elasticidad de los precios semanalmente, ajustándolos a su stock y los precios de la competencia.

Fuente: SAS  / ThinkAndSell