Big Data, los datos masivos
A través del uso de tecnologías y herramientas como las redes sociales, los dispositivos inteligentes en los vehículos, los GPS, nuestros smartphones, etc., estamos generando cantidades ingentes de datos que viajan por la red continuamente. ¿Qué se hace con estos datos? ¿Para qué sirven?

Datos Masivos o Macrodatos
“Incluso cuando te tomas unas vacaciones de la tecnología, la tecnología no se toma un descanso de ti.”
Douglas Coupland
Según hemos visto anteriormente en este blog, con el Internet de las Cosas y la Computación en la Nube, hay grandes cantidades de datos viajando por la red continuamente. Grandes volúmenes de datos generados por los nuevos dispositivos y herramientas que usamos y que, por su volumen y complejidad, no se pueden manejar de la forma habitual motivo por el cual se ha creado una infraestructura específica. Esta infraestructura junto con todos esos datos es lo que llamamos Big Data.
Pero ¿de qué tipo de datos estamos hablando? La información que Big Data registra y analiza proviene de muy diversas fuentes como pueden ser: contenido generado por usuarios en las redes sociales, transacciones económicas (facturaciones, movimientos entre cuentas, etc.) correos electrónicos, datos generados por los sensores inteligentes de los objetos smart (como el asistente personal virtual de Amazon llamado Alexa), datos y estadísticas de las organizaciones públicas y privadas, etc., son datos que no tienen una estructura única ni fija.
Pero esto suena muy genérico. Veamos las características que, según los expertos, han de cumplir estos datos para que se pueda llamar Big Data. Se dice que deben cumplirse las cinco «Vs»: volumen (hablamos de muchos terabytes y pentabytes de datos), velocidad (el alto ritmo al que se reciben los datos), variedad (datos de todo tipo, en muchos casos datos no estructurados o que no tienen un formato específico, por lo que requieren un procesamiento previo para poder tener un significado), veracidad (los datos deben ser «de fiar» o correctos) y valor (tienen que generar un beneficio para la empresa).
Esos datos deben ser tratados de alguna forma para poder darles significado. El objetivo por el que se crea lo que llamos Big Data es analizar este gran volumen de datos y convertirlos en información relevante sobre nuestros movimientos, hábitos de vida, etc., que principalmente se usará para su explotación comercial aunque su utilidad puede ser muy diversa. Por ejemplo, algunos de estos usos serían: para la toma de decisiones a la hora de generar una respuesta por parte de los sistemas informáticos (como cuando una App de música te sugiere una canción basándose en la música que sueles escuchar), para segmentar clientes en el marketing o para orientar a las empresas en la creación de nuevos productos y servicios.
¿Cómo se analiza esta información?
De forma muy resumida, el proceso mediante el cual se usa el Big Data para obtener información relevante sería el siguiente:
- Almacenamiento de los datos: las grandes cantidades de datos no estructurados se almacenan en bases de datos tipo NoSQL: las que no siguen el estándar SQL y por tanto que no requieren una estructura fija de los tipos de datos (determinados campos de base de datos fijos, por ejemplo)
- Limpieza de los datos: antes de cruzar los datos para extraer información de ellos, se precisa hacer una pequeña «limpieza» (data cleansing o scrubbing) para asegurarnos de estar usando la información que necesitamos y no aquella que sea errónea, no esté completa o sea imprecisa.
- Procesamiento y análisis de los datos: se utilizan una serie de herramientas técnicas y complejas de forma combinada (estadísticas, machine learning, data mining, etc.) mediante las cuales se aplicarán determinados algoritmos para cruzar los datos y extraer aquel tipo de información que es nuestro objetivo.

Llegados este tercer punto, podemos encontrarnos con diferentes tipos de analítica dependiendo de los resultados que vayamos a obtener:
- Analítica descriptiva: nos ofrece una información sobre la situación actual, muestra cómo están funcionando determinadas estrategias de las empresas, como algunas estadísticas.
- Analítica predictiva: se utiliza con el objetivo de encontrar patrones dentro de la información analizada y así identificar tendencias que sirvan a las empresas para reorientar sus estrategias de negocio si fuera necesario.
- Analítica prescriptiva: va un paso más allá que la predictiva y tomando en cuenta estos patrones y diferentes variables, permite «predecir» un comportamiento de los usuarios de modo que las empresas tendrán una recomendación sobre lo que deben hacer.
A finales de 2019 las empresas españolas seguían sin explotar los datos mediante esta técnica, ya que solo un tercio de las empresas cuenta con tecnología Big Data y apenas un 17% tiene especialistas para analizarlos. Sectores como las telecomunicaciones y la banca son casi los únicos que están explotando este tipo de datos.
Sin embargo el Big Data es un campo que está en permanente cambio, tanto como los tipos de datos que viajan por la red, por lo que se esperan muchos cambios en los próximos años.