Tener muchos datos no es Big Data

Sep 27, 2019 | Bigdata, Data, Data Storytelling, Liderazgo, Negocios, Tecnología

This story is a condensed version of one produced Inviso by Devoteam.

Aprende a reconocer si tus datos son big data o solo una gran cantidad de datos

Existe una gran confusión entre Big Data y “tener muchos datos”, pero, ¿qué es, exactamente? Este concepto está formado por conjuntos de datos de mayor tamaño y más complejos, especialmente procedentes de nuevas fuentes de datos. 

Estos conjuntos de datos son tan voluminosos que el software de procesamiento de datos convencional sencillamente no puede gestionarlos. Sin embargo, pueden utilizarse para solucionar problemas empresariales. Son datos que contienen una mayor variedad y que se presentan en volúmenes crecientes y a una velocidad superior. Y se les reconoce por contener las 5 v’s del big data.

Las 5 v’s del big data

1. Volumen

Con volumen, en big data, nos referimos a la cantidad de datos no estructurados que se deberán procesar. Puede tratarse de datos de valor desconocido, como feeds de datos de Twitter, flujos de clics de una página web o aplicación para móviles, o equipo con sensores. Para muchos esto puede suponer hasta cientos de petabytes.

2. Velocidad

El ritmo al que se reciben los datos al que se aplica un proceso. La mayor velocidad de los datos normalmente se transmite directamente a la memoria, en vez de escribirse en un disco. Algunos productos inteligentes habilitados para Internet funcionan en tiempo real y requieren una evaluación y actuación en tiempo real.

3. Variedad

Esto hace referencia a los diversos tipos de datos que tenemos disponibles. Los datos se presentan en nuevos tipos de datos no estructurados. Los tipos de datos no estructurados y semiestructurados, como el texto, audio o vídeo, requieren de un preprocesamiento adicional para poder obtener significado y habilitar los metadatos.

4. Valor

 Los datos poseen un valor intrínseco. Sin embargo, no tienen ninguna utilidad hasta que dicho valor se descubre.

5. Veracidad

Para que tus datos sean realmente útiles y puedas usarlos como big data deberás verificar que sean de fuentes fidedignas y que no sean datos vacíos con un origen falso.

Big data no es generar una plasta gigante de datos que no puedes utilizar de manera efectiva, sino invertir energía y aprender a usar los datos que ya tienes.

Si tienes muchos datos deberías al menos intentar organizarlos de una manera accesible, puede ser por Excel o en una base de datos SQL. Después de este primer paso puedes pasar a realizar una análisis de lo que quieres hacer con esos datos para mejorar tu negocio, para terminar con el último paso que es utilizar un software de análisis de datos en los que podrás crear un reporte de resultados eficiente. 

No importa si cuentas con big data o con muchos datos, puedes explotarlos al máximo si los limpias y trabajas bien. ¿Te gustaría mejorar tu expertise y tus habilidades? ¡Contáctanos!