Big Data

Qué tipos de datos hay en Big Data

Te explicamos los tipos de datos que hay en Big Data en sus dos grandes clasificaciones: en función del origen de los datos y de la categoría de los datos.

Por Redacción España, el 28/01/2021

auto ¿Te ha gustado nuestro artículo? ¡Vota!

El Big Data es una disciplina que se dedica a recabar, gestionar y analizar datos masivos procedentes de distintas fuentes, estrucurados y no estructurados y muy complejos. Todo ello de forma automática y a un precio accesible. En función de su origen y de su categoría, podemos decir que existen diferentes tipos de datos en Big Data.

Antes de ello, tres pinceladas para contextualizar. El Big Data es un todo, un proceso global, que empieza cuando damos con un dato y termina cuando lo convertimos en información útil para el negocio, la investigación o el objetivo que tengamos. Esto implica: la verificación del dato, su cruce con otros datos para extraer patrones, etcétera. En resumen, el Big Data abarca:

  • Los propios datos masivos.
  • Las herramientas en las que almacenamos esos datos.
  • Los software con los que los procesamos.
  • La información que extraemos de ese procesamiento y su aplicación.

No parece una locura afirmar que el Big Data vive por, para y gracias a los datos. ¿Qué datos? Vamos a ello.

Tipos de datos según su origen

En base al origen de los datos podemos realizar cinco grandes categorizaciones que son comunes en todos los análisis: datos de web y redes sociales, Big Transaction Data, datos biométricos, datos generados por los seres humanos y datos M2M.

Web y redes sociales

Este apartado comprende todos los datos que obtenemos de los usuarios digitales a partir de sus interacciones en redes sociales. Cada like, cada comentario, cada vez que compartimos un artículo o guardamos una foto, cada vez que vemos una publicación y no interactuamos con ella, cada vez que vemos una publicación y sí interactuamos con ella... Básicamente, todo lo que hacemos en redes sociales genera data.

Aquí también se incluyen los datos que se recogen en las páginas web a partir de la navegación (los clics que hacemos, el tiempo que estamos en una página, las páginas que visitamos cuando abrimos una web...), las ventas de una e-commerce o las búsquedas que se realizan en Google y otros buscadores, por poner algunos ejemplos.

Big Transaction Data

Los Big Transaction Data son datos más complicados de categorizar que los que vienen, por ejemplo, de las redes sociales. Hablamos de los datos que se generan en grandes transacciones, por ejemplo, todos los registros de la facturación de una empresa, de las compras y ventas que ha hecho y los diferentes canales que se emplean para ello, la gestión de su stock, los clientes que tiene, etcétera. Podemos encontrar estos datos en formatos semiestructurado o no estructurado (te explicamos más adelante qué es cada uno y cuáles son sus diferencias).

Datos biométricos

Explicado de forma sencilla, los datos biométricos son los que aportamos los seres humanos a partir de nuestras características de conducta, físicas o fisiológicas. Por ejemplo, tu voz o la retina de tu ojo se pueden convertir en un dato biométrico. De igual forma, la huella dactilar o el escaner facial con los que desbloqueas el móvil son datos biométrico.

Datos generados por los seres humanos

En este grupo de datos generados por los seres humanos incluimos, por ejemplo, una llamada a atención al cliente (seguro que te suena eso de "su llamada podría ser grabada"). También son datos generados por seres humanos el correo eléctronico que dejamos cuando nos creamos una cuenta de usuario en una plataforma o los formularios electrónicos que rellenamos cuando hacemos una compra o nos suscribimos a una newsletter.

Datos M2M

Machine to Machine o de máquina a máquina. Los M2M son los datos que se obtienen a través de tecnologías que conectan a unos dispositivos con otros, haciendo que haya intercomunicación entre ellos. Esta interconexión de máquinas genera un gran volumen de datos que precisa un análisis automatizado para tener sentido.

Por ejemplo, si una fábrica implementa un software de control de stock inteligente, las propias máquinas comparten los datos, lo que permite realizar un inventario automatizado. Otro ejemplo, los frigoríficos inteligentes, capaces de detectar cuáles son los básicos de tu nevera, hacerte automáticamente la lista de la compra e incluso realizar esa compra online por sí solos en tu supermercado de confianza.

Tipos de datos por categoría

En la clasificación de datos por categoría distinguimos estructurados, no estructurados e híbridos o semiestructurados.

Estructurados

Los datos estructurados son datos ordenados. Aquí agrupamos datos cuyo formato está definido, al igual que su tamaño y su longitud. Precisamente por eso, su procesamiento es más sencillo que en el caso de datos no estructurados o semiestructurados. Piensa, por ejemplo, en una hoja de cálculo. 

No estructurados

Cuando estamos ante datos que no tienen una estructura interna identificable, hablamos de datos no estructurados. Ejemplo: el batiburrillo de datos que puede dar un GPS o tu reloj inteligente, que lo mismo te puede decir cuántas horas has dormido o cuántas horas has tenido la calefacción puesta en casa. Ahora, suma tu batiburrillo de datos que generan todos los ususarios que tienen un reloj inteligente como el tuyo. 

También son no estructurados los datos generados por los usuarios, como los vídeos, audios, imágenes, PDF, etc. En ambos casos, la característica común y más destacable es que estos datos pueden tener muchísimo valor, pero ese valor solo se consigue cuando se ordenan, se identifican y se almacenan.

Datos híbridos

Cuando hablamos de datos híbridos nos referimos a datos que no son regulares y que no se pueden gestionar de forma estandarizada. Al final, los datos semiestructurados están a caballo entre los estructurados y los no estructurados: no están estructurados a la perfección, pero sí existe una organización definida. En este caso, serían datos semiestructurados los datos que están en formato XML o el HTML de una web.

Si aún te quedan dudas, consulta este artículo sobre diferencias entre datos estructurados y no estructurados.

TAGS:
Imagen del autor Redacción España

Equipo de redacción de B12 España: Marketing, Big Data, Inteligencia Artificial y Ventas.

Ponte en contacto con nosotros:

+34 916 629 534

madrid@agenciab12.com

Calle Alcalá, 21, 8ºD. 28014 - Madrid