Reconocer los diferentes tipos de datos, indispensable en la era del Big Data

Reconocer los diferentes tipos de datos, indispensable en la era del Big Data

Las nuevas cadenas de valor son los datos y los expertos aseguran que muchos de los problemas empresariales actuales se relacionan con una falta de conocimiento sobre Big Data. El primer paso para encontrar soluciones es saber identificar el tipo de datos que se tiene entre manos y relacionarlo con el problema empresarial.

15 Ene. 2019

Big Data es un término que hace referencia a la manipulación de una gran cantidad de datos, que pueden ser de diferentes tipos. La clasificación de la consultora IBM sobre los diversos tipos de datos que pueden ser analizados es ilustrativa. Existen cinco tipos:

  1. Web y redes sociales

Incluye contenido web e información que es obtenida de las redes sociales como Facebook, Twitter, LinkedIn, etc.

  1. Datos de grandes transacciones (Big Transaction Data)

Incluye registros de facturación, en telecomunicaciones registros detallados de las llamadas (CDR), etc. Estos datos transaccionales están disponibles en formatos tanto semi estructurados como no estructurados.

  1. Machine-to-Machine (M2M)

M2M se refiere a las tecnologías que permiten conectarse a otros dispositivos. M2M utiliza dispositivos como sensores o medidores que capturan algún evento en particular, los cuales transmiten a través de redes alámbricas, inalámbricas o híbridas a otras aplicaciones que traducen estos eventos en información significativa, seguridad e inteligencia. Los datos biométricos han sido información importante para las agencias de investigación.

  1. Biométricas

Información biométrica en la que se incluye huellas digitales, escaneo de la retina, reconocimiento facial, genética, etc. En el área de seguridad e inteligencia, los datos biométricos han sido información importante para las agencias de investigación.

  1. Generados por los seres humanos (Human Generated)

Las personas generamos diversas cantidades de datos como la información que guarda un call center al establecer una llamada telefónica, notas de voz, correos electrónicos, documentos electrónicos, estudios médicos, etc.

Además, según su estructura, pueden clasificarse en tres tipos:

  1. Datos estructurados

Datos cuya longitud y formato están bien definidos y están almacenados en tablas. Pueden ser ordenados y procesados fácilmente por cualquier herramienta de gestión de datos. Son datos estructurados las fechas, las hojas de datos o las bases de datos.

  1. Datos semiestructurados

Información no regular y, por tanto, no se puede gestionar de una forma estándar. Estos datos poseen sus propios metadatos semiestructurados que describen los objetos y las relaciones entre ellos, y pueden acabar siendo aceptados por convención. HTML, JSON o XML son ejemplos de datos semiestructurados.

  1. Datos no estructurados

Datos binarios que no tienen estructura interna identificable. Es un conglomerado masivo y desorganizado de datos que no tienen valor hasta que se organizan, identificándolos y almacenándolos. Algunos ejemplos de datos no estructurados son imágenes, vídeos, audios, PDFs, RRSS o .txt.

¿Te interesan las APIs financieras? Descubre todas las que te ofrece BBVA

¡Suscríbete!

Recibe nuestro boletín semanal. No te pierdas nuestros trucos, consejos, artículos y los eventos más innovadores.