blog de OBS Business School

¿Qué tipos de datos se utilizan en el Big Data?

Blog |

Todos hemos oído hablar de los datos, del Big Data y su importancia en el mundo empresarial y personal tanto en el presente, como en el futuro. Sabemos que el análisis e interpretación de estos datos permite mejorar su toma de decisiones y sus estrategias, pero sin embargo, la mayoría no sabemos qué tipos de datos se utilizan en el Big Data ni de donde se obtienen.

Ebook GRATIS: Proyectos de Big Data

Saber qué datos necesitas según tus necesidades y de donde obtenerlos es tan importante como saber interpretarlos. Sin los datos correctos no se puede generar el conocimiento deseado ni mejorar la toma de decisiones basada en datos reales que nos permitan analizar el estado de casi cualquier proceso.

¿Qué tipos de datos se utilizan en el Big Data?

Los expertos en Big Data, los Data Manager, recogen diferentes tipos de datos y los gestionan de diferente forma según su origen o su formato. Por eso, la clasificación de tipos de datos que podemos encontrarnos puede variar según estas dos características. Identificarlos es muy importante para saber qué herramientas tenemos a nuestra disposición cuando vayamos a analizarlos. 

Tipos de datos según su origen

  • Redes sociales y páginas web: Este tipos de datos son muy valiosos para las empresas en términos de marketing digital. Son datos que obtenemos gracias a Internet, más específicamente a través de distintas herramientas utilizadas en redes sociales y páginas web. Estos datos nos proporcionan información muy valiosa no solo sobre los usuarios sino también de nuestro propio perfil o web. Todos estos datos nos permiten mejorar nuestra estrategia digital de forma efectiva, ya que todas nuestras acciones son medibles. 
  • Grandes transacciones: estos datos se obtienen de transacciones de facturación, telecomunicaciones, información de clientes, CRM, ERP, etc. Tienen un gran valor para las empresas ya que permiten analizar de una forma real todas las áreas de negocio. Normalmente se obtienen datos poco estructurados o totalmente desordenados, por lo que trabajar con ellos es complejo.
  • Biométricas: tal como indica la palabra son datos obtenidos a partir de tecnología de última generación que permite obtener datos biológicos. Lector de retina o de huella dactilar, reconocimiento facial o genético, reconocimiento de voz, de escritura, etc. 
  • Seres humanos: son los datos que generamos los seres humanos mediante el uso de las llamadas, los correos electrónicos, las notas de voz, uso de tarjeta de créditos, estudios médicos, encuestas, etc. 
  • Máquinas: denominados también como datos M2M (Machine to Machine), son los datos que se recogen cuando dos dispositivos “hablan entre ellos”. Un buen ejemplo puede ser los datos obtenidos de una red WiFi pública, en los que ordenadores o móviles se conectan a un router y comparten distinta información. 

Tipos de datos según su formato

Además de los datos clasificados según su origen, también podemos clasificarlos según su facilidad de uso, que se basa básicamente en el orden en que los recibimos, cuanto más ordenados estén, más sencillos nos será analizarlos e interpretarlos. Podemos distinguir entre: 

  • Datos estructurados: este tipo de datos ya están ordenados y bien definidos, por lo que resulta muy sencillo analizarlos y tratarlos. Suelen ser datos que se sacan de una base de datos o de una hoja de cálculo por ejemplo. 
  • Datos semiestructurados: son datos que no están totalmente ordenados pero que sí tienen una estructura definida. Necesitarán ser tratados de alguna forma para obtener los datos que queremos, pero gracias a estar etiquetados de forma estandarizada, podemos extraerlos de manera relativamente sencilla. Formatos como el HTML, JSON o XML son datos semiestructurados. 
  • Datos no estructurados: estos datos están totalmente desordenados, por lo que trabajar con ellos resulta realmente complejo. Antes de poder analizarlos deberemos identificar y extraer los datos que nos resulten útiles para nuestro propósito. Suele ser una tarea lenta y pesada, ya que estos datos pueden venir en texto plano, en audio, vídeo, imágenes, PDF, etc. Si no se tratan suelen ser datos de poco valor. 

Elegir los tipos de datos correctos es clave en el Big Data

El Big Data es útil y beneficioso para una empresa tan solo cuando tenemos los tipos de datos correctos. De nada sirve obtener unos datos no estructurados de inmenso tamaño en los que ni siquiera sabemos si contienen lo que necesitamos. La pérdida de tiempo y dinero puede ser realmente grande. Por eso, cuando trabajamos con un gran volumen de datos, es tan importante elegir el origen correcto de los datos, así como obtenerlos de la manera más ordenada posible. 

Para convertirte en un experto en el manejo de datos de gran volumen, te recomendamos cursar el Máster de Data Management e Innovación tecnológica que tenemos en OBS School Business. En él podrás aprender todo lo necesario para obtener los tipos de datos más interesantes para las empresas y que les permita mejorar la toma de decisiones en busca de una mayor competitividad.

 

Ebook GRATIS: Proyectos de Big Data