Informe OBS: Big Data vs. Huge Data, más similitudes que diferencias
Machine Learning y Deep Learning, las nuevas tecnologías clave en el manejo de enormes volúmenes de datos
- El 54,06% de los datos analizados por el Big Data son los de geolocalización.
- El sector servicios son los que más utilizan el Big Data.
- El sector salud se encuentra entre las áreas de desarrollo del Big Data, este innovador enfoque ayudará tanto a pacientes como a los entes sanitarios, afinando los tratamientos y las prescripciones.
¿Qué es el Big Data?
El Big Data es la gestión de grandes volúmenes de datos que se realiza por parte de diferentes empresas y organismos públicos. Los datos pueden ser estructurados, semiestrucutados o no estructurados. Y, para considerarse como Big Data, deben poseer al menos una de las siguientes características: volumen, variabilidad o velocidad.
Aunque, como hemos visto, tradicionalmente se habla de 3 uves, diferentes expertos amplían la lista añadiendo cuatro más, para completar la lista de las 7 uves, estos son: veracidad de los datos, viabilidad, visualización de los datos y valor de los datos.
Ejemplos de aplicación de Big Data
- Big Data e inteligencia artificial
La cantidad de datos que se genera se duplica, lo que está llevando a las empresas a un escenario complicado, ya que no pueden gestionar los datos que generan y, por lo tanto, tomar las mejores decisiones basadas en ellos (data-driven companies)
Si explotamos la implantación de esta tecnología a nivel empresarial, podemos encontrar diferentes ejemplos o casos de éxito como: Google y su IA utilizada en medicina, Google y su IA utilizada para descifrar textos antiguos y Netflix y su uso de IA.
- Big Data y Deep Learning
Deep Learning o aprendizaje profundo es un concepto ligado a las redes neuronales artificiales, por lo que si se quiere poder procesar redes con gran cantidad de nodos se requiere este tipo de tecnología.
¿Qué podemos esperar del Deep Learning en el futuro? Lo que actualmente se ha desarrollado son los primeros pasos, aunque ya se está trabajando en otras áreas como las siguientes: memoria semántica, razonamiento, atención, motivación y emoción.
En el futuro se dispondrá de “sistemas cognitivos artificiales” capaces de aprender y captar información para procesarla del mismo modo que lo hace nuestro cerebro.
Cuándo se pasa del Big Data al Huge Data
El concepto de Huge Data se refiere tanto al enorme volumen de datos, en muchos casos inmanejable, como a la exploración de nuevos enfoques y tecnologías para su gestión eficiente.
¿Cómo se relacionan Big Data, Machine Learning y Deep Learning? En sí mismas son tecnologías complementarias, no excluyentes, por lo que cada una tiene su propio campo de actuación:
- Big Data: Se encarga de extraer y procesar los datos de diferentes orígenes para ponerlos a disposición de los diferentes algoritmos de Machine Learning y Deep Learning.
- Machine Learning: Trabaja con los datos procesados por la plataforma Big Data para obtener conocimientos para negocio y automatizar ciertas tareas (el sistema aprende).
- Deep Learning: Utiliza los datos procesados por Big Data y aprende a altos niveles de profundidad, focalizándose en tareas de alta complejidad.
Los sistemas actuales Big Data no están preparados para absorberlo y procesarlo todo con velocidad que las empresas necesitan, por lo que es necesario implementar sistemas Machine Learning y Deep Learning que permitan procesar la información, obtener el valor de cada dato y proveer de información de calidad a los diferentes usuarios para favorecer la toma de decisión.
Todo proyecto de este tipo debe comenzar con la implementación de una infraestructura y arquitectura Big Data que, una vez esté madura, nos permita comenzar a trabajar en el primer algoritmo Machine Learning, que un tipo de algoritmo guiado.
Una vez la compañía se encuentre más madura en cuanto a este tipo de sistemas, se puede proponer avanzar a Deep Learning.
El secreto del éxito de estos proyectos es el análisis previo de los datos para definir qué aporta en cada momento. Este análisis no debe ser algo puntual, ya que las necesidades van cambiando y debemos adaptar los procesos de forma continua.
El Big/Huge Data en la empresa
¿Cuándo se podría/debería implementar?
Un aspecto muy importante que no debemos obviar y que es una de las bases de este tipo de proyecto es el volumen de datos. No todas las empresas tienen el suficiente volumen de datos como para aprovechar la potencia de una herramienta de Big Data.
Otro de los aspectos no menores a tener en cuenta, y al que muchas compañías no dan importancia, es la madurez empresarial. Según CMMI, que es un modelo que mide la madurez de las organizaciones, una compañía estaría preparada para acometer un proyecto de este tipo cuando se encuentre en un nivel de tres de madurez (idealmente el cuatro), ya que debe tener procesos sistemáticos y proactivos.
¿El uso de Big Data está muy extendido?
Para poder entender si realmente las empresas “confían” en los proyectos de este tipo, se ha realizado un análisis de los datos estadísticos recogidos en el INE (Instituto Nacional de Estadística) sobre el Big Data, que recoge que en España no hay un porcentaje grande de empresas del sector servicios las que lo hacen. Los datos que mayoritariamente son analizados con este tipo de tecnologías son los de geolocalización y de las redes sociales, lo que es en principio lógico por la necesidad de las compañías de gestionar el alto volumen de datos generado por los dispositivos.
Casos de éxito de Big Data: Netflix
Netflix es una de las empresas más innovadoras en este tipo de tecnología, ya que aplica un sistema que recomienda contenidos en base a tecnología de Machine Learning. Esta plataforma recaba una gran cantidad de los usuarios y analiza los hábitos de consumo gracias a un algoritmo, proponiendo contenidos similares a otros usuarios con perfil similar. Esto permite mejorar la experiencia de los usuarios con perfil similar. Esto permite mejorar la experiencia de los usuarios y ofrecer contenidos “frescos” de forma constante, lo que logra mantener el interés en lo que la plataforma puede ofrecer.
Big/Huge Data y la Ciberseguridad
El Big Data es un gran aliado de las compañías, ya que puede ayudar a protegerlas ante los posibles ataques que pueden sufrir, detectando las vulnerabilidades de forma rápida y eficiente. Pero, ¿cómo puede ayudar de forma más concreta? Hay diferentes modos como, creando modelos, monitorizando los sistemas, detectar los posibles ataques y, por último, analizar ataques anteriores.
Una de las tecnologías que, junto al Big Data, ayudará a mejorar las soluciones de Ciberseguridad en las compañías es la Inteligencia Artificial (IA). Gracias a esta tecnología, los propios sistemas de las compañías pueden predecir futuros ataques, al estar preparados los algoritmos para trabajar con información de tipos diversos y al disponer de GPUs más potentes en los servidores.
Hay una serie de aspectos que deben tener en cuenta para que una implementación de este tipo de proyectos de Ciberseguridad sea un éxito:
- Los datos deben tener la calidad suficiente y sean consistentes.
- Los algoritmos deben entrenarse para que entiendan el contexto de la información.
- Todas las variables que se utilicen en los modelos deben estar definidas de forma previa.
Futuro del Big Data/Huge Data
La evolución tecnológica en torno al Big Data lleva una velocidad enorme y no paran de aparecer nuevas soluciones o enfoques innovadores, dado que esta es actualmente una prioridad para las empresas. No obstante, se pueden identificar una serie de áreas de desarrollo como los “datos oscuros” O Dark Data, el Análisis cuántico o el Big Data en el sector salud.