Bienvenido Data Lake, ¿Qué pasa con el Big data?

Bienvenido Data Lake, ¿Qué pasa con el Big data?

Cada cierto espacio de tiempo aparecen nuevos términos o conceptos dentro del mundo de la tecnología. Lo (pen)último en la analítica avanzada de datos es el ‘data lake’ que va un paso más adelante del ‘big data‘.

Big Data

El Big data se trata de aprovechar la inteligencia de analizar y cruzar una gran cantidad de datos para detectar nuevos patrones de consumo o identificar nuevas oportunidades de negocio.

Es decir, a través del big data una cadena de supermercados es capaz de realizar una segmentación de sus diferentes clientes en base a las compras que han realizado en sus diferentes tiendas, y una empresa de telecomunicaciones puede saber por qué diferentes zonas de una misma ciudad se mueven los turistas, y se les puede vender esta información a los responsables de turismo de la ciudad para que busquen cómo atraer turistas a otros barrios.

En la actualidad, existen dos formas diferentes de entender el big data:

– Como una evolución del business intelligence (herramienta que extraen inteligencia de la información de una empresa y sobre esto elaboran diferentes predicciones).

– Como una disrupción.

La disrupción está no sólo en la cantidad de datos de lo que hablamos, que en algunas ocasiones nos permite hacer correlaciones antes inimaginables, sino de su procedencia. Es decir, son los datos deseectructurados, que ya no sólo proceden de la empresa sino también de la web, blog, redes sociales y otras fuentes.

En la actualidad, la mayor parte de las empresas están todavía en las fases iniciales del big data. Es decir, hacen una recopilación de la información y la almacenan, pero sin saber cómo utilizarla.

Pese al estar incipiente, surgen ya nuevos conceptos, que suponen un paso más en la estrategia de analytics dentro de las empresas. Uno de los que surge con fuerza es el ‘data lake’.

Data Lake

Data lake es meter toda la información en un único lugar, incluyendo también los datos desestructurados. Pero con el business intelligence se recoge está información desestructurada de diversas fuentes, se filtran y se ordenan, y finalmente se almacena. Por tanto en un data lake, se recoge la información y se almacena, pero no se hace ningún tipo de limpieza, no se altera la información original.

¿Qué diferencia existe entre ‘Data Lake’ y ‘Big Data‘?

En el Big Data se realiza un filtro, se escoge de un determinado documento la información que se cree que será importante en un futuro (membrete, remitente, números…) y se elimina el resto. Por tanto, esta base de datos da respuestas de manera útil a la preguntas que nos planteamos siempre, pero puede que no se permita hacer ciertas correlaciones innovadoras. En cambio en Data Lake, si no alteramos el original, se puede hacer los preguntas que queramos.

En este sentido, se está hablando entre los expertos del sector de cambiar el paradigma ETL (extract, transform y lead) por ELT (extract, load y transform).

Se puede considerar sostenible

Un Data Lake, en realidad, consiste en un gran lago donde una empresa tiene toda su información, en lugar de en diferentes silos separados, es decir, eso no significa que todos los datos no estén físicamente en un mismo lugar.

Nos podemos plantear si una empresa puede pagar el almacenamiento y capacidad de gestión que requiere un Data Lake. En realidad, la claves está en utilizar servidores básicos, y reservar las máquinas con más capacidad para realizar procesos críticos como la información transaccional.

Por tanto, lo siguiente que nos podemos plantear es que si la infraestructura tecnológica que requiere el business intelligence ya no es valida. La respuesta sería no, ya que el business intelligence todavía no ha muerto, simplemente se van añadiendo nuevas capacidades.

Actualmente, existen empresas que tienen su propio ‘Data Lake’. Tanto General Elecxtic como la aseguradora ANV tienen sus propio ‘Data Lake’. En ANV gracias a contar con esta infraestructura de datos descubrió la oportunidad de lanzar ofertas a clientes de otras empresas aseguradores que hubieran sido descubiertos conduciendo bajo los efectos del alcohol. Por tanto, las pólizas de ese tipo de clientes se multiplicaban, y ANV aprovechó para ofrecerles precios muchos más ventajosos y conseguir más cuota de mercado.

¿Por qué no está el Big Data más popularizado?

Si existen grandes oportunidades de negocio explotando el ‘Big Data’ nos podemos plantear porqué no todas las empresas lo utilizan. Existen para esto tres razones:

– La poca transparencia ya el ‘Big Data’ proporciona un valor diferencial que pocas empresas están dispuestas a hacerlo público.

– La dificultad de gestionar los datos. Esto es, determinar quién puede acceder a los datos, qué condiciones de privacidad y seguridad aplicar en cada caso… Aquí entra en juego la figura del CDO (Chief digital officer).

Raúl Jaime es profesor en IEBS Business School en varios programas Máster, emprendedor de Empresa Formación y profesional del sector de finanzas. También investiga sobre la creatividad e innovación en la empresa. Autor del libro "El libro verde del emprendedor colaborativo": http://goo.gl/6zl3EY y del libro "Emprendedor social, ¡Tú puedes!": http://goo.gl/3cA1LG y colaborador programa TV 'Tribuna Finanzas' (México): http://goo.gl/DqJccH .

No hay comentarios

Dejar respuesta