Data lakes y madurez organizacional

A mí no me gustan los Data Lakes ❌

👉 Como vendedores es fácil perder la visión estratégica de formar relaciones a largo plazo y sobreponer nuestros intereses.
👉 Como consultores es fácil dar recomendaciones sin ownership, al fin de cuenta no seremos nosotros quién lo lleve a cabo… 🤷‍♂️

Usted no debería considerar un data lake si aún no tiene la madurez suficiente

Esto va para las personas que aún no han alcanzado una madurez en la ANALÍTICA DESCRIPTIVA en su organización:

⏺️ Calidad en datos

Es chévere tener profesionistas en datos quienes tengan altas habilidades en Python y apliquen limpieza de datos. Pero esto no soluciona el problema de RAÍZ, que es desde la producción de esos datos.

El mantener una normalización, documentación y coherencia en bases de datos relacionales es difícil:
“¿Qué te hace pensar que agregando objetos, archivos no binarios, Steam Analytics y bases de datos no-relacionales será pan comido?”

Con poca madurez organizacional en los datos, bajos controles y procesos no definidos. Es mucho más fácil que convirtamos nuestro bonito data lake *(lago de datos) en un “DATASWAMP” *(pantano de datos).

✅ Data Lake ➡️ Data Swamp ❌

El data lake que se convierte en “the data nightmare lake”

💡 Un pantano de datos:
Costoso, lleno de data basura que no agrega valor al negocio.

👉 Salvo que exista a nivel negocio una necesidad de analizar metadata de un objeto o producida por steam Analytics.
Yo aconsejaría quedarte fuera del alcance de un lago de datos y buscar centralizar la información por estas soluciones en un DWH mientras se identifican los registros y campos de valor, mientras se normalizan.

Creando buenas bases

Para que una organización alcance un nivel de madurez que pueda brindar visibilidad a sus usuarios de negocio a nivel DESCRIPTIVO. NO hace falta científicos de datos.

🧑‍💻👨‍💻👩‍💻 Necesitas ingenieros de datos quienes trabajen en las bases de la arquitectura de datos, definan pipelines y procesos**

** Esta definición de “Data Tech Stack”, no es percibido como valor a nivel negocio y es un “mal” necesario.
Esto puede percibirse como un gasto, pero está más ligado a la madurez organizacional.

👉 ¿Verdad que nadie cuestiona cuando los ingenieros en software solicitan el despliegue de contenedores para ambiente de trabajo?

“¿Será que a los equipos de datos les toca trabajar con lo que hay y no con lo que verdaderamente necesitan?” 💭

🎵 Si esto fuera hacer un grupo musical:
La batería & el bajo serían posiciones de ingenieros de datos, mientras que la guitarra y la voz los analistas de datos.
Es decir, son complementarios donde requieres de las bases, tiempo y ritmo para hacer una buena sintonía.



IVAN CHAVEZ

Hi there! If you’re into the data world like me, then you’re in the right place.

In this website, we’re going to dive into the exciting world of DataOps & Analytics. From the latest trends and innovations to practical tips and tricks, I got everything you need to stay on top of the game.
So grab a cup of coffee (or your beverage of choice), get comfortable, and let’s get started!

-IC