Google tiene las mejores apuestas en datos

Kaggle, es parte de Google. Lo acabo de descubrir hace un par de días y me ha volado la cabeza 🤯.

Si estás en este mundo de los datos, te explico el porqué deberías de tener a Google en tu radar.

Hace unas semanas te compartía algunos puntos del porqué deberías de considerar a google o GCP como un proveedor estratégico si estás considerando un multi-cloud.

Productos y servicios de google para equipos de datos:

Las soluciones de datos (De toda la vida):

  • Google analytics & Google como buscador #1, son por lejos de los productos más conocidos. Estas dos más Google Ads son soluciones que son el caballo de batalla de cualquier persona que se dedique al Marketing de una u otra forma.
  • Google Data Studio (Looker Studio), es una solución de analítica y visualización muy utilizada por personas en marketing para comenzar a sofisticar su análisis.
    Google adquirió en 2019 Looker, una solución de BI quién compite fuertemente contra Power BI & Tableau. Cada vez va tomando más relevancia. Ojo acá 👀
  • Google Sheets, el cual seguimos confundiéndolo con Excel. Pero para mi gusto tiene más herramientas para explotar su potencial con integraciones fuera de su ecosistema.

Soluciones avanzadas de analítica avanzada de datos:

  • Kaggle, no es solamente un lugar donde descargar datasets, es una red social pensada y diseñada para ti que estás metido en este “rabbit hole” de los datos. Acá podrás incluso practicar tu inglés al documentar tus proyectos y conectar con personas en otras partes del mundo.
    También te dará acceso a crear un perfil y poder comenzar a construir tu portafolio.
  • Google Colab, tu solución gratuita y en la nube de Python Notebooks. NO tienes que instalar nada. Simplemente, crea un archivo de colab como si crearas cualquier documento.
  • BigQuery, almacén de datos de alto desempeño en la nube. Acá hay solamente 2 opciones relevantes: Snowflake o Bigquery.
    Implementar un datalake NO es una opción viable para la mayoría de las organizaciones, si no tienen la madurez o el talento suficiente para explotar la data no-estructurada, es preferible dejar los datalakes de lado.
  • TensorFlow & Keras, librerías opensource para el desarrollo de modelos AI-ML, desarrolladas y soportadas principalmente por el equipo interno de Google además de la comunidad. Claramente.
    Ojo acá ya que TensorFlow (Google) con el partnership con NVIDIA, potencian el training de sus modelos usando CUDA, Parallel Computing.

Análisis masivos de datos utilizando parallel computing:

Para usar parallel computing con alguna otra librería o hardware tendrías que aprender OpenGL, eso es meter mas herramientas y skills a desarrollar. Cuando posiblemente la comunidad de TensorFlow & CUDA ya lo tengan solucionado u optimizado.

  • 💡 Google JAX – Librería de machine learning de alto rendimiento, mejor furturo que tensorflow. 💭 By: Carlos Vergara

Todo está más relacionado de lo que piensas, las soluciones de google en datos:

Me indican una clara tendencia de los esfuerzos de esta organización por buscar ser más relevantes en el mundo de los datos.

What do you think? 🤔


IVAN CHAVEZ

Hi there! If you’re into the data world like me, then you’re in the right place.

In this website, we’re going to dive into the exciting world of DataOps & Analytics. From the latest trends and innovations to practical tips and tricks, I got everything you need to stay on top of the game.
So grab a cup of coffee (or your beverage of choice), get comfortable, and let’s get started!

-IC