Published 23 January, 2025
El libro corresponde a:
Este es el primer libro de computación que leo, se volvió mucho más fácil de abordar ya que tengo conocimientos en el área de datos y he estudiado para una certificacion de tipo fundamentals de la nube. Como opinión general es un libro muy útil, si bien estos conocimientos se obtienen gradualmente al trabajar en el área permite centrarlos en los conceptos existentes y asignarles nombres. Si ya posees una certificación fundamentals muy probablemente encontrarás material que ya conoces, también puede suceder si tienes conocimientos de flujos ETL. Aún con estos conocimientos es una lectura útil que no se vuelve para nada tediosa.
Algo en clave en este libro es que posee conceptos que se mantienen vigentes en el año actual (2025) y desde mi opinión se mantendrán vigentes algunos años más.
El libro me gustó y me fué útil. No es necesario recomendarlo para un momento específico ya que puede leer sin conocer los temas que trata o ya conociéndolos, no es una lectura tediosa. El material del libro físico tiene buena calidad y la letra y dibujos se ven con claridad.
5/5
A continuación las ideas clave de cada capítulo.
Se debe considerar la Ingeniería de Datos como el desarrollo, la implementación y mantención de sistemas y procesos que toman data cruda y la convierten en data de gran calidad con información consistente. Un ingeniero de datos maneja el ciclo de vida desde la obtención de las fuentes hasta servirla para los casos de uso (como analítica o machine learning).
Esta imagen es clave en cómo los pasos posteriores dependen de una buena base, dónde el 80% de un proceso de Machine Learning es el procesamiento y limpieza de los datos. [https://hackernoon.imgix.net/hn-images/17IMev5xslc9FLxr9hHhpFw.png](https://hackernoon.imgix.net/hn-images/17IMev5xslc9FLxr9hHhpFw.png) The Data Science Hierarchiy of Needs (https://oreil.ly/pGg9U)
Generación, Almacenamiento, Ingesta, Transformación y Servir la data [https://hackernoon.imgix.net/hn-images/17IMev5xslc9FLxr9hHhpFw.png](https://hackernoon.imgix.net/hn-images/17IMev5xslc9FLxr9hHhpFw.png)
Diseñando una buena arquitectura de datos
Elijiendo tecnologías a lo largo del ciclo de Ingeniería de Datos
Generación de datos y in source systems
Almacenamiento
Ingesta
Consultas modelamiento y transformación
Sirviendo datos para analítica, machine learning y ETL en reversa
10 Seguridad y privacidad
11 El futuro de la ingeniería de datos