-
Os dois principais componentes de qualquer pipeline de dados são os data lakes e os armazenamento de dados. Neste curso, destacamos os casos de uso de cada tipo de armazenamento e analisamos detalhadamente as soluções de data lake e de armazenamento de dados disponíveis no Google Cloud Platform. Também descrevemos a função do engenheiro de dados e os benefícios dos pipelines para as operações de negócios, além de examinar por que é melhor fazer a engenharia de dados em um ambiente em nuvem. Os participantes terão uma experiência prática com data lakes e armazenamento de dados no Google Cloud Platform por meio do QwikLabs.
Overview
Syllabus
-
- Introdução
- Neste módulo, apresentamos a especialização em Data Engineering e o curso.
- Data Engineering
- Neste módulo, descrevemos o papel do engenheiro de dados e explicamos por que é melhor fazer a engenharia de dados no Cloud.
- Como criar um data lake
- Neste módulo, descreveremos o que é um data lake e como usar o Google Cloud Storage como data lake no GCP.
- Como criar um armazenamento de dados
- Neste módulo, discutiremos o BigQuery como uma opção de armazenamento de dados no GCP
- Resumo
- Neste módulo, examinamos todos os tópicos discutidos neste curso.