Skip to content

infobarbosa/data-engineering-spark-dataframes

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Spark Dataframes para Engenheiros de Dados

Author: Prof. Barbosa
Contact: infobarbosa@gmail.com
Github: infobarbosa

Objetivo

Este curso tem como objetivo proporcionar uma revisão das operações mais básicas com Spark DataFrames, abordando desde a manipulação inicial até técnicas avançadas. Serão explorados tópicos como criação e uso de UDFs (User Defined Functions), manipulação de estruturas complexas como arrays e structs, realização de junções e agregações, além de operações de pivot e unpivot. Também serão cobertos conceitos de rollups e cubes, funções de janela (window functions) e o uso do Spark SQL para consultas avançadas. Ao final, você estará apto a aplicar essas técnicas em cenários reais de engenharia de dados.

Ambiente de laboratório

Este curso foi desenvolvido para execução principalmente em ambiente Linux.
Caso você não tenha um à disposição então recomendo utilizar o AWS Cloud9.
As instruções de criação estão aqui.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published