Apresentação
Spark é uma ferramenta de Big Data, uma das tecnologias mais modernas para processar grandes conjuntos de dados de forma paralela e distribuída. Scala é a linguagem de eleição para programação em Spark.
A quem se destina
Este curso destina-se a Engenheiros de software, Programadores, Analistas de dados e a todos aqueles que estejam interessados em ampliar conhecimentos de BigData.
Objectivos
No final da acção de formação os participantes deverão estar aptos a:
Desenvolver código distribuído utilizando o a linguagem Scala
Instalar e configurar um Standalone Apache Spark 3.0 Cluster.
Analisar BigData e extrair informação útil.
Aplicar transformações a bases de dados e data frames
Aplicar analises gráficas usando GraphX
Monitorizar o funcionamento de um cluster spark