Partidas Brasileirão
Victor Fritsch Ribeiro, Henrique Rafael Daltrozo e Theodoro Gaspar Ferreira.
A análise estatística no contexto esportivo oferece insights valiosos para compreender o desempenho das equipes ao longo de uma competição, que nesse caso o foco foi o campeonato Brasileiro. Neste estudo, exploramos dados dessa competição esportiva durante um período de 10 anos, investigando a performance dos times com base nos gols marcados, vitórias, derrotas, empates e ano da competição.
Utilizando técnicas de visualização de dados, exploramos diversos aspectos do desempenho das equipes, desde os líderes em gols até aqueles que enfrentaram maiores desafios para marcar. Por meio de gráficos interativos, buscamos compreender a evolução temporal das performances das equipes ao longo das temporadas, destacando os dois lados da moeda.
Através de gráficos interativos e análises visuais detalhadas, este estudo visa oferecer uma perspectiva clara e elucidativa do cenário esportivo, proporcionando um olhar mais abrangente sobre o desempenho das equipes e os padrões observados ao longo das temporadas.
Bibliotecas utilizadas
Importação do Dataset
Para fazermos esta análise, utilizamos um dataset público disponibilizado pela plataforma Kaggle, este dataset compila diversos dados das partidas brasileiras dos últimos anos, entre 2012 e 2022.
Clusterização
O processo de clusterização consiste em realizar o agrupamento, organização e filtragem de informações por características em comum. Neste caso estamos removendo alguns dados inconsistentes presentes na database, corrigindo o datasheet para remover dados que estão listados como "Nulos" que podem atrapalhar ao extrair algumas informações como, por exemplo, placar dos jogos listados.
Há também alguns códigos de gráficos que poderiam estar unificados nessa seção, porém preferimos manter todo passo a passo de cada gráfico no seu respectivo quadro.