Dashboard vendas Chinook
Projeto de visualização de dados, extraindo dados de um banco relacional sqlite para um arquivo parquet

Tecnologias
Links
Visão Geral
Este projeto consiste em um dashboard interativo desenvolvido com Streamlit para a análise de dados de vendas da Chinook, uma loja de músicas digital fictícia. O dashboard oferece visualizações sobre a receita, clientes, gêneros musicais mais populares e desempenho dos funcionários
Desafios Técnicos
- Limpeza e Tratamento de Dados: Essa base de dados apresentou-se consistente. Sendo necessário apenas realizar a conversão da coluna de data da compra para datetime.
- Análise Exploratória: Foi necessário estudar o banco de dados Chinook e suas relações, para poder começar a extração de dados com query. Como o mesmo possui diversas tabelas, precisei estudar sobre SQL para poder criar uma query para a base de dados analítica.
- ETL: Foi adotada uma abordagem de pré-processamento. Um script ETL extrai, transforma e carrega os dados em um arquivo Parquet otimizado para leitura. A aplicação Streamlit consome este arquivo, garantindo que o carregamento dos dados e a re-renderização dos componentes sejam extremamente rápidos.
Aprendizados
- Pandas: Aplicação de técnicas avançadas de limpeza e transformação de dados (data wrangling) para garantir a qualidade e a confiabilidade da análise.
- Plotly: Customização detalhada de elementos gráficos (tooltips, eixos, cores) para criar visualizações mais eficazes, informativas e esteticamente agradáveis.
- Arquivo Parquet: é um formato de arquivo para armazenamento de dados, projetado para ser altamente eficiente, especialmente para análise de dados em larga escala (Big Data). Com o Pandas foi possível manipular as informações normalmente, mudando basicamente o método inicial para
read_parquet.