Análise Exploratória de Dados · Python · E-commerce

Maximizando
Receita E-commerce

De dados fragmentados a estratégia orientada a dados — quatro análises que revelam o que vender, quando agir, onde focar e para onde expandir.

🐍 Python 3.13 🐼 Pandas 2.2 🔢 NumPy 2.1 📈 Matplotlib 3.10 🎨 Seaborn 0.13 📓 Jupyter
R$ 5,16M
Faturamento total analisado
R$ 3.850
Ticket médio por pedido
4
Análises estratégicas
500
Transações processadas

O Problema de Negócio

Uma loja em crescimento, mas sem visibilidade real sobre sua própria performance.

A loja acumulava histórico de vendas, mas os dados existiam de forma isolada e não processada. A equipe de gestão tomava decisões de estoque por intuição, campanhas de marketing eram genéricas e a estratégia de expansão geográfica não tinha fundamento analítico.

O resultado: rupturas de estoque em produtos de alta rotação, verba de marketing mal direcionada e oportunidades logísticas não capturadas em regiões com demanda crescente.

O objetivo foi transformar o histórico de transações em diretrizes estratégicas acionáveis respondendo às quatro perguntas fundamentais de qualquer operação de e-commerce.

O que vender?  ·  Quando agir?  ·  Onde focar?  ·  Para onde expandir?

Quatro perguntas. Quatro análises. Uma estratégia coesa.
📦
Estoque Ineficiente
Sem dados de volume por produto, o reabastecimento era reativo. Produtos de alta rotação ficavam em ruptura enquanto itens de baixo giro ocupavam espaço.
📣
Campanhas Genéricas
Marketing sem inteligência de sazonalidade. Investimentos em tráfego pago eram uniformes ao longo do ano, ignorando picos de demanda identificáveis.
🗺️
Expansão Sem Dados
A empresa não sabia quais estados concentravam receita ou qual eixo geográfico justificava investimento em logística expressa e parcerias de frete.

Pipeline de Dados

Da geração controlada à engenharia de atributos — cada etapa construída para maximizar a qualidade analítica.

Geração Sintética 500 registros Limpeza & Tipos pandas dtypes Feature Engineering Faturamento · Status_Entrega 4 Análises groupby · agg · viz Insights Estratégicos acionáveis · mensuráveis
dataset_schema.py
Coluna Tipo Descrição
ID_Pedidoint64Identificador único do pedido
Data_Pedidodatetime64Timestamp da transação
Nome_ProdutoobjectNome do item vendido
CategoriaobjectSegmento do produto
Preco_Unitariofloat64Preço por unidade (R$)
Quantidadeint64Unidades vendidas (1–7)
ID_Clienteint64Identificador do comprador
EstadoobjectUF de entrega (7 estados)
Faturamento*float64Criada: Preço × Qtd
Status_Entrega*objectCriada: Rápida / Normal
feature_engineering.py
# ── Conversão de tipo temporal
df['Data_Pedido'] = pd.to_datetime(
    df['Data_Pedido']
)

# ── Métrica principal: receita por linha
df['Faturamento'] = (
    df['Preco_Unitario'] * df['Quantidade']
)

# ── Segmentação logística via lambda
sudeste = ['MG', 'RJ', 'SP']
df['Status_Entrega'] = df['Estado'].apply(
    lambda x: 'Rápida' if x in sudeste
              else 'Normal'
)

# ── Decomposição temporal para sazonalidade
df['Mes'] = df['Data_Pedido'].dt.to_period('M')

# src/utils.py → design system consistente
setup_style()   # rcParams + palette 'husl'
save_fig(fig, 'top_10_produtos', dpi=150)

As 4 Análises Estratégicas

Cada análise responde a uma pergunta de negócio com pandas, uma visualização e uma recomendação direta.

Análise 01
Mix de Produtos
O que vender? · Volume por SKU
# Volume total por produto
ranking = (
  df.groupby('Nome_Produto')['Quantidade']
    .sum()
    .sort_values(ascending=False)
    .head(10)
)
# Viz: barh + FuncFormatter + tight_layout
34% Top 3 SKUs
Mouse Sem Fio (60 un.) · SSD 1TB (58 un.) · Teclado Mecânico (55 un.) concentram 34% de todo o volume de pedidos. Alta rotação com preço médio acessível — combinação ideal para bundling.
↳ Priorizar estoque e criar bundles de acessórios high-end
Análise 02
Sazonalidade Mensal
Quando agir? · Decomposição temporal
# Decomposição por período mensal
df['Mes'] = df['Data_Pedido'].dt.to_period('M')
fat_mensal = (
  df.groupby('Mes')['Faturamento'].sum()
)
# Viz: line + markers + axhline(média)
+15% Fev. vs. média
Fevereiro atinge R$ 1,63M — 15% acima da média mensal de R$ 1,5M. Variação de 65% entre o melhor e pior mês indica sazonalidade clara e previsível.
↳ Antecipar marketing pago 15 dias antes do pico projetado
Análise 03
Receita por Categoria
Onde focar? · Concentração de faturamento
# Faturamento agregado por segmento
fat_cat = (
  df.groupby('Categoria')['Faturamento']
    .sum()
    .sort_values(ascending=False)
)
# Viz: barh + FuncFormatter currency
58% Eletrônicos
Eletrônicos domina R$ 3,02M dos R$ 5,16M totais. Hardware contribui com 27%. Acessórios (15%) têm alto volume mas baixo ticket — candidatos à estratégia de upsell.
↳ Expandir catálogo de Laptops/GPUs para maximizar margem
Análise 04
Concentração Geográfica
Para onde expandir? · Heatmap estadual
# Receita por estado com visual de calor
fat_geo = (
  df.groupby('Estado')['Faturamento']
    .sum()
    .sort_values(ascending=False)
)
# Viz: sns.barplot(palette='magma')
41% Eixo Sudeste
O eixo MG-RJ-SP concentra 41% da receita total. Bahia surge como 2ª força (R$ 820K) com tração orgânica no Nordeste — indicativo de demanda reprimida por logística.
↳ Frete expresso no Sudeste + parceria de última milha no Nordeste

Stack Técnica

Ferramentas escolhidas pela maturidade, ecossistema e adequação ao problema analítico.

🐍
Python
v3.13
Runtime principal. Tipagem dinâmica e ecossistema científico maduro para análise de dados.
🐼
Pandas
v2.2.3
Data wrangling, groupby, aggregations e manipulação de séries temporais com datetime64.
🔢
NumPy
v2.1.3
Operações numéricas vetorizadas sobre arrays multidimensionais com broadcasting nativo.
📈
Matplotlib
v3.10.0
Visualizações customizadas com rcParams, FuncFormatter de moeda e controle total de estilo.
🎨
Seaborn
v0.13.2
Heatmaps com palette 'magma' para densidade geográfica e visualizações estatísticas de alto nível.
📓
Jupyter
Notebook
Narrativa exploratória reproduzível. Código, visualização e análise textual no mesmo documento.
🔖
Watermark
rastreabilidade
Registro automático das versões de todos os pacotes no notebook — reprodutibilidade garantida.
🛠️
src/utils.py
design system
setup_style() + save_fig() — padronização visual e exportação DPI consistente em todo o projeto.

Resumo Executivo

Quatro perspectivas analíticas, quatro descobertas, quatro recomendações estratégicas acionáveis.

Perspectiva Descoberta Principal Recomendação Estratégica
📦 Produtos Mouse Sem Fio e SSD 1TB lideram o volume. Top 3 SKUs = 34% dos pedidos. Garantir estoque prioritário e criar bundles de acessórios para aumentar ticket médio.
📅 Sazonalidade Pico de R$ 1,63M em Fevereiro — 15% acima da média. Variação mensal de 65%. Escalar investimento em tráfego pago 15 dias antes dos picos de demanda projetados.
🏷️ Categorias Eletrônicos domina 58% do faturamento (R$ 3,02M). Hardware em segundo com 27%. Expandir catálogo de Laptops e GPUs. Estratégia de upsell de acessórios em checkout.
🗺️ Geografia Eixo MG-RJ-SP concentra 41% da receita. Bahia cresce organicamente (R$ 820K). Frete expresso no Sudeste + parceria de última milha no Nordeste (BA/CE).
Próximas Evoluções do Projeto
👥 Análise de Cohort de Clientes
🤖 Previsão de Demanda com ML
📊 Dashboard Interativo (Plotly/Dash)
🗺️ Mapa Coroplético Geográfico
💰 Análise RFM (Recência · Frequência · Valor)

Como Executar

Ambiente reproduzível em 3 passos — sem dados externos necessários.

1
Clone o repositório
git clone https://github.com/athosroque/analise-de-vendas-e-commerce.git
2
Instale as dependências
pip install -r requirements.txt
3
Execute o notebook
jupyter notebook notebooks/Analise_Vendas_Ecommerce.ipynb