Imagem Comparação de modelos de previsão de demanda para o varejo de eletroeletrônicos

02 de fevereiro de 2026

Comparação de modelos de previsão de demanda para o varejo de eletroeletrônicos

Carlos Eduardo Amorim de Oliveira; Elisa Morandé Sales

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este trabalho desenvolve e avalia modelos de previsão de demanda baseados em séries temporais para a categoria de informática em uma empresa varejista, comparando abordagens estatísticas com foco na acurácia e aplicabilidade para a gestão de estoque. A previsão de demanda é fundamental na gestão da cadeia de suprimentos, especialmente em setores voláteis como o de eletroeletrônicos. A categoria de informática, com itens como notebooks e componentes, apresenta desafios singulares: forte sazonalidade (Black Friday, volta às aulas), rápida obsolescência tecnológica e o impacto de campanhas promocionais que geram flutuações abruptas no consumo.

A ausência de um sistema de previsão robusto acarreta consequências financeiras e operacionais. A superestimação da demanda leva ao excesso de estoque, imobilizando capital e aumentando custos de armazenagem e risco de obsolescência. A subestimação resulta em rupturas de estoque (stockouts), que comprometem a receita e a lealdade do cliente. Nesse contexto, a aplicação de modelos estatísticos para analisar dados históricos de vendas é uma solução estratégica para mitigar riscos. A capacidade de transformar dados em inteligência preditiva é um diferencial competitivo (Fawcett & Provost, 2013).

Modelos de séries temporais são ferramentas consolidadas para análise de dados sequenciais, partindo da premissa de que padrões passados contêm informações sobre o comportamento futuro (Morettin & Toloi, 2006). Técnicas como Holt-Winters e ARIMA (Média Móvel Auto-Regressiva Integrada) decompõem uma série em tendência, sazonalidade e ruído para projetar valores futuros. A vantagem dessas abordagens é a capacidade de gerar previsões acuradas baseando-se unicamente no histórico da variável de interesse, o que é útil quando dados externos são escassos (Nielsen, 2020).

A aplicação desses modelos no varejo de informática permite quantificar padrões de consumo, oferecendo uma base para decisões de compra e alocação de estoque. A análise sistemática dos dados históricos possibilita a construção de modelos com maior poder preditivo e fomenta uma cultura orientada a dados. Ao ajustar os modelos para refletir os ciclos de vendas específicos da categoria, é possível antecipar picos e vales de demanda, permitindo um planejamento mais eficaz de campanhas e gestão de capital de giro.

O desenvolvimento de um modelo eficaz requer um processo metodológico que se inicia com uma análise exploratória dos dados, incluindo a inspeção de gráficos, a verificação de pressupostos como a estacionariedade e a decomposição da série para entender sua estrutura (Hamilton, 1994). A escolha de métricas de avaliação alinhadas aos objetivos de negócio também é um passo crítico. Este estudo, portanto, busca construir um framework analítico que possa ser compreendido, validado e replicado para outras categorias de produtos da empresa.

A metodologia adota uma abordagem quantitativa, alinhada aos princípios da ciência de dados aplicados a problemas de negócio (Fawcett & Provost, 2013). A base de dados utilizada consiste no histórico de vendas mensais da linha de Informática, cobrindo 30 meses, de janeiro de 2023 a junho de 2025. Os dados foram agregados mensalmente usando a biblioteca Pandas em Python (McKinney, 2018). Para assegurar a integridade da série, os meses sem vendas foram preenchidos com o valor zero, refletindo a ausência de demanda.

Antes da modelagem, uma análise exploratória foi conduzida. Cada série temporal foi decomposta em seus três componentes: Tendência, Sazonalidade e Resíduos (Morettin & Toloi, 2006). Em seguida, para avaliar a adequação de modelos ARIMA, foi aplicado o Teste de Dickey-Fuller Aumentado (ADF) para verificar a estacionariedade da série, um pré-requisito para muitos modelos estocásticos (Fávero et al., 2014; Hamilton, 1994). Uma série é não estacionária quando suas propriedades estatísticas, como média e variância, mudam ao longo do tempo.

Foram implementados quatro modelos com diferentes níveis de complexidade, uma prática recomendada para evitar complexidade desnecessária (Nielsen, 2020). O Sazonal Ingênuo (SNAIVE) foi usado como benchmark, prevendo que o valor futuro será igual ao do mesmo período da estação anterior. A Suavização Exponencial Simples (SEX) foi aplicada como modelo base. O Método de Holt-Winters Aditivo foi escolhido por sua capacidade de modelar nível, tendência e sazonalidade. Finalmente, a abordagem Auto-ARIMA foi empregada, utilizando o algoritmo auto_arima para encontrar a combinação de parâmetros (p,d,q)(P,D,Q) que minimiza o Critério de Informação de Akaike (AIC), garantindo um modelo parcimonioso.

Para a validação, a série foi dividida em um conjunto de treinamento (janeiro de 2023 a dezembro de 2024) e um de teste (janeiro de 2025 a junho de 2025). Os modelos foram treinados no primeiro período para prever os seis meses do período de teste. O desempenho foi avaliado comparando as previsões com os valores reais, utilizando o Erro Quadrático Médio (RMSE) e o Erro Percentual Absoluto Médio (MAPE). O RMSE foi priorizado por ser mais robusto e penalizar mais severamente grandes erros, sendo menos sensível a valores de demanda próximos de zero. O MAPE pode apresentar valores inflacionados em séries com baixa demanda, um fenômeno comum no varejo (Makridakis et al., 1998).

A aplicação da metodologia revelou uma heterogeneidade significativa no comportamento das famílias de produtos. O Teste de Estacionariedade ADF mostrou que, das sete famílias analisadas, apenas duas (“CORE I5” e “CORE I7”) eram estacionárias (p-valor ≤ 0.05), enquanto as cinco restantes (“ACESSÓRIOS”, “NOTEBOOK GAMER”, “MONITOR”, “CORE I3” e “IMPRESSORAS”) eram não estacionárias. Este resultado validou a necessidade de modelos como Auto-ARIMA e Holt-Winters, capazes de lidar com não estacionariedade (Hamilton, 1994). A decomposição da série agregada confirmou a presença de uma tendência de crescimento e forte sazonalidade anual.

A avaliação quantitativa do desempenho dos modelos mostrou que nenhum se destacou como universalmente superior. A métrica MAPE mostrou-se instável, ultrapassando 100% para famílias como “IMPRESSORAS” e “NOTEBOOK GAMER”. Este comportamento ocorre quando o erro absoluto médio é maior que o valor real médio, um artefato comum em séries de baixo volume que torna o MAPE um indicador pouco confiável. A distribuição do RMSE, em contrapartida, foi mais estável, reforçando a decisão de priorizá-lo como principal métrica de avaliação (Nielsen, 2020).

A análise da decomposição de cada série, cruzada com os resultados de RMSE, revelou a principal descoberta do estudo: o melhor modelo de previsão está diretamente correlacionado ao padrão de demanda da série, um pilar da ciência de dados aplicada a negócios (Fawcett & Provost, 2013). Três padrões emergiram. O primeiro foi o de séries dominadas por forte tendência de crescimento, como a família “CORE I5”. Para esta, o modelo Auto-ARIMA apresentou o menor RMSE (895.6), pois sua estrutura captura e projeta trajetórias de crescimento de forma robusta.

O segundo padrão foi o de séries dominadas por forte sazonalidade, com tendência menos definida, como a família “NOTEBOOK GAMER”. A decomposição mostrou picos de vendas claros e recorrentes. Nesse cenário, o modelo Sazonal Ingênuo (SNAIVE), apesar de sua simplicidade, teve o melhor desempenho, com um RMSE de 584.1. A premissa do SNAIVE de que o padrão do ano anterior se repetirá alinhou-se à natureza cíclica da demanda, superando modelos mais complexos. Isso evidencia que a adequação ao padrão dos dados, e não a complexidade do modelo, é o fator determinante.

O terceiro segmento de produtos foi o de demanda intermitente ou esporádica. A família “IMPRESSORAS” foi o principal exemplo, com uma série temporal caracterizada por vendas muito baixas, muitos períodos com valor zero e ausência de padrão claro de tendência ou sazonalidade. Como consequência, nenhum dos modelos tradicionais conseguiu gerar predições acuradas. O melhor resultado, obtido pela Suavização Exponencial Simples, ainda apresentou um MAPE de 344.7% e um RMSE de 272.3. Este resultado não é uma falha na modelagem, mas uma descoberta analítica crucial: as técnicas clássicas de séries temporais são ineficazes para dados de demanda intermitente.

A descoberta de que diferentes padrões de demanda requerem diferentes abordagens de modelagem tem implicações estratégicas. Em vez de buscar um modelo único para todo o portfólio, a análise aponta para a necessidade de uma estratégia de previsão segmentada. O valor de negócio reside na capacidade de alocar recursos de modelagem de forma inteligente: aplicar modelos simples como o SNAIVE para produtos sazonais; concentrar modelos complexos como o Auto-ARIMA em produtos estratégicos com forte tendência; e reconhecer os produtos de demanda intermitente, que devem ser gerenciados por outras políticas de estoque, como pontos de ressuprimento.

Os resultados corroboram parcialmente estudos como o de Simanungkalit (2024), que destacam a eficácia de modelos ARIMA para séries com tendência. No entanto, este trabalho avança ao propor uma estratégia segmentada baseada em um diagnóstico prévio do padrão da série. Além disso, evidencia a limitação dos modelos tradicionais em cenários de demanda intermitente, abrindo caminho para a exploração de modelos mais adequados para esse tipo de dado, como o método de Croston, ou a incorporação de variáveis exógenas.

Este trabalho demonstrou que a etapa de diagnóstico e análise exploratória dos dados é tão ou mais importante que a modelagem preditiva. A decomposição das séries temporais foi a ferramenta que revelou a heterogeneidade do portfólio, mostrando que ele se divide em segmentos com padrões de demanda distintos: dominados por tendência, por sazonalidade e intermitentes. Esta descoberta explica por que nenhum modelo único apresentou a melhor performance em todos os cenários. A principal contribuição do estudo não é a identificação de um algoritmo superior, mas a proposição de um processo analítico em duas fases — diagnosticar o padrão da série e depois selecionar o modelo adequado — como a abordagem mais robusta para a previsão de demanda no varejo. A implementação deste framework permite à empresa otimizar recursos, aplicando modelos simples onde são eficazes, complexos onde são necessários, e reconhecendo os casos em que a previsão tradicional é inadequada. Conclui-se que o objetivo foi atingido: demonstrou-se que a abordagem mais eficaz para a previsão de demanda na categoria de informática é uma estratégia segmentada, na qual a escolha do modelo preditivo é condicionada pelo padrão de demanda específico de cada família de produtos, superando a busca por um modelo único e universal.

Referências:
Favero, L. P.; Belfiore, P.; Silva, F. L.; Chan, B. L. 2014. Manual de Análise de Dados. 1ed. Elsevier, Rio de Janeiro, RJ, Brasil.
Fawcett, T.; Provost, F. 2013. Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking. O’Reilly Media, Sebastopol, CA, USA.
Hamilton, J. D. 1994. Time Series Analysis. 1ed. Princeton University Press, Princeton, NJ, USA.
Lazzeri, F. 2020. Machine Learning for Time Series Forecasting with Python. 1ed. Wiley, Hoboken, NJ, USA.
Makridakis, S.; Wheelwright, S. C.; Hyndman, R. J. 1998. Forecasting: Methods and Applications. 3ed. John Wiley & Sons, New York, NY, USA.
Mckinney, W. 2018. Python para Análise de Dados: tratamento de dados com Pandas, NumPy e IPython. 2ed. Novatec Editora, São Paulo, SP, Brasil.
Morettin, P. A.; Toloi, C. M. C. 2006. Análise de Séries Temporais. 2ed. Edgard Blücher, São Paulo, SP, Brasil.
Nielsen, A. 2020. Análise Prática de Séries Temporais: Predição com Estatística e Aprendizado de Máquina. 1ed. O’Reilly Media, Sebastopol, CA, USA.
Simanungkalit, E. 2024. Evaluation of ARIMA model performance in projecting future sales: case study on electronic products. Journal of Intelligent Decision Support System 7(4): 309-317.
Singer, C. D. P.; Motta, J. 2020. Análise de dados categorizados. 1ed. Edgard Blücher, São Paulo, SP, Brasil.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade