
02 de fevereiro de 2026
Ciência de dados para previsão de venda de pneus no mercado brasileiro
Dalton Gonçalves Silva dos Reis; Elisa Morandé Sales
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
O objetivo deste trabalho foi desenvolver e validar um modelo preditivo para a venda de pneus de passeio no Brasil, segmentado entre o mercado de montadoras (OEM) e o de reposição, visando fornecer uma ferramenta estratégica para o planejamento de produção e gestão de estoques. A pesquisa buscou identificar as variáveis mais influentes em cada segmento e aplicar modelos de séries temporais para gerar previsões assertivas, otimizando recursos e reduzindo custos. A necessidade de tal modelo emerge da complexidade da cadeia produtiva de pneumáticos; uma previsão de demanda imprecisa pode levar a desequilíbrios como custos de armazenagem elevados por excesso de insumos ou rupturas na produção por subestimação da demanda.
A relevância do estudo ancora-se na magnitude do mercado brasileiro de pneus, que movimenta mais de 50 milhões de unidades anualmente e é influenciado por fatores como o desempenho da indústria automobilística e indicadores macroeconômicos. A ciência de dados é fundamental para transformar dados brutos em conhecimento acionável. Conforme Grus (2019), a análise de dados permite extrair padrões ocultos. Este processo de transformar dados em informação e conhecimento constitui o que Fávero e Belfiore (2024) descrevem como a hierarquia do conhecimento, um pilar para a tomada de decisão estratégica e para a consolidação de uma vantagem competitiva.
A abordagem foca em modelos estatísticos robustos e interpretáveis como SARIMA e SARIMAX. A literatura, como o estudo de Taylor (2015) que utilizou redes neurais artificiais (ANN) e alcançou um coeficiente de determinação (R-squared) de 66%, serve como referência. Este estudo busca avançar ao testar modelos alternativos e incorporar variáveis exógenas do contexto brasileiro para obter um desempenho preditivo superior, permitindo que as empresas da cadeia de suprimentos ajustem seus planos de produção e otimizem a logística.
A aplicação de técnicas como análise de séries temporais representa uma evolução na gestão, permitindo uma postura proativa em vez de reativa. VanderPlas (2016) destaca que a ciência de dados capacita profissionais a resolver problemas concretos, como a incerteza na demanda de pneus. Ao fornecer um modelo preditivo confiável, o estudo oferece um subsídio prático para decisões mais informadas, alinhando oferta e demanda. A pesquisa se justifica pela sua aplicabilidade direta na indústria, com a expectativa de que os modelos desenvolvidos gerem impacto mensurável na eficiência operacional e reforcem o valor da análise de dados como ativo estratégico para a competitividade industrial.
A metodologia é uma pesquisa quantitativa e aplicada, fundamentada na análise de séries temporais com dados públicos e estruturados. A variável alvo, venda de pneus de passeio, foi obtida de relatórios mensais da Associação Nacional da Indústria de Pneumáticos (ANIP) de janeiro de 2018 a dezembro de 2024, totalizando 84 observações. Este período foi escolhido para capturar diferentes ciclos econômicos, incluindo a pandemia de COVID-19. Para enriquecer os modelos, foram incorporadas variáveis exógenas: produção e venda de veículos (ANFAVEA), indicadores setoriais de produtos de borracha (CNI), importação de pneus (ComexStat), e indicadores de conjuntura como inadimplência do consumidor (Serasa). Conforme Joseph e Tackes (2024), a incorporação de variáveis correlacionadas constrói modelos mais robustos. As séries temporais utilizadas são de natureza estocástica, com valores futuros parcialmente aleatórios, mas descritíveis por padrões.
O processamento e a modelagem foram realizados em Python, utilizando bibliotecas como Pandas e Numpy para manipulação de dados, e Matplotlib e Seaborn para visualização. A modelagem estatística foi implementada com a biblioteca statsmodels. A função seasonaldecompose foi usada para decompor as séries em tendência, sazonalidade e resíduo (Oliveira et al., 2024). A estacionariedade, pré-requisito para modelos ARIMA, foi verificada com o teste de Dickey-Fuller Aumentado (adfuller), que rejeita a hipótese nula de não estacionariedade para p-valores inferiores a 0,05. Para a seleção dos parâmetros (p, d, q) e (P, D, Q), utilizou-se a função autoarima do pacote pmdarima, que seleciona a configuração que minimiza o Critério de Informação de Akaike (AIC), uma métrica que equilibra ajuste e parcimônia (Hyndman e Athanasopoulos, 2021). Os modelos centrais foram o SARIMA e o SARIMAX, que estende o SARIMA ao incluir variáveis exógenas. A performance foi avaliada pelo Erro Percentual Absoluto Médio (MAPE), calculado com a função do pacote sklearn. A série de 84 observações foi dividida em um conjunto de treino com 72 observações (janeiro de 2018 a dezembro de 2023) e um de teste com 12 observações (janeiro a dezembro de 2024).
A análise do segmento de vendas para montadoras (OEM) revelou uma queda abrupta em 2020 devido à pandemia e um forte componente de sazonalidade anual. O teste de Dickey-Fuller Aumentado confirmou a estacionariedade da série (p-valor = 0,000896), não necessitando de diferenciação (d=0). A ferramenta auto_arima sugeriu um modelo SARIMA(2, 0, 0)(0, 1, 1), que, após treino e validação, resultou em um MAPE de 8,74%, equivalente a uma assertividade de 91,26%.
Para aprimorar o modelo, foi investigada a correlação com a produção de veículos de passeio, que se mostrou forte e positiva (0,9). A inclusão desta variável exógena no modelo, transformando-o em um SARIMAX, manteve a mesma ordem de parâmetros ARIMA(2, 0, 0)(0, 1, 1). Ao treinar e validar o novo modelo, o MAPE obtido foi de 7,92%, melhorando a assertividade para 92,08%. Essa redução no erro confirma o valor preditivo da variável. A comparação das previsões para os primeiros quatro meses de 2025 com dados reais mostrou a superioridade do SARIMAX, com uma diferença acumulada de 210.139 unidades contra 218.523 do modelo SARIMA.
A análise foi replicada para o mercado de reposição. A série temporal também se mostrou estacionária. O auto_arima identificou o modelo SARIMA(1, 0, 0)(1, 1, 1) como o mais adequado, que após treinamento e validação apresentou um MAPE de 12,38% (assertividade de 87,62%). O erro superior ao do mercado de montadoras é esperado, pois o mercado de reposição é influenciado por uma gama maior de fatores aleatórios ligados à decisão do consumidor final, como aponta Morettin (2018).
Para o modelo SARIMAX do mercado de reposição, a análise de correlação revelou uma correlação negativa moderada (-0,5) entre as vendas de pneus e o índice de inadimplência da Serasa. A lógica é que um aumento no endividamento leva ao adiamento de despesas como a troca de pneus. Incorporando o índice de inadimplência como variável exógena, o modelo SARIMAX, com a mesma ordem ARIMA(1, 0, 0)(1, 1, 1), foi treinado e validado. O resultado foi uma melhora significativa na performance, com o MAPE caindo para 9,71% (assertividade de 90,29%). A previsão para os primeiros quatro meses de 2025 com este modelo também se mostrou mais precisa, com uma diferença acumulada de 475.660 unidades em relação ao real, contra 687.898 do modelo SARIMA.
Os resultados para o mercado de montadoras indicaram que o modelo com duas variáveis (Venda Pneus, Prod. Veículos novos) apresentou o menor AIC e o menor MAPE (7,92%), sendo a opção mais eficiente. A adição de uma terceira variável (Índice Indústria IBGE) não trouxe melhorias, sugerindo redundância da informação. Para o mercado de reposição, o modelo com duas variáveis (Venda Pneus, Índice Inadimplência) obteve o menor MAPE (9,71%), confirmando-se como a melhor escolha. Embora seu AIC tenha sido ligeiramente superior ao do modelo univariado, a melhora substancial no MAPE justificou a escolha do SARIMAX. A tentativa de adicionar uma terceira variável (Atividade do Comércio de Veículos) resultou em uma piora do MAPE para 14,33%, validando que nem toda variável correlacionada contribui positivamente para a predição, um princípio na seleção de features discutido por Nielsen (2021).
Os resultados demonstram que a aplicação do modelo SARIMAX é altamente eficaz para a previsão de venda de pneus no Brasil. Para o mercado de montadoras, a inclusão da produção de veículos foi crucial para alcançar uma assertividade superior a 92%. Para o mercado de reposição, a incorporação do índice de inadimplência do consumidor permitiu elevar a assertividade para mais de 90%. A discussão dos resultados reforça a distinção entre os dois mercados. O segmento de montadoras opera de forma mais determinística, com uma relação direta com a produção de veículos. Em contrapartida, o mercado de reposição é mais estocástico, sujeito às flutuações da confiança do consumidor e da saúde econômica. A pesquisa valida a hipótese de que modelos customizados para cada segmento, utilizando variáveis exógenas apropriadas, superam os modelos univariados. A assertividade alcançada, em ambos os casos acima de 90%, representa um avanço em relação a benchmarks anteriores, como o estudo de Taylor (2015), e oferece uma ferramenta de grande valor prático.
O estudo demonstrou com sucesso a viabilidade e a eficácia da aplicação de modelos de séries temporais SARIMA e SARIMAX para a previsão de vendas de pneus de passeio no mercado brasileiro. Os modelos desenvolvidos alcançaram índices de assertividade superiores a 90% para ambos os segmentos analisados, validando-os como ferramentas robustas para o suporte ao planejamento de produção e gestão de estoques. A pesquisa identificou que a incorporação de variáveis exógenas específicas para cada mercado, como a produção de veículos para o segmento de montadoras e o índice de inadimplência para o de reposição, foi fundamental para aprimorar a acurácia das previsões. As implicações práticas destes resultados são diretas, oferecendo às indústrias um método quantitativo para antecipar a demanda e otimizar a alocação de recursos.
Apesar dos resultados positivos, o estudo possui limitações. A principal reside no horizonte de previsão; os modelos são mais indicados para previsões de curto prazo, idealmente de três a quatro meses, pois a incerteza das variáveis aumenta em horizontes mais longos. Recomenda-se uma aplicação contínua, com reajustes mensais. Como sugestão para trabalhos futuros, a exploração de modelos de machine learning e redes neurais como LSTM ou GRU poderia trazer melhorias. Além disso, a expansão da análise para incluir outras categorias de pneus, como os de caminhões e ônibus, representaria um próximo passo lógico. Conclui-se que o objetivo foi atingido: demonstrou-se que é possível criar modelos preditivos de alta performance para a venda de pneus no Brasil utilizando dados públicos e técnicas estatísticas consolidadas, gerando conhecimento aplicável para a tomada de decisão estratégica no setor industrial.
Referências:
Associação de Fabricantes de Veículos Automotores [ANFAVEA]. 2025. Relatórios de vendas de automóveis. Disponível em: https://anfavea. com. br/site/edicoes-em-excel/ . Acesso em: 01 Jul. 2025.
Associação Nacional da Indústria de Pneumáticos [ANIP]. 2025. Relatórios de vendas de pneus. Disponível em: https://www. anip. org. br/anip-em-numeros/publicacoes/ . Acesso em: 01 Jul. 2025.
Comex Stat. 2025. Estatísticas de importação de pneus, borracha natural e tela de pneus. Disponível em: https://www. gov. br/mdic/pt-br/assuntos/comercio-exterior/estatisticas/base-de-dados-bruta. Acesso em: 01 Jul. 2025.
Confederação Nacional da Indústria [CNI]. 2025. Indicadores. Disponível em: https://indicadores. sistemaindustria. com. br/indicadores/externo/estatisticaAcessoSistemaExterno. faces . Acesso em: 01 Jul. 2025.
Fávero, Luis Paulo; Belfiore, Patrícia. 2024. Manual de Análise de Dados: estatística e machine learning com Excel®, SPSS®, R® e Python®. 2ed. LTC, Rio de Janeiro, Brasil.
Grus, Joel. 2019. Data Science from Scratch. 2ed. O’Reilly, Sebastopol, EUA.
Hyndman, R. J., Athanasopoulos, G. 2021. Forecasting: principles and practice. 3rd edition. OTexts, Melbourn, Australia. Disponível em: < https://otexts. com/fpppg/arima-estima%C3%A7%C3%A3o. html >. Acesso em: 01 Jul 2025.
Joseph, Manu; Tackes, Jeffrey. 2024. Modern Time Series Forecasting with Python. 2ed. Packt, Birmingham, Reino Unido.
Morettin, Pedro A. 2018. Análise de Séries Temporais. 1ed. Editora Blusher, São Paulo, Brasil.
Nielsen, Aileen. 2021. Análise Prática de Séries Temporais: predição com estatística e aprendizado de máquina. 1ed. Alta Books, Rio de Janeiro, Brasil.
Oliveira et al. 2024. Introdução às séries temporais: uma abordagem prática em Python. 1ed. Editora Mackenzie, São Paulo, Brasil.
Serasa. 2025. Indicadores de inadimplência. Disponível em: <https://www. serasaexperian. com. br/conteudos/indicadores-economicos/ >. Acesso em: 05 Jul 2025.
Taylor, Brent S. 2015. Utilizing ANNs to Improve the Forecast for Tire Demand. In partial fulfillment of the requirements for the degree Master of Science. Russ College of Engineering and Technology of Ohio University, Ohio University, Ohio, USA.
VanderPlas, Jake. 2016. Python Data Science Handbook. Essential Tools for Working with Data. 1 ed. O’Reilly, Sebastopol, EUA.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:





































