Abstract

O presente trabalho visa apresentar uma metodologia realizada em duas etapas, envolvendo aplicação de modelos não paramétricos (Árvore de Decisão - AD) e paramétricos (Regressão Linear Múltipla-RLM) para previsão de escolha modal. A aplicação da AD permite encontrar relações entre variáveis socioeconômicas e escolha modal, bem como discretizar as variáveis numéricas e categóricas para construção dos modelos lineares na etapa posterior. Os dados utilizados para o desenvolvimento deste trabalho são provenientes da entrevista domiciliar da Pesquisa Origem-Destino de 2007/2008, realizada na cidade de São Carlos (SP). O modelo não paramétrico apresentou um total de acertos em torno de 70%, com alta associação entre valores categóricos estimados e observados do modo de transporte. Após transformação de todas as variáveis independentes em binárias através da técnica de AD, foram obtidos modelos lineares pelo método stepwise com bom poder preditivo para as três categorias de modo de transporte consideradas. Além disso, a validação dos modelos lineares com 30% da amostra restante apresentou baixos valores de erro médio e variância dos resíduos. Finalmente, o método proposto pode ser considerado razoável, sendo uma boa alternativa às abordagens tradicionais.

Highlights

  • Ter Carteira Nacional de Habilitação (CNH), por exemplo, influencia positivamente o uso do modo de transporte particular motorizado (Nó 2, 73,3% utiliza automóvel ou motocicleta), assim como grau de instrução superior (Segundo grau completo ou superior – Nó 10, 82,9% utiliza automóvel ou motocicleta)

  • Indivíduos que não possuem CNH e são do sexo feminino são mais propensos ao uso do modo de transporte não motorizado ou Público (Nó 6)

  • Considerando os resultados dos modelos lineares obtidos com as variáveis originais, observou-se um valor de R2 pequeno para previsão dos três modos de transportes

Read more

Summary

Técnicas abordadas

As técnicas abordadas neste trabalho são de Análise Multivariada (AM) de dados. AM pode ser definida como um conjunto de técnicas estatísticas utilizadas com o objetivo de explicar e prever o grau de relações entre diversas variáveis independentes (inclusive entre si) e a variável dependente. A estimação da escolha modal será realizada através de aplicação conjunta e sequencial de Árvore de Decisão e Regressão Linear Múltipla, técnicas descritas nas subseções subsequentes. O algoritmo da árvore torna os subconjuntos resultantes cada vez mais homogêneos em relação à variável resposta, mediante sucessivas divisões binárias no conjunto de dados. A aplicação da AD neste trabalho tem duas funções: (1) Extrair padrões do banco de dados, formados por grupo de indivíduos com determinadas características (valores de variáveis independentes) e probabilidade de escolha do modo de transporte (variável dependente); (2) Auxiliar no aprimoramento de modelos lineares a partir da discretização das variáveis independentes. Cada classe foi associada a uma variável dummy e os valores para escolha das classes das variáveis dummy foram obtidos com a aplicação da AD, descrita mais detalhadamente na Seção 3 deste trabalho. Por problemas de incoerência nos dados, totalizando uma amostra final composta por 1.216 indivíduos

Aplicação da AD: modelo não paramétrico
Aplicação da RLM: modelo paramétrico
RLM: variáveis originais
Findings
RLM: variáveis discretizadas
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call