Análise de solução preditiva de dados semafóricos com postagens de redes sociais
##plugins.themes.bootstrap3.article.main##
Resumo
Com o aumento constante da população urbana e do número de veículos nas ruas, a mobilidade urbana torna-se um tema cada vez mais presente nas discussões sobre o desenvolvimento sustentável das cidades. A falta de infraestrutura adequada, a ausência de transporte público eficiente e acessível, além do aumento da congestão e da poluição, são alguns dos principais obstáculos enfrentados pelas cidades (BRENT; BELAND, 2020). Tópico destacado no cenário nacional, segundo o índice de trânsito da TomTom Index de 2023, São Paulo e Recife foram classificadas como as duas piores cidades do Brasil em termos de tempo perdido em congestionamentos por quilometragem, posicionando-se entre as 50 cidades com os piores índices do mundo (TOMTOM, 2023). Nesse sentido, novas tecnologias buscam oferecer diferentes perspectivas sobre esses problemas. Projetos baseados em aprendizado de máquina (ML) estão ganhando destaque nesse campo, permitindo a coleta, análise e predição de dados para decisões mais informadas e eficazes (AHMED; DIAZ, 2022). Por exemplo, muitos sistemas de navegação inteligente agora utilizam algoritmos de aprendizado para sugerir rotas ótimas com base nas condições de tráfego em tempo real, ajustando trajetos para garantir que os motoristas cheguem aos seus destinos o mais rápido possível (CHOI et al., 2019). Além disso, os semáforos inteligentes desempenham um papel vital na gestão do tráfego, permitindo a coordenação em tempo real para a otimização das rotas e a redução dos congestionamentos (SHARMA, 2021). Esses sistemas são fundamentais para o desenvolvimento de um ecossistema viário dinâmico. No entanto, a implementação dessas tecnologias enfrenta desafios significativos, como a disponibilidade e a qualidade dos dados, a falta de integração dos sistemas de transporte, a regulamentação e a privacidade dos dados (WAGNER 2022). Ademais, de acordo com a "Agenda 2030 para o Desenvolvimento Sustentável", mais da metade da população mundial reside em áreas urbanas, e, até 2050, espera-se que esse valor evolua para dois terços. Aliado a isso, é essencial considerar a persistente desigualdade tecnológica ao implementar novas estratégias e modelos de desenvolvimento, especialmente em países em desenvolvimento, onde a exclusão digital e o acesso inadequado à eletricidade e infraestrutura de rede são desafios significativos (NATIONS, 2015). Em contrapartida, no que diz respeito ao avanço da internet móvel, o Brasil tem apresentado um acréscimo na utilização desses dispositivos por parte da população na faixa acima de 10 anos ou mais em 2023, corroborando com o aumento também da utilização de redes sociais (PODER, 2023). Com base nessas considerações, esta pesquisa visa desenvolver e avaliar uma solução preditiva para identificar e monitorar as condições de tráfego urbano utilizando postagens de mídias sociais como fonte de dados. A proposta baseia-se na análise de postagens coletadas na cidade de Recife, correlacionadas com informações de fluxo de tráfego obtidas dos radares da Autarquia de Trânsito e Transporte Urbano do Recife (CTTU). Os passos específicos incluíram uma revisão sistemática da literatura, a coleta de dados de fluxo de tráfego e postagens de mídias sociais, análise de sentimentos das postagens, avaliação da correlação entre as informações das postagens e os dados da CTTU, e o desenvolvimento e avaliação de modelos preditivos. A metodologia adotada envolveu a utilização de técnicas de clustering para classificar dados de tráfego sem rótulos, análise de sentimentos utilizando a biblioteca Pysentimiento (PEREZ, 2021), e a aplicação de modelos preditivos como Regressão Logística, Máquina de Vetores de Suporte (SVM), Random Forest (RF) e XGBoost. A análise inicial dos resultados indicou correlações significativas entre os sentimentos das postagens e as condições de tráfego, embora a força dessas associações fosse moderada. Técnicas adicionais de balanceamento de classes foram necessárias devido à natureza altamente desbalanceada dos dados de tráfego, com Random Undersampling proporcionando melhorias significativas nos resultados dos modelos. Os resultados preliminares destacaram o desempenho superior dos modelos XGBoost e Random Forest em termos de precisão, recall e F1-score. No entanto, desafios como as mudanças nas políticas de acesso à API do “X” e a necessidade de aprofundar a pesquisa em diferentes tipos de vias foram identificados. Para pesquisas futuras, planeja-se avaliar abordagens híbridas e técnicas de decomposição para identificar tendências e sazonalidades, além de explorar o problema como uma série temporal para fornecer insights mais abrangentes e precisos.
Downloads
Não há dados estatísticos.
##plugins.themes.bootstrap3.article.details##
Seção
Engenharia da Computação e Sistemas