Unir esporte e probabilidade ao analisar dados do campeonato de futebol Potiguar 2024 utilizando estatística. É isso que o Laboratório de Ciência de Dados (LaCid/UFRN) está fazendo por meio de uma parceria com a Band RN. O interesse da emissora surgiu após Thiago Valentim, professor de Matemática do Instituto Federal do Rio Grande do Norte (IFRN) e pesquisador convidado do LaCid, publicar, em suas redes sociais, análises do Campeonato Brasileiro (Brasileirão). Thiago verificou os seguintes dados: probabilidade de um chute ser gol (gols esperados); probabilidade de título e de rebaixamento.
As estatísticas do estadual são exibidas ao vivo durante o Jogo Aberto RN, programa que faz parte da grade da Band RN. Toda terça-feira, por aproximadamente 7 minutos, Thiago faz uma análise dos dados coletados após observar diferentes aspectos de um determinado jogo do Campeonato Potiguar.
Contudo, realizar essa análise do Campeonato Potiguar não é uma tarefa fácil. Thiago conta que precisa assistir um jogo específico acelerando a velocidade do vídeo. Ele também utiliza um site chamado FcPython para pegar as coordenadas do que está acontecendo durante a partida. Após assistir ao jogo e colher as coordenadas, o professor utiliza um software para realizar as modelagens e selecionar quais aspectos observados ele vai analisar. “Eu observo os passes nos terços ofensivos, o mapa de calor, a probabilidade de um chute ser gol, passes errados, passes certos, lançamentos, interceptações e roubadas de bola”, conta o professor.
Existem empresas focadas em dados esportivos que disponibilizam essas informações, como é o caso da Opta, uma empresa britânica que monitora principalmente as grandes ligas europeias. É utilizada uma técnica chamada raspagem (ou web scraping) para analisar os dados. Como Thiago também analisa jogos de fora do Brasil, ele conta que, utilizando essa técnica, fica muito mais fácil realizar a tarefa. Porém, no Campeonato Potiguar não é possível utilizar a raspagem, pois a Opta não monitora os jogos do campeonato estadual do RN. Isso acaba dificultando ainda mais o trabalho de Thiago, que, praticamente, precisa criar do zero a base de dados a ser analisada.
Para Thiago, unir estatística e futebol ajuda a popularizar essa temática e alcançar pessoas que não têm tanta familiaridade com essa ciência de dados. “Em uma publicação que fiz no Linkedln, justamente falando sobre esses dados, teve um comentário de uma pessoa lembrando do filme Moneyball. Na obra cinematográfica, o protagonista Billy Beane, interpretado por Brad Pitt, utilizou a estatística para montar um time de beisebol com atletas relativamente desacreditados, mas que ao final conseguiram um excelente resultado na temporada”.
Considerando as análises do Campeonato Potiguar, Thiago comenta sobre o desejo que seja desenvolvida uma ferramenta para automatizar essa coleta de dados, o que não é uma tarefa fácil. Em sua opinião, dessa maneira é possível trazer mais expertise para o grupo, podendo realizar mais análises.
Mais sobre o LaCid
O principal objetivo do laboratório é desenvolver pesquisas inovadoras e aplicadas em Ciência de Dados, explorando técnicas estatísticas, aprendizado de máquina e análise de dados que possibilitem a resolução de problemas complexos. O LaCid foi inaugurado em 29 de maio de 2023, data na qual é comemorado o Dia do Estatístico no Brasil.
De acordo com Marcelo Bourguignon, professor do Departamento de Estatística da UFRN (Dest) e coordenador do LaCid, em 2024 o laboratório pretende permanecer contribuindo com o avanço científico na área da Ciência de Dados. “Iremos aplicar os conhecimentos adquiridos para resolver problemas reais e gerar impacto positivo na sociedade, tentando ajudar aos órgãos governamentais na tomada de decisões. Além disso, pretendemos continuar prestando serviços à comunidade por meio de consultoria acadêmica, empresarial, pública ou privada”, comenta o professor.
Sobre a iniciativa de analisar dados do Campeonato Potiguar, Marcelo fala sobre como o futebol é um esporte rico em informações, além de ser uma paixão nacional. “São muitas estatísticas disponíveis para analisar, como o desempenho dos jogadores e das equipes e os esquemas táticos. Ao analisar dados relacionados ao futebol, podemos despertar o interesse da população em entender mais sobre ciência de dados e estatísticas em geral”, completa o coordenador do LaCid.
Os envolvidos
Marcelo Bourguignon possui graduação em Estatística pela Universidade Federal do Espírito Santo (2008); mestrado em Estatística pela Universidade Federal de Pernambuco (2011); e doutorado em Estatística pela Universidade Federal de Pernambuco (2014). Já Thiago Valentim, graduou-se em Matemática (Licenciatura) pela UFRN (2007); em Estatística (Bacharelado), também pela UFRN (2021); e em Educação Física (Licenciatura) pela UniFatecie/PR (2023). Possui mestrado em Matemática em Rede Nacional (PROFMAT) pela Universidade Federal da Paraíba (2013) e é Doutor em Ciências Climáticas pela UFRN (2020).