Troca de chutes: quais vão ser os resultados da rodada?


O Campeonato Brasileiro começa neste final de semana. Serão, como de hábito desde 2006, trinta e oito rodadas até dezembro com muitas surpresas, vitórias e derrotas inesperadas e só um campeão, mas no final ninguém poderá reclamar de uma coisa: que não foi avisado.
Neste Brasileiro, o Troca de Chutes (quadro que irá ao ar sempre na véspera de cada rodada no programa Trocas de Passes do Sportv) vai trazer as previsões feita pela grupo de pesquisa Futscience, que reúne pessoas de várias disciplinas apaixonadas por dados, ciência e por abordagens sobre como tomamos decisões. Além de, claro, interesse por futebol.
A ideia é revelar aspectos pouco conhecidos do futebol. Como entender o que faz um time ganhar – ou perder – e quais as variáveis mais importantes. Enfim, como o esporte mais popular do mundo se desenvolve dentro de campo. E para isso, vamos usar inteligência artificial, machine learning e big data.
Inteligência artificial é a área que desenvolve software para resolver problemas complexos, da mesma maneira como a inteligência humana costuma fazer. Machine learning ou aprendizado de máquina cria algoritmos (programas de computador) e ferramentas de estatística para reconhecer padrões em um conjunto muito grande de dados.
Já Big Data, como diz o nome, são dados. Dados, dados e mais dados, uma quantidade imensa. Mais algoritmos, usando computadores e hardware especializados, processam bilhões de registros em pouco tempo para buscar a informação desejada.
A maioria das gigantes globais de internet – Amazon, Facebook, Google, Netflix, etc – usa essas técnicas em conjunto para oferecer produtos e serviços mais atraentes. Todas contam com algoritmos capazes de prever aquilo que os seus clientes mais desejam no momento.
Um exemplo é o algoritmo de recomendações da Amazon e de outros sites de vendas que, com base no que você já comprou, indica produtos e serviços que também pode querer.
O futebol é candidato natural ao uso dessas técnicas devido ao volume cada vez maior de dados produzidos. Com o auxílio desses recursos, vamos utilizar machine learning para prever, com base nos scouts, dois aspectos de uma partida:
Resultado: vitória x empate x derrota
Placar: mandante x visitante
Scouts são os eventos durante um jogo de futebol. As famosas estatísticas: dribles, cruzamentos,chutes a gol, etc. Para as previsões, a Futscience usou 17 variáveis:
lançamentos
passes
finalizações
dribles
desarmes
faltas
impedimentos
posse de bola
cruzamentos
rebatidas
escanteios
viradas de jogo
defesa difícil
interceptações (tomadas de bola)
cartões amarelos
cartões vermelhos
assistências
Muitos desses dados estão todos os dias na imprensa esportiva. Qual a diferença? Com machine learning, ajuda a indicar como as equipes devem se comportar na próxima partida. Vamos imaginar, por exemplo, um confronto entre duas grandes torcidas Flamengo x Corinthians.
Os algoritmos registram cada scout dos dois times, mas também verificam como essas variáveis se relacionam umas com as outras variáveis, com o resultado e também com o placar do jogo. Com esses resultados, dá para imaginar o que Flamengo e Corinthians devem produzir na próxima rodada e são ajustadas as previsões.
A análise de dados já é bastante aplicada no beisebol (lembram do filme “Moneyball – O homem que mudou o jogo”?), no futebol americano e no basquete. Mas no futebol as coisas são mais complexas. É um esporte de poucos gols, o que torna os resultados mais imprevisíveis.
O que não quer dizer que não dê para tentar prever. Que comecem os jogos!
Clique e veja a explicação de Samy no Sportv.
Vamos as previsões para primeira rodada
Tabela primeira rodada do Troca de Chutes
G1/Samy Dana
Placares mais prováveis
Tabela primeira rodada do Troca de Chutes
G1/Samy Dana