Pode ser possível estimar o tamanho de uma multidão baseado em dados
geográficos de celulares e do Twitter, de acordo com um novo estudo.
Pesquisadores
da Warwick University, na Inglaterra, usaram a geolocalização de
celulares e de mensagens no Twitter durante um período de dois meses em
Milão, na Itália.
Em dois locais com números de visitantes
conhecidos - um estádio de futebol e um aeroporto - a atividade nas
redes sociais e nos celulares aumentou e diminuiu de maneira semelhante
ao fluxo de pessoas.
A equipe britânica disse que, utilizando esta técnica, pode fazer medições em eventos como protestos.
Outros
pesquisadores enfatizaram o fato de que há limitações e viéses neste
tipo de dados - por exemplo, somente uma parte da população usa
smartphones e Twitter e nem todas as áreas em um espaço estão bem
servidos de torres telefônicas.
Mas os autores do estudo dizem
que os resultados foram "um excelente ponto de partida" para mais
estimativas do tipo - com mais precisão - no futuro.
"Estes números são exemplos de calibração nos quais podemos nos basear", disse o coautor do estudo, Tobias Preis.
"Obviamente
seria melhor termos exemplos em outros países, outros ambientes, outros
momentos. O comportamento humano não é uniforme em todo o mundo, mas
está é uma base muito boa para conseguir estimativas iniciais."
O
estudo, divulgado na publicação científica Royal
Society Open Science, é parte de um campo de pesquisa em expansão,
explorando o que a atividade online pode revelar sobre o comportamento
humano e outros fenômenos reais.
Federico Botta, o estudante de
PhD que liderou a análise, afirmou que a metodologia baseada em
celulares tem vantagens importantes sobre outros métodos para estimar o
tamanho de multidões - que costumam se basear em observações no local ou
em imagens.
"Este método é muto rápido e não depende do
julgamento humano. Ele só depende dos dados que vêm dos telefones
celulares ou da atividade no Twitter", disse à BBC.
Margem de erro
Com
dois meses de dados de celulares fornecidos pela Telecom Italia, Botta e
seus colegas se concentraram no aeroporto de Linate e no estádio de
futebol San Siro, em Milão
Eles compararam o número de pessoas
que se sabia estarem naqueles locais a cada momento - baseado em
horários de voos e na venda de ingressos para os jogos de futebol - com
três tipos de atividade em telefones celulares: o número de chamadas
feitas e de mensagens de texto enviadas, a quantidade de internet
utilizada e o volume de tuítes feitos.
"O que vimos é que estas
atividades realmente tinham um comportamento muito semelhante ao número
de pessoas no local", afirma Botta.
Isso pode não parecer tão
surpreendente, mas, especialmente no estádio de futebol, os padrões
observados pela equipe eram tão confiáveis que eles conseguiam até fazer
previsões.
Houve dez jogos de futebol no período em que o
experimento foi feito. Com base nos dados de nove jogos, foi possível
estimar quantas pessoas estariam no décimo jogo usando apenas os dados
dos celulares.
"Nossa porcentagem absoluta média de erro é cerca
de 13%. Isso significa que nossas estimativas e o número real de pessoas
têm uma diferença entre si, em valores absolutos, de cerca de 13%", diz
Botta.
De acordo com os pesquisadores, esta margem de erro é boa
em comparação com as técnicas tradicionais baseadas em imagens e no
julgamento humano.
Eles deram o exemplo do manifestação em
Washington, capital americana, conhecida como "Million Man March"
(Passeata do milhão, em tradução livre) em 1995, em que mesmo as
análises mais criteriosas conseguiram produzir estimativas com 20% de
erro - depois que medições iniciais variaram entre 400 mil e dois
milhões de pessoas.
Segundo Ed Manley, do Centro para Análise
Espacial Avançada da University College London, a técnica tem potencial e
as pessoas devem sentir-se "otimistas, mas cautelosas" em relação ao
uso de dados de celulares nestas estimativas.
"Temos essas bases
de dados enormes e há muito o que pode ser feito com elas... Mas
precisamos ter cuidado com o quanto vamos exigir dos dados", afirmou.
Ele também chama a atenção para o fato de que tais informações não refletem igualitariamente uma população.
"Há
viéses importantes aqui. Quem exatamente estamos medindo com essas
bases de dados?", o Twitter, por exemplo, diz Manley, tem uma base de
usuários relativamente jovem e de classe alta.
Além destas
dificuldades, há o fato de que é preciso escolher com cuidado as
atividades que serão medidas, porque as pessoas usam seus telefones de
maneira diferente em diferentes lugares - mais chamadas no aeroporto e
mais tuítes no futebol, por exemplo.
Outra ressalva importante é o
fato de que toda a metodologia de análise defendida por Botta depende
do sinal de telefone e internet - que varia muito de lugar para lugar,
quando está disponível.
"Se estamos nos baseando nesses dados
para saber onde as pessoas estão, o que acontece quando temos um
problema com a maneira como os dados são coletados?", indaga Manley.
Fonte: Uol