quinta-feira, 3 de abril de 2008

Data mining: ultimamente só dá Obama

via Certamente! de Paulo Querido em 02/04/08

A web é uma mina de informação social e a sua mineração (data mining) é fundamental. Até para… calcular resultados eleitorais. Ultimamente só dá Obama nas notícias — o que pode ser visto como uma prova do profissionalismo dos jornalistas enquanto seguidores das tendências das massas.
Duas ferramentas diferentes explicam-nos num simples olhar esta tendência para Obama, quando se pressupunha que Hilary Clinton ganharia mais ou menos facilmente.
Uma saiu dos laboratórios da Google e é poderosa. Não apenas porque produz um gráfico com este (clicar para ver maior):

clinton-obama
Mas também porque nos fornece um quadro dos momentos-chave que ajudaram a mudar as linhas de Obama e Clinton (link). Com links para as notícias dos dias em que se verificaram as alterações na atenção das massas, podemos perceber melhor o que faz mudar a opinião pública.
A ferramenta usa como matéria-prima, autênticas pepitas, os termos mais procurados pelos milhões de utilizadores do Google.
Um pouco diferente na aproximação à mina é o Icerocket: faz a contabilidade das citações descobertas nos milhões de blogues e publicações em rede, depura-as e produz gráficos como o de baixo (clicar para ver maior):

obama-clinton-i-peq.png

Quis afinar um pouco o gráfico do Google e por isso reduzi o tempo deste gráfico ao último mês, para ver até que ponto se confirma a tendência Obama (link)
A minha conclusão destas duas leituras é a de que dificilmente a vitória lhe escapará na convenção democrática. Olhando o gráfico, poder-se-ia contra-argumentar que da mesma forma que Obama conseguiu inverter a tendência para Clinton, esta poderia conseguir agora o mesmo. Aquela aproximação mesmo no extremo direito do gráfico sugerirá isso… Não creio: interpreto a aproximação como um sinal do esforço da candidata, mas se olharmos a um período de tempo maior, fica ali um pequeno pico apenas.
Por outro lado, há que situar o gráfico no contexto. não basta ter a possilibidade técnica: é preciso ter a vontade, a força — e o tempo. Entrámos na recta final da escolha do candidato presidencial dos democratas americanos, Clinton não dispõe agora do tempo que Obama teve ao longo do último ano e picos.
A mineração de dados extrai uma verdade da corrida: o trajecto de Obama é ascendente e o de Clinton é descendente. Só um acontecimento extraordinário provocará uma mudança nas linhas destes dois gráficos.

Sem comentários:

Related Posts with Thumbnails