Big Data: medindo e prevendo o comportamento humano

Em 20 de abril foi lançado o curso online massivo e aberto (MOOC: massive online open course) “Big Data: measuring and predicting human behaviour“. Possui a duração de 9 semanas e pode ser iniciado em qualquer momento até a última semana. Ou seja: corra pra fazer, que dá tempo!

Na primeira semana do curso, os professores se dedicam a apresentar o que é big data, especialmente em torno de um projeto desenvolvido pelos próprios professores do curso fazem parte. Suzy Moat e Tobias Preis falam sobre o Future Orientation Index, índice criado para identificar o quanto a população de determinado país se preocupa/planeja/pensa sobre o futuro. O mais interessante deste índice é que ele utiliza basicamente dados do Google Trends. Para cada país analisado (todos com 5mi ou mais de usuários de internet), os pesquisadores extraíram o volume de buscas pelos anos anteriores e anos futuros. O índice calcula se a população está mais voltada ao futuro ou ao passado em suas buscas. O gráfico da direita abaixo mostra considerável correlação entre o índice e o GDP per capita (Gross Domestic Product per capita, ou PIB per capita):

future orientation index

Tela de “Quantifying the Advantage of Looking Forward”, por Preis, Moat, Stanley e Bishop

Na segunda semana, o tema é “Medindo e Prevendo Comportamentos com Big Data”. São vários vídeos realizados pelos dois professores e por outros pesquisadores convidados mostrando seus projtos sobre mecanismos de busca, tecnologias vestíveis e cidades inteligentes. Merece destaque um projeto que me surpreendeu. Paul Lukowics, da DFKI/TU Kaiserslautern, mostra o “Magic Collar”, que tem o objetivo de conseguir medir classes de alimentos sendo engolidos através do som realizado na deglutição.
the magic collar

Nesta semana começam os exercícios práticos, que ensinarão coletas e processamentos simples de dados com o R e R-Studio. Da segunda à sexta semana, são apresentados passos simples de como redigir script para coletar dados históricos de visualização de páginas na Wikipedia. Tudo é realizado extraindo dados de forma organizada do stats.grok.se. Já conhecia e usava o website, mas a criação do script no R expande e aprofunda as possibilidades.

stats wikipedia

O mercado financeiro é o tema da terceira semana. Os professores e entrevistados da semana mostram exemplos de estudos que relacionam atividades online de busca de informação, como visitas à Wikipedia e busca no Google, como correlacionados a atividades no mercado financeiro. O gráfico abaixo, tela de aula do Tobias Preis, mostra estudo que compara a busca pelos termos Lehman Brothers e Financial Crisis com o índice S&P 500 em torno da crise de 2008.

big data - university of warwick - mercado financeiro

A quarta semana traz estudos sobre big data, crime e conflito. São aplicações em redução e prevenção de criminalidade, sobretudo a partir da compreensão das dinâmicas de ocorrências nas cidades. Um bom projeto é realizado por Toby Davies, da University College London, que utilizou métricas como intermediaridade de rede para analisar a disseminação de ocorrências.

intermediaridade - big data - crime nas cidades

Mas de particular interesse para os brasileiros é o estudo liderado por Neil Johnson, do Complex Systems Initiative at the University of Miami (oh, a ironia). Johnson procurou descobrir uma fonte de dados que pudesse ajudar a prever o tamanho dos protestos realizados em 2013 no Brasil. O pesquisador explica as dinâmicas encontradas e como se surpreendeu que este dado foi a atividade e crescimento em páginas do Facebook dedicadas à política e protestos.

big data - neil johnson

Durante todo o curso, há atividades específicas de comentários e discussão. A cada semana, os professores e a assistente, Chanuki Seresinhe, publicam um novo vídeo “round-up” para resumir a semana anterior e comentar dúvidas e colaborações dos alunos nos campos de discussões e comentários. Mas a quinta semana levará tudo isto além, incluindo uma seção de Twitter Chat em torno da hashtag #FLBigData. Já há bastante debate e colaborações, como você pode ver no widget abaixo, mas no dia 21 de maio, entre 1-2PM Uk Time (entre 10h-11h da manhã aqui na faixa de horário de Brasília), Suzy e Tobias participarão ao vivo da conversa.


Uso do big data para saúde é o tema da interessante sexta semana. O caso mais curioso é o da história da predição efetiva de tendências de gripe através de buscas no Google e a posterior falha do mecanismo em 2013, causada por mudanças no comportamento dos indivíduos.

Detecting flu infections with Google searchesfacebook likes como preditores de atributos

A sétima semana vai tratar de felicidade! Há projetos baseados tanto em quantified self através de smartphones quanto do que as pessoas falam em Facebook e Twitter, através da identificação de marcadores linguísticos sobre afetividade, positividade e negatividade. Os estudos experimentais realizados pelo Facebook sobre difusão de estados emocionais e sobre predição de atributos através de likes (já escrevi sobre, aqui no blog), também são apresentados.

Nesta semana começa também a série de exercícios no R de redação de scripts para coletar e cruzar os mesmos dados que serviram de base para a criação do Future Orientation Index pelos professores do curso. Os dados de busca, obtidos através do Google Trends, serão cruzados com os dados do CIA World Factbook  nos exercícios.

Tratando de mobilidade e desastres, as aulas da oitava semana mostram como smartphones, Flickr e mapas colaborativos tem ajudado pessoas em situações de calamidades naturais. A tela abaixo mostra a correlação entre número de fotografias com hashtags selecionadas referentes ao furacão Sandy e a medição de uma variável ambiental: pressão atmosférica. O número de fotos esteve correlacionado à força do furacão.

Furacão Sandy - Flickr - Pressão Atmosférica - Big Data

Por fim, a nona semana é dedicada especialmente à reflexão e discussão do que foi aprendido. Um dos vídeos da última semana trata de como contar histórias com dados. Apresentado por Adrian Letchford, também da Warwick Business School, discorre sobre o processo de descoberta enquanto conta uma interessante história pessoal. Como exemplo, traz visualizações como a exibida abaixo, que comparou termos de busca em estados dos EUA com maior e menor taxa de natalidade.

Telling stories with data

Imagino que alguns destes poucos exemplos já devem ter despertado o interesse, não? Então cadastre-se em https://www.futurelearn.com/courses/big-data e participe!

Onde estão as mulheres nos eventos de comunicação digital e mídias sociais?

priscila marcenes, anna muniz e andrea hiranakaNa plateia. Segundo levantamento em realização com eventos (de mercado) de comunicação digital, mídias sociais e temas similares em 2014, apenas 19,35% das vozes no palco representaram mulheres.

Os dados são mais assustadores quando comparamos com a fatia das mulheres no mercado. Em alguns segmentos, como em mídias sociais, os dados da pesquisa do trampos mostram que representam 56,5% da força de trabalho, dado semelhante ao de minha pesquisa com profissionais de social analytics.

A tabela abaixo mostra a discrepância de representatividade. Em vermelho estão os eventos com menos de 30% de mulheres no palco. Em laranja, os relativamente equilibrados, com 30 a 70% de mulheres. E em verde os com mais de 70% de mulheres. Enquanto o vermelho domina, vocês não poderão conferir qual tonalidade de verde selecionei: mais de 80% dos eventos estão totalmente dominados por palestrantes homens, mas NENHUM teve mais de 70% de mulheres.

E quais são os motivos disto? Machismo e desigualdade nas relações de trabalho estão claros, mas aqui vai além disto ainda. São dados mais graves ainda quando falamos de um setor da comunicação relativamente novo, no qual diversos players importantes surgiram apenas nos últimos anos e poderíamos esperar que este tipo de desigualdade fosse menor. Ou seja: além da média salarial menor, as mulheres têm muito menos poder de voz. Podem até trabalhar, mas devem ganhar menos e ainda ficar caladas?

Como combater isto? Do meu ponto de vista, enquanto eventual curador de eventos, é abrir a caixa-preta e estar consciente desta discrepância, para combatê-la. Enquanto frequentador de eventos, não ir a eventos misóginos. Não será que o boicote por espectadores conscientes pode ajudar a mudar esta situação? Todos podemos acabar com o silêncio sobre o tema e outras distorções correlatas. E as profissionais da área podem realizar ações variadas para tentar combater tantas forças e pressões que tentam reafirmar estes privilégios de forma explícita ou disfaçada.

Qual a sua opinião sobre estes dados? Se puder colaborar com outros eventos para aumentarmos o mapeamento, só deixar links nos comentários.

Social Analytics Summit 2014: cobertura e apresentações

E nos últimos 7 e 8 de novembro aconteceu o Social Analytics Summit 2014. Foi uma experiência muito bacana realizar a curadoria de mais uma edição do principal evento da área no Brasil. Para quem não foi, o Ishida fez um ótimo resumo no seu blog Midializado, publicamos no blog da Social Figures as redes e principais tweets do evento e reuni no grupo Entusiastas do Monitoramento links para os slideshows apresentados.  Muito obrigado a todos envolvidos e até a próxima! =)

social analytics summit - foto por mari publicis

social analytics summit - foto por priscila marcenes

Social Analytics Summit – últimos dias para inscrição

Até o dia 22/11 ainda é possível realizar a inscrição no Social Analytics Summit, conferência sobre métricas e monitoramento de mídias sociais. Com curadoria minha e de Marcelo Coutinho, o evento trará relevantes palestras e debates com alguns dos profissionais mais experientes do país. Para apresentar a área, a mesa Inteligência nas Agências trará Daniele Dias, da Riot, Natália Traldi, da AgênciaClick, e Armando Neto, da DM9DDB, contanto como os setores de inteligência surgiram em suas agências.

Em Definições e Padrões de Métricas de Mídias Sociais no Brasil Luana Baio (dp6 e IAB) dividirá o palco com Flavio Ferrari (ex-Ibope e atual Qual Canal) para discutir se e como, afinal, serão definidas padronizações de métricas em mídias sociais no país. Em âmbito internacional temos grandes iniciativas do tipo, mas qual o estado disto no Brasil?

social analytics summit - palestrantesMensuração e Inteligência em Mídias Sociais: os clientes contam o que querem promete agitar o evento. Douglas Costa (Netshoes), Chiara Martini (Heineken) e Fabricio Guimarães (Philips) trarão a visão dos clientes sobre mensuração e inteligência em mídias sociais. O que estas três empresas realmente precisam na área? Como estão demandando serviços? Estas e outras perguntas recorrentes prometem ser respondidas no evento.

social analytics summit - palestrantes 2

 

Somarão-se a estas três discussões estratégias sobre o mercado palestras sobre tendências tecnológicas fortíssimas. Big Data: Veracidade e Valor, Dashboards de Mídias SociaisAtribuição Multicanal apontarão caminhos que podem ser seguidos para a ligação entre a comunicação e resultados, através das tecnologias.

Por fim, análises inovadoras na área com o apoio de métodos como social network analysisfocus groupetnografia digital fecharão o evento. Em palestra com o tema Social Network Analysis – Análise das Redes Sociais (de verdade!), Marcelo Coutinho demonstrará um tipo de análise que não é nada nova (remonta ao início do século XX), mas é pouco usada ainda em mídias sociais. E a mesa Pós-Demografia: entendendo e perfilizando o público nas mídias sociais trará cases de estudos de comportamento e perfis de consumidores, apresentados por Matheus Machado (Gauge) e Tatiana Tosi (Plugged Research), mediados por Juliana Ohashi (Ogilvy).

social analytics summit - palestrantes 3

O Social Analytics Summit será um interessante espaço de interlocução de profissionais ávidos por aproveitar cada dado, rastro e traço nas mídias sociais. Se você ainda não se inscreveu, uma mãozinha: usando o código de desconto sam2013tarcizio é possível economizar um pouco.

Acontecerá na Faculdade Casper Líbero (Av. Paulista), no dia 23 de novembro a partir das 08:00hrs. É isto. Te vejo lá?

TECH DAY 2 na UFMA: Redes Sociais

Acontecerá, na UFMA, em 17 de setembro, o segundo Tech Day, um evento que reúne oficinas e mesas sobre comunicação e tecnologia. Entre as oficinas (que já se esgotaram em um dia), o prof. Márcio Carneiro, organizador do evento, falará de análise de redes sociais com NodeXL e eu falarei sobre métricas de mídias sociais. As inscrições para as mesas continuam abertas e possuem temas como Social TV – O Remix do Broadcast com as Mídias Sociais, Mercado de Trabalho em Comunicação para Redes Sociais e Utilização de Mídias Sociais em Empresas e Instituições Públicas.

OutdoorTDL1[1]