Quem é dono dos seus dados?

Excelente vídeo produzido pelo pessoal do incrível PHD Comics com o apoio de várias universidades. Basicamente problematiza a posse dos dados pessoais digitais e o paradoxo da privacidade em relação aos negócios. Se hoje a maioria dos grandes negócios e a maioria dos negócios inovadores (e sobretudo os grandes E inovadores negócios), aumentar a privacidade pode prejudicar a economia? Como respeitar a posse pessoal dos dados e manter a inovação?

Metáforas sobre Big Data

security-fingerprint

Em interessante artigo, Sarah M Watson analisa as metáforas mais utilizadas ao se falar sobre “big data”. Diagnosticando a prevalência de metáforas industriais que falam dos dados como commodities, Watson advoga pelas metáforas que corporificam os dados, especialmente por percebermos que a maior parte da “big data” é social. Olhar os dados desta forma influencia na importante consciência de que os fenômenos tecnomercadológicos em torno de big data, no final das contas, envolve monetizar nossas ações e interações.

How we think about data—and more importantly what we do with it—will depend on the value systems that our conceptual metaphors capture and reify. Reframing metaphors for data in a more personal and embodied context will give us a better way to think of ourselves as information organisms, or “inforgs,” as philosopher Luciano Floridi suggests we are becoming. Our data profiles will act on our behalf, and we must be able to interact with and grasp their agency. Embodied data metaphors put more control in our hands as individuals, capable of interpreting and intervening in our own personal data management.

Leia o artigo na dis magazine.

 

Dataclysm – a disrupção da abundância de dados

dataclysmDisrupção é uma palavra que sofre muito nas mãos de publicitários com ego inflado e baixo poder de auto-avaliação. Por ser usada em 95% dos casos de forma errônea, evito-a de modo consistente. Porém, difícil não falar de disrupção, quebra de paradigma, quando se trata da atual abundância de dados públicos e semi-públicos sobre atributos, relações e ações sociais, devido à emergência das mídias sociais. Este foi um dos motivos para Christian Rudder dar o título apocalíptico Dataclysm – Who We Are* (*When We Think No One’s Looking) a seu livro.

Rudder está numa posição invejável para a grande maioria dos cientistas sociais, sejam eles focados em pesquisa acadêmica ou mercadológica: na frente do site de encontros OkCupid e com habilidades estatísticas e computacionais, ele tem a chance de cruzar e analisar dados comportamentais, expressivos e afetivos exclusivos de milhões de usuários.

Twitter, Reddit, Tumblr, Instagram, all these companies are businesses first, but, as a close second, they’re demographers of unprecedented reach, thoroughness, and importance. Practically as an accident, digital data can now show us how we fight, how we love, how we age, who we are, and how we’re changing. All we have to do is look: from just a very slight remove, the data reveals how people behave when they think no one is watching.

Em inspirado trecho, Rudder fala sobre quem fez “história” no decorrer da existência humana: apenas algumas figuras públicas e/ou extraordinárias (geralmente as vencedoras, quando se trata de conflito) tornaram-se merecedoras de ter memória para além de sua existência. Mas esta assimetria acaba quando temos memória, armazenamento e registro abundante:

But this asymmetry is ending; the small noise, the crackle and hiss of the rest of us, is finally making it to tape. As the Internet has democratized journalism, photography, pornography, charity, comedy, and so many other courses of personal endeavor, it will, I hope, eventually democratize our fundamental narrative.

O livro é estruturado em três partes: What Brings Us Together; What Pulls Us Apart; e What Makes Us Who We Are. Como os títulos dão a entender, o autor vai procurar mostrar como os dados sociais digitais podem explicar ou representar similaridades, conflitos e individualidades. No primeiro capítulo, um dos dados mais curiosos, gerado a partir do próprio OkCupid, mostra a diferença entre atratibividade percebida no website entre indivíduos heterossexuais. No gráfico abaixo estão cruzadas a idade dos usuários e idades preferidas para parceiros, dado coletado a partir dos rates (avaliações) reais no site de encontros:

okcupid - preferencia por idade

É incrível observar como os homens, em média, mantem o ideal da mulher jovem adulta, enquanto as mulheres permanecem com um ideal de homem pouco mais jovem ou velho do que si mesmas. O dado fica ainda mais interessante quando cruzado com a média de idade em que os homens e mulheres efetivamente enviam mensagens, dado no qual a discrepância é muito menor.

A primeira parte do livro é baseada na análise das relações afetivo-sexuais a partir dos dados do OkCupid. Vale a menção também a um experimento realizado com um aplicativo de encontro às cegas, no qual os usuários não poderiam ver a imagem com quem estavam marcando encontros. Cruzando os dados das pessoas que se encontraram com a atratividade percebida no site OkCupid, mesmo nos casos em qual a atratividade era muito discrepante (digamos, uma homem com nota 9 e uma mulher com nota 6), a satisfação pós-encontro às cegas foi muito mais positiva do que o esperado.

Na segunda parte do livro, Rudder passa a analisar itens mais sensíveis, especificamente a “raça” dos usuários e atratividade percebida entre asiáticos, latinos, brancos e negros. Rudder procura contextualizar os dados de forma responsável, mas acaba por ficar patente a crise que vivemos na sociologia empírica (ver Savage & Burrows). A redistribuição das hierarquias também ocorreu na pesquisa, como bem descreveu a Noortje Marres, e este livro é um dos exemplos disto. A força (pseudo) legitimadora dos dados quantitativos em uma fatia de mensuração (rating entre usuários) resultou no compartilhamento do gráfico abaixo em fóruns racistas:

okcupid match scores races

O tema, tão importante, interessante e sensível merecia ter seus dados explorados de forma mais fina por pesquisadores e pensadores com uma maior bagagem e peso em ciências sociais. A cisão que está se aprofundando com as restrições de acesso e habilidades computacionais a estes dados sociais digitais clama por esforços urgentes dos interessantes em ciência mais aberta. Em tempos de engenharia afetiva no Facebook e seu bilhão de usuários (defendida pelo próprio Rudder), isto parece estar cada vez mais longe.

A terceira parte traz um dos capítulos mais interessantes, chamado “Tall for an Asian”. A partir dos campos biográficos de auto-expressão nos perfis da OkCupid, Rudder realiza a medição de quais palavras são outliers para cada grande grupo demográfico que analisa, mostrando como o gerenciamento de impressões de cada segmento populacional é enquadrado pelos seus comportamentos e expectativas percebidas. Outra vez uma densidade teórica maior faria diferença, como a aplicação de referencial do Interacionismo Simbólico e Teoria Dramatúrgica. Porém, enquanto exibição de possibilidades metodológicas, a seção traz muitas ideias.

Em resumo, Dataclysm é um livro característico das tendências que fascinam (e/ou amedrontam) interessados em análise social a partir de dados digitais e um dos primeiros a ser escrito pelos novos grandes e isolados privilegiados deste cataclisma dos dados: os criadores/detentores de mídias sociais. O que está subjacente na possibilidade de produção deste livro é o que temos de mais importante e crítico nas ciências em torno da comunicação digital hoje.

 

 

Webinar sobre inteligência digital no S+ Entrevistas: assista a gravação

O webinar com o pessoal da S+ aconteceu nesta última terça-feira. O vídeo da gravação pode ser conferido abaixo:

2:00 Apresentação.
7:00 Sobre o estudo.
10:20 Quando que você colocou toda essa base acadêmica em prática?
12:30 Case Reclame Aqui Hotéis: Reclamações de Hotéis, pessoas que tiveram problemas além do operacional.
15:25 Como o estudo é aplicado na prática, como é feita essa transição?
19:40 Quais as diferenças do Big Data e monitoramento em mídias sociais?
20:50 Explicando Big Data.
24:30 Como você classifica o seu trabalho? Como se classificam os grupos (Analytics, Menções, entre outros)?
36:00 Quais ferramentas são usadas para fazer o monitoramento? Programas específicos?
48:00 Como captar os clientes com esse conhecimento e ferramentas?
55:45 Qual a metodologia de análise de redes? Você usa o Gephi?
1:03:55 Você pode explicar a relação entre objetivos, metas, KPI’s e métricas?
1:07:50 Como convencer um cliente regional a monitorar a rede e quais ferramentas mais baratas podem ser usadas?
1:12:00 Qual a melhor rede social para você?
1:15:50 Qual é a melhor agência que entrega um trabalho de monitoramento no Brasil?
1:18:56 Últimas palavras.

Outros vídeos com palestras e debates estão organizados em playlist no meu canal YouTube.

12 Livros para o profissional de comunicação ler em 2014 – parte 2

Continuando a série de 12 livros para o profissional de comunicação ler em 2014, três publicações que tratam de estatística, sua aplicação e disseminação no cotidiano.

 

thinking statisticallyPara começo de conversa, o pequeno livro Thinking Statistically, do Uri Bram, não é um grande manual de estatística como os que você por aí. Tampouco busca ser um guia completo ou exaustivo dos conceitos de dados quantitativos, regressão múltipla ou métodos específicos de mensuração estatística. Como o título aponta, ele quer te ajudar a pensar melhor, raciocinar levando em conta as diversas variáveis que podem estar envolvidas em um problema ou hipótese.

Buscando alcançar este objetivo, o livro é dividido em três seções: Seleção, Endogenia e Bayes. O primeiro trata do selecionar coisas a serem observadas. Ao invés de falar de amostragem e seus complexos cálculos, antes explica como o senso comum pode levar a erros de seleção, como percepção seletiva. Já o capítulo sobre endogenia explica o porquê você deve olhar além do entorno de seu problema. A velha, clássica e sempre maltratada distinção entre correlação e causalidade é a chave deste capítulo. Por fim, apresenta os elementos da inferência bayesiana, que ajuda a colocar na fórmula – literalmente, as incertezas presentes em qualquer probabilidade.

O texto é redigido de modo quase informal, com exemplos e casos reais e ficcionais bem curiosos, garantindo a diversão na leitura. Na Amazon você compra a versão digital por apenas 6 reais.

 

big data O livro Big Data: A Revolution that Will Transform How We Live, Work, and Think, traduzido como Big Data: como extrair volume, variedade, velocidade e valor da avalanche de informação cotidiana explora de forma responsável e minuciosa os impactos da ideia de “big data”, tão em voga hoje nos mercados e imprensa. O conhecimento dos autores sobre a história da pesquisa permite uma profunda discussão sobre o impacto da abundância dos dados, como ao falar sobre amostragem aleatória: “random sampling has been a huge success and is the backbone of modern measurement at scale. But is only a shortcut, a second-best alternative to collecting and analyzing the full dataset”.

Viktor Mayer-Schonberger é professor de Oxford e Kenneth Cukier é jornalista e editor da revista The Economist. Juntos criaram um livro acessível e necessário a quem deseja entender o fenômeno para além do “buzz” mercadológico. Uma dica é acompanhar o blog do Lab404, da UFBA, que publicou posts sobre todos os capítulos do livro, que foi discutido por lá, como em Big Data: por que usar uma amostra quando é possível usar N=all?

 

the signal and the noiseSignal and the Noise, ou O Sinal e o Ruído, de Nate Silver, é um típico livro americano voltado a quem deseja estudar alguma inovação sobre o mundo tecnológico que influencia os negócios. Repleto de narração de casos – cada capítulo é amplamente baseado em um casos curioso de uma área, o autor passa do pôquer à política, tocando em temas como sismologia e baseball.

Silver é estatístico e ficou famoso ao “prever” as eleições americanas de 2008 e 2012, um caso que foi amplamente coberto pela imprensa e o tornou bastante famoso também em terras brasileiras. As histórias e metáforas que usa no livro são comumente utilizadas por clientes e gerentes de marketing: se você trabalha em agência ou consultoria, é mais um motivo pra lê-lo.

Não esqueça de ver a primeira parte em 12 Livros para o profissional de comunicação ler em 2014 – parte 1. Em breve, mais livros sobre comunicação para deixar seu 2014 repleto de boas ideias e inquietações.