Como estudar audiências televisivas com as mídias sociais?

Em outubro aconteceu na Universidade Federal Fluminense o I Congresso TeleVisões, que reuniu centenas de pesquisadores que estudam narrativas seriadas como novelas e séries, representações e identidade nos produtos, novas mídias, convergência, mercado televisivo, mídias sociais, fãs, cultura sonora e outras temáticas relevantes.

Eu e Eloy Vieira, pesquisador doutorando na Unisinos, submetemos ao evento artigo que apresenta metodologia para o estudo de fãs no Twitter, com aplicações possíveis a diversos tipos de públicos e audiências. Depois da contextualização dos estudos sobre fãs nas mídias sociais, propomos 4 etapas (entrada, planejamento, análise e apresentação) que vão da imersão no tema e escolha inteligente de keywords e modos de observação até a construção de personas e visualização de resultados.

O artigo chama-se “Fãs, Consumo Cultural e Segunda Tela: proposições metodológicas acerca das audiências no Twitter

Resumo: O presente artigo organiza procedimentos metodológicos para o estudo de hábitos e características comportamentais de fãs imersos no fenômeno da segunda tela. Para isso, partimos do conceito de cultura da convergência, que engendrou estudos de comunidades de fãs (JENKINS, 2009) e então apresentamos uma proposta que visa compreender as imbricações entre fãs e segunda tela no Twitter a fim de atender demandas acadêmicas e mercadológicas acerca deste assunto. A proposta é construída a partir da coleta de dados baseadas em um arranjo quali-quantitativo de Análise de Redes Sociais e prevê quatro fases: Planejamento, Entrada, Análise e Apresentação.
 Clique para acessar o artigo completo:

Além das hashtags – #Ferguson, #Blacklivesmatter e a batalha online por justiça offline

Desde 2014, cresceu online a mobilização para denúncia e repúdio às execuções de indivíduos negros desarmados por policiais nos EUA. Além do uso desproporcional da força em casos que envolviam crimes efetivos, aconteceram execuções escandalosamente racistas – como o chocante caso de Tamir Rice, de 12 anos, morto enquanto brincava em um parque.

mortes-por-policiais-estados-unidos-inglaterra-alemanha-e-japao

Mortes por policiais nos EUA e outros países também populosos e com IDH altíssimo, em 2013. No Brasil, em 2014, foram 3.022 pessoas.

O movimento e hashtag #BlackLivesMatter (“Vidas Negras Importam”) surgiu em 2013, mas se intensificou a partir de 2014. A possibilidade de circular informação sobre os casos nas mídias sociais, somada às evidências dos acontecimentos através de vídeo abriram a possibilidade de gerar fortes manifestações, como os protestos em Ferguson depois que a justiça americana inocentou policial que matou Michael Brown com seis tiros.

beyond-the-hashtagsO relatório Beyond Hashtags: #Ferguson, #Blacklivesmatter, and the online for offline struggle, realizado pelos pesquisadores Deen Freelon (American University), Chartlton D. Mcilwain (New York University) e Meredith D. Clark (University of North Texas) foi publicado neste ano e aplicou métodos digitais de pesquisa a 40,8 milhões de tweets, 100 mil links e 40 entrevistas com ativistas e aliados do BLM.

  • Foram encontradas seis grandes comunidades de conversa, a partir da análise de redes: Black Lives Matter; Anonymous/Bipartisan Report; Artistas/Profissionais de Entretenimento Negros; Conservadores; Notícias Mainstream; Twitter Negro Jovem.
  • O maior parte das comunidades observadas apoiam justiça para as vítimas e denunciam a brutalidade policial;
  • Os jovens negros discutiram a brutalidade policial, mas de modos diferentes das outras comunidades;
  • Ativistas conseguiram educar observadores casuais em dois pontos: choque e descrença sobre as reações policiais nos protestos de Ferguson; e reconhecimento pelos Conservadores, da brutalidade policial nos casos de Eric Garner e Walter Scott.

Os pesquisadores descobriram 9 períodos distintos de mobilização, nos quais aplicaram 2 perguntas de pesquisa em dois níveis de abstração. No nível Macro, analisou as comunidades em rede e as hashtags mais utilizadas; no nível micro, os principais usuários em cada comunidade e análise dos tweets muito replicados. Assim, conseguiram responder as perguntas “Quem é mais ouvido?” e “O que estes usuários dizem”.

beyond-the-hashtags

 

Ao longo de suas 92 páginas, os autores aplicaram um processo muito útil e eloquente de simplificação das redes em suas comunidades. O grafo abaixo, por exemplo, representa 3,9 milhões de tweets de 897 mil usuários, que foram esquematizados nas comunidades participantes e suas interações.  Foi possível observar, por exemplo, a presença de conservadores contra os movimentos e mobilização, e também a presença de ativistas da Rússia e Irã expondo as contradições internas estadunidenses.

beyond-the-hashtags-period-9-communities

Alguns dos tweets de destaque do período: de conservadores promovendo a violência; flagra de violência contra jornalista; e articulação dos militantes.

beyond-the-hashtags

Diversos recursos criativos de análise dos dados a partir da perspectiva dos métodos digitais foram utilizados. Em um trecho do relatório, os sites são comparados em torno de sua idade, usando dados da WaybackMachine:

beyond-the-hashtags-sites-age

Entre as várias ricas conclusões, os autores observaram que raramente os tweets mais replicados são aqueles que estão articulando movimentação presencial. Geralmente são informacionais. Isto pode ser visto tanto quanto indicador do risco inerente em se expor ao tema, quanto indicador da necessidade de se aprofundar na cauda longa da análise, assim como este estudo conseguiu.

We also found that attempts to coordinate movement action were rare among the top tweets. By this we mean information about where protests would be held, invitations to participate, instructions on how to participate, and discussions about what kinds of actions should be held. We saw a few such tweets in passing and some of our interview participants mentioned finding out about protests from Twitter. However, movement action tweets were not among the most shared. This implies that most people paying attention to BLM online were more interested in consuming information and participating digitally than in offline participation. This is not much of a surprise, especially considering the risks of some of BLM’s offline actions. But it does remind us that just because a certain movement use of Twitter is not the most visible does not mean it is not occurring somewhere. It simply means that researchers and interested citizens might need to dig a bit deeper to understand the full scope of social media’s value for activists.

Alguns dos autores estão também envolvidos com o projeto DocNow, que busca desenvolver um software e promover educação sobre a importância de preservar recursos e documentos online para ativistas e pesquisadores de direitos humanos. Em breve, escreverei mais sobre o projeto:

docnow

 

 

 

 

Pesquisa baseada em Dados Sociais Digitais: mapeamento de ferramentas e táticas de coleta de dados no Intercom

Acaba de ser publicado meu artigo “Pesquisa baseada em Dados Sociais Digitais: mapeamento de ferramentas e táticas de coleta de dados no Intercom“, na revista digital iberoamericana Razón y Palabra. O objetivo do trabalho foi mapear padrões entre os artigos publicados no evento que realizaram coleta de dados interacionais, conversacionais e opinativos em sites de redes sociais. Variáveis relacionadas a quantidade de dados, ferramentas de coleta, plataformas analisadas e apresentação dos resultados foram rastreadas à luz de questões referentes aos desafios e potencialidades destas modalidades de pesquisa.

Total de Artigos x Artigos baseados em Coleta de Dados Sociais

O congresso da Intercom, Sociedade Brasileira de Estudos Interdisciplinares da Comunicação, é o maior congresso de ciências da comunicação no Brasil. Além de conferências, traz grupos de trabalho, atividades de exposição competitiva de produtos laboratoriais, lançamento de livros e outros espaços de sociabilidade e colaboração entre pesquisadores do Brasil e outros países. A produção publicada neste evento serviu de indicador para refletir sobre as oportunidades, desafios e tendências que a oferta de dados nos sites de redes sociais trazem para os pesquisadores acadêmicos.

principais fontes de dados sociais digitais

Os GTs diretamente relacionados à mídias sociais neste congresso foram mapeados: Núcleo de Pesquisa em Tecnologias da Informação e da Comunicação [até 2008) e os grupos Cibercultura e Conteúdos Digitais e Convergências Tecnológicas a partir de 2009. A partir da filtragem de 704 artigos, cheguei a 72 que trabalharam diretamente dados interacionais, conversacionais e opinativos. As questões de pesquisa abaixo são respondidas e cruzadas com questionamentos sobre a redistribuição de métodos e especificidades da pesquisa digital.

a) Quantos trabalhos publicados no evento utilizaram coleta de dados sociais digitais?
b) Quais sites de redes sociais são abordados nos trabalhos do evento?
c) Quais as ferramentas utilizadas para coleta e processamento dos dados?
d) Quais os tipos de conteúdo e volume analisados nos artigos?
e) Como os pesquisadores abordam a relação entre conteúdo e indivíduos publicadores?
f) O conteúdo é apresentado de forma direta ou através de visualizações?
g) Os indivíduos observados, direta ou indiretamente, nos dados empíricos, são anonimizados?

De modo geral, os resultados parecem apontar para a necessidade de maior domínio e clareza de procedimentos metodológicos, exploração do potencial de tratamento do volume de dados e detalhamento de processos de codificação e análise que potencializem o aproveitamento das particularidades dos sites de redes sociais.

Leia o artigo em: Pesquisa baseada em Dados Sociais Digitais: mapeamento de ferramentas e táticas de coleta de dados no Intercom.

Big Data: medindo e prevendo o comportamento humano

Em 20 de abril foi lançado o curso online massivo e aberto (MOOC: massive online open course) “Big Data: measuring and predicting human behaviour“. Possui a duração de 9 semanas e pode ser iniciado em qualquer momento até a última semana. Ou seja: corra pra fazer, que dá tempo!

Na primeira semana do curso, os professores se dedicam a apresentar o que é big data, especialmente em torno de um projeto desenvolvido pelos próprios professores do curso fazem parte. Suzy Moat e Tobias Preis falam sobre o Future Orientation Index, índice criado para identificar o quanto a população de determinado país se preocupa/planeja/pensa sobre o futuro. O mais interessante deste índice é que ele utiliza basicamente dados do Google Trends. Para cada país analisado (todos com 5mi ou mais de usuários de internet), os pesquisadores extraíram o volume de buscas pelos anos anteriores e anos futuros. O índice calcula se a população está mais voltada ao futuro ou ao passado em suas buscas. O gráfico da direita abaixo mostra considerável correlação entre o índice e o GDP per capita (Gross Domestic Product per capita, ou PIB per capita):

future orientation index

Tela de “Quantifying the Advantage of Looking Forward”, por Preis, Moat, Stanley e Bishop

Na segunda semana, o tema é “Medindo e Prevendo Comportamentos com Big Data”. São vários vídeos realizados pelos dois professores e por outros pesquisadores convidados mostrando seus projtos sobre mecanismos de busca, tecnologias vestíveis e cidades inteligentes. Merece destaque um projeto que me surpreendeu. Paul Lukowics, da DFKI/TU Kaiserslautern, mostra o “Magic Collar”, que tem o objetivo de conseguir medir classes de alimentos sendo engolidos através do som realizado na deglutição.
the magic collar

Nesta semana começam os exercícios práticos, que ensinarão coletas e processamentos simples de dados com o R e R-Studio. Da segunda à sexta semana, são apresentados passos simples de como redigir script para coletar dados históricos de visualização de páginas na Wikipedia. Tudo é realizado extraindo dados de forma organizada do stats.grok.se. Já conhecia e usava o website, mas a criação do script no R expande e aprofunda as possibilidades.

stats wikipedia

O mercado financeiro é o tema da terceira semana. Os professores e entrevistados da semana mostram exemplos de estudos que relacionam atividades online de busca de informação, como visitas à Wikipedia e busca no Google, como correlacionados a atividades no mercado financeiro. O gráfico abaixo, tela de aula do Tobias Preis, mostra estudo que compara a busca pelos termos Lehman Brothers e Financial Crisis com o índice S&P 500 em torno da crise de 2008.

big data - university of warwick - mercado financeiro

A quarta semana traz estudos sobre big data, crime e conflito. São aplicações em redução e prevenção de criminalidade, sobretudo a partir da compreensão das dinâmicas de ocorrências nas cidades. Um bom projeto é realizado por Toby Davies, da University College London, que utilizou métricas como intermediaridade de rede para analisar a disseminação de ocorrências.

intermediaridade - big data - crime nas cidades

Mas de particular interesse para os brasileiros é o estudo liderado por Neil Johnson, do Complex Systems Initiative at the University of Miami (oh, a ironia). Johnson procurou descobrir uma fonte de dados que pudesse ajudar a prever o tamanho dos protestos realizados em 2013 no Brasil. O pesquisador explica as dinâmicas encontradas e como se surpreendeu que este dado foi a atividade e crescimento em páginas do Facebook dedicadas à política e protestos.

big data - neil johnson

Durante todo o curso, há atividades específicas de comentários e discussão. A cada semana, os professores e a assistente, Chanuki Seresinhe, publicam um novo vídeo “round-up” para resumir a semana anterior e comentar dúvidas e colaborações dos alunos nos campos de discussões e comentários. Mas a quinta semana levará tudo isto além, incluindo uma seção de Twitter Chat em torno da hashtag #FLBigData. Já há bastante debate e colaborações, como você pode ver no widget abaixo, mas no dia 21 de maio, entre 1-2PM Uk Time (entre 10h-11h da manhã aqui na faixa de horário de Brasília), Suzy e Tobias participarão ao vivo da conversa.


Uso do big data para saúde é o tema da interessante sexta semana. O caso mais curioso é o da história da predição efetiva de tendências de gripe através de buscas no Google e a posterior falha do mecanismo em 2013, causada por mudanças no comportamento dos indivíduos.

Detecting flu infections with Google searchesfacebook likes como preditores de atributos

A sétima semana vai tratar de felicidade! Há projetos baseados tanto em quantified self através de smartphones quanto do que as pessoas falam em Facebook e Twitter, através da identificação de marcadores linguísticos sobre afetividade, positividade e negatividade. Os estudos experimentais realizados pelo Facebook sobre difusão de estados emocionais e sobre predição de atributos através de likes (já escrevi sobre, aqui no blog), também são apresentados.

Nesta semana começa também a série de exercícios no R de redação de scripts para coletar e cruzar os mesmos dados que serviram de base para a criação do Future Orientation Index pelos professores do curso. Os dados de busca, obtidos através do Google Trends, serão cruzados com os dados do CIA World Factbook  nos exercícios.

Tratando de mobilidade e desastres, as aulas da oitava semana mostram como smartphones, Flickr e mapas colaborativos tem ajudado pessoas em situações de calamidades naturais. A tela abaixo mostra a correlação entre número de fotografias com hashtags selecionadas referentes ao furacão Sandy e a medição de uma variável ambiental: pressão atmosférica. O número de fotos esteve correlacionado à força do furacão.

Furacão Sandy - Flickr - Pressão Atmosférica - Big Data

Por fim, a nona semana é dedicada especialmente à reflexão e discussão do que foi aprendido. Um dos vídeos da última semana trata de como contar histórias com dados. Apresentado por Adrian Letchford, também da Warwick Business School, discorre sobre o processo de descoberta enquanto conta uma interessante história pessoal. Como exemplo, traz visualizações como a exibida abaixo, que comparou termos de busca em estados dos EUA com maior e menor taxa de natalidade.

Telling stories with data

Imagino que alguns destes poucos exemplos já devem ter despertado o interesse, não? Então cadastre-se em https://www.futurelearn.com/courses/big-data e participe!

Discurso no Twitter e Mídias Sociais: como usamos linguagem para criar afiliação na web

discourse and social media

O livro “Discourse of Twitter and Social Media: How We Use Language to Create Affiliation on the Web” foi lançado em 2012 pela professora Michelle Zappavigna, da University of South Wales (Austrália). A discussão e análise teórico-analítica se debruçou em um corpus, chamado de HERMES, criado pela pesquisadora com cerca de 7 milhões de tweets e de 100 milhões de palavras.

É um excelente exemplo da aplicação da linguística de corpus para a análise de mídias sociais, discurso, práticas interacionais, afetivas e políticas. Ao longo de seus capítulos, a autora aplica técnicas como análise de colocações, n-gram e contagem de frequências para identificar padrões e desvios nos textos do Twitter.

O primeiro capítulo, Social Media as Corpora, discute a possibilidade de entender as mídias sociais, e a sociedade através delas, a partir da construção de corpora de conteúdos textuais gerados em tempo real no Twitter. Parte do princípio de que as mídias sociais permitiram, sobretudo, a emergência da possibilidade de “discurso buscável” (searchable talk), com impactos relevantes na sociabilidade. Qualquer pessoa que já utilizou uma hashtag para marcar uma posição política ou para falar de um programa televiso, sabe muito bem do que a autora está falando:

“searchable talk, a change in social relations whereby we mark our discourse so that it can be found by others, in effect so that we can bond around particular values”

Zappavigna utiliza a SFL (systemic functional linguistics), que direciona a análise para uma abordagem funcional de análise utilizando metodologias de linguística de corpus. A partir da base antropológica, sobretudo de Malinowski, vê a linguagem como recurso para a realização de três funções: função ideacional de determinação de experiência, função interpesssoal de negociação de relações e função de textual de organização da informação.

Deste modo, no segundo capítulo, The Language of Microblogging, descreve as particularidades da linguagem no Twitter em suas manifestações fáticas, conversacionais ou como “backchannel” de outras atividades (vide segunda tela). Fatores da affordance do Twitter, como tamanho, hashtags e sua temporalidade própria são também analisadas. Neste capítulo a autora apresenta as primeiras aplicações de técnicas de linguística de corpus, como frequência de palavras:

hermes corpus - michele zappavigna

Evaluation in Microblogging, o terceiro capítulo, percorre o corpus HERMES a partir dos marcadores de sentimento/avaliação Julgamento, Afeto e Apreciação. Cada um dos “sistemas” de avaliação é explorado em detalhes, com inúmeros exemplos. Até o uso de emoticons é analisado de forma minuciosa, a partir da compreensão das emoções  expressas pelos usuários:

articulation network for facial emoticons

A criação de afiliação através dos textos é o tema do quarto capítulo, Ambient Affiliation. Através deste termo, a Michele Zappavigna procura mostrar como a plataforma é utilizada pelos seus usuários para gerar afiliações em torno de temas, tópicos e identidades. Aplicando o sociólogo Goffman, autor que melhor entendeu os processos micro-interacionais já na década de 1930 e hoje é aplicado em inúmeros estudos online, Zappavigna fala inclusive de como diversos estudos, inclusive o seu, mostram que técnicas de agrupamento (clustering) dão resultados consistentes apesar da aparente dispersão dos usuários. A liga social, neste caso, é a própria linguagem.

“we affiliate with a co-present, impermanente community by bonding around evolving topics of interest. This function is directly inscribed in the web interface to users’ Twitter accounts as the list of trending topics”

Nos três capítulos seguintes, Internet Memes, Internet Slang Internet Humour and fail: ‘The world is full of #fail tonight”, o livro analisa algumas particularidades das gírias, memes e humor no Twitter. Em sua maioria dos casos, são circulações meméticas que perpassam várias plataformas, como reddit e 4chan. Um trecho particularmente interessante é a análise da redefinição e complexificação do termo geek.

michele zappavigna collocates - geek out

Por fim, no nono capítulo, Political discourse online, a autora analisa um sub-corpus do Hermes chamado OWC – Obama Win Corpus. São 45290 publicados nas 24 horas subsequentes à vitória de Barack Obama nas eleições de 2008. O foco da análise se dá em torno da ideia de “mudança” (change), explorada pela campanha e militantes do político. É bem interessante também o relato que a autora faz dos tweets falando do cachorro presidencial, uma tradição no processo de construção da imagem dos presidentes americanos.michele zappavigna - collocates OWC - puppy

Por fim, nas conclusões a autora problematiza o futuro e limitações da linguística de corpus para as mídias sociais, especialmente relacionados à circulação de informação, inclusive textual, em formato de imagens.

+ Mais sobre Michele Zappavigna:

Twitter – https://twitter.com/smlinguist

Publicações – http://socialmedialinguist.blogspot.com.br/p/publications.html

Página na UNWS – https://sam.arts.unsw.edu.au/about-us/people/michele-zappavigna/

Google Scholar – https://scholar.google.com/citations?user=ILicbSEAAAAJ&hl=en