Pesquisa baseada em Dados Sociais Digitais: mapeamento de ferramentas e táticas de coleta de dados no Intercom

Acaba de ser publicado meu artigo “Pesquisa baseada em Dados Sociais Digitais: mapeamento de ferramentas e táticas de coleta de dados no Intercom“, na revista digital iberoamericana Razón y Palabra. O objetivo do trabalho foi mapear padrões entre os artigos publicados no evento que realizaram coleta de dados interacionais, conversacionais e opinativos em sites de redes sociais. Variáveis relacionadas a quantidade de dados, ferramentas de coleta, plataformas analisadas e apresentação dos resultados foram rastreadas à luz de questões referentes aos desafios e potencialidades destas modalidades de pesquisa.

Total de Artigos x Artigos baseados em Coleta de Dados Sociais

O congresso da Intercom, Sociedade Brasileira de Estudos Interdisciplinares da Comunicação, é o maior congresso de ciências da comunicação no Brasil. Além de conferências, traz grupos de trabalho, atividades de exposição competitiva de produtos laboratoriais, lançamento de livros e outros espaços de sociabilidade e colaboração entre pesquisadores do Brasil e outros países. A produção publicada neste evento serviu de indicador para refletir sobre as oportunidades, desafios e tendências que a oferta de dados nos sites de redes sociais trazem para os pesquisadores acadêmicos.

principais fontes de dados sociais digitais

Os GTs diretamente relacionados à mídias sociais neste congresso foram mapeados: Núcleo de Pesquisa em Tecnologias da Informação e da Comunicação [até 2008) e os grupos Cibercultura e Conteúdos Digitais e Convergências Tecnológicas a partir de 2009. A partir da filtragem de 704 artigos, cheguei a 72 que trabalharam diretamente dados interacionais, conversacionais e opinativos. As questões de pesquisa abaixo são respondidas e cruzadas com questionamentos sobre a redistribuição de métodos e especificidades da pesquisa digital.

a) Quantos trabalhos publicados no evento utilizaram coleta de dados sociais digitais?
b) Quais sites de redes sociais são abordados nos trabalhos do evento?
c) Quais as ferramentas utilizadas para coleta e processamento dos dados?
d) Quais os tipos de conteúdo e volume analisados nos artigos?
e) Como os pesquisadores abordam a relação entre conteúdo e indivíduos publicadores?
f) O conteúdo é apresentado de forma direta ou através de visualizações?
g) Os indivíduos observados, direta ou indiretamente, nos dados empíricos, são anonimizados?

De modo geral, os resultados parecem apontar para a necessidade de maior domínio e clareza de procedimentos metodológicos, exploração do potencial de tratamento do volume de dados e detalhamento de processos de codificação e análise que potencializem o aproveitamento das particularidades dos sites de redes sociais.

Leia o artigo em: Pesquisa baseada em Dados Sociais Digitais: mapeamento de ferramentas e táticas de coleta de dados no Intercom.

Quatro Aspectos dos Sites de Redes Sociais

Em publicação recente, Danah Boyd revisita a definição de “site de rede social” proposta por ela e Nicole Ellison no Journal of Computer-Mediated Communication em 2007. Nesta revista, um marco na pesquisa acadêmica sobre o tema, as autoras definiram sites de redes sociais (SRS) como:

“serviços de web que permitem aos usuários (1) construir um perfil público ou semipúblico dentro de um sistema conectado, (2) articular uma lista de outros usuários com os quais eles compartilham uma conexão e (3) ver e mover-se pela sua lista de conexões e pela dos outros usuários”

É uma definição que acho bem interessante – apesar de não concordar totalmente – e me chamou a atenção quando foi publicada, justamente quando direcionei totalmente meu foco de pesquisa e trabalho para comunicação digital e mídias sociais. Foi criticada por autores como David Beer (que também publicou o ótimo New Media: The Key Concepts com Nicholas Gane) e utilizo, com algumas ressalvas, em artigos e aulas. Leia o artigo de Boyd e Ellioson em “Social Network Sites: Definition, History and Scholarship” e o de Beer em “Social Network(ing) sites: revisiting the story so far: A response to danah boyd & Nicole Ellison

No livro A Networked Self: Identity, Community, and Culture on Social Network Sites, organizado pela Zizi Papacharissi e recém-publicado, a Danah Boyd publicou um artigo sobre “públicos em rede” e revisita este conceito em uma seção do texto, focando em quatro aspectos: perfis, lista de amigos, ferramentas de comentário e stream based updates. Como são aspectos chave a serem observados por qualquer interessado nesses ambientes, apresento aqui algumas citações, comentários e links para que o leitor possa ler mais sobre o assunto.

Perfis
A possibilidade de se criar um perfil público ou semi-público é uma das principais características dos sites de redes sociais. Um perfil nesses ambientes representa uma pessoa, organização ou personagem através de fotos (avatar, álbuns e outras), mini biografias, dados demográficos, preferências culturais, aplicativos, subscrição a comunidades e grupos etc. Os usuários de SRSs customizam seus perfis de acordo com seus desejos de representação identitária.

Relacionado a este aspecto, os aplicativos “Grader” da Hubspot são um bom exemplo de análise de perfis a partir do agregado de dados. A partir da análise de determinadas informações, em referência a possíveis ideais, assim como da comparação dessas informações com a base de dados compostas pelos dados de outros usuários que já utilizaram seus sistemas.

Diversos pesquisadores se dedicaram a observar os processos de construção e edição dos perfis em sites de redes sociais. Scott Counts e Kristin Stecher, por exemplo, exploram os modos pelos quais as pessoas se apresentam nos sites de redes sociais durante a criação dos perfis pessoais no artigo Self-Presentation of Personality During Online Profile Creation. Esta perspectiva, de pensar os aspectos de gerenciamento de impressões nas interações sociais é abordada também pelos pesquisadores do GITS-UFBA, do qual faço parte.

Lista de Amigos
As listas de amigos é onde o usuário do SRS pode observar e editar suas conexões, podendo utilizar este recurso para navegar de perfil em perfil através das redes. Teoricamente, de perfil a perfil o usuário pode chegar a qualquer ponto da rede, acessando qualquer perfil que esteja relativamente conectado.

O artigo Public Display of Connections, publicado por Judith Donath e Danah Boyd em 2004 trata da importância do papel das conexões públicas na formação de impressões sobre determinado ator social. Para as autoras, “social status, political beliefs, musical taste, etc, may be inferred from the company one keeps”. A pesquisadora Raquel Recuero já publicou trabalhos e postagens que analisam as redes de conversações online como as fans wars no Twitter.

Além disso, a análise das estruturas fluídas e mutáveis das redes sociais em torno de determinados atores pode ser esclarecedora. Os aplicativos Touchgraph (para diversos fins, incluindo versões gratuitas pra buscador e Facebook) e o LinkedIn Maps são dois aplicativos que permitem observar – a partir de uma rede ego – as conexões e centralidade de seus contatos nestas mídias sociais. Escrevi um post sobre o uso desses aplicativos para a análise de redes profissionais, no blog Dica 1.

Muitas vezes, também, a quantidade de conexões (amigos, seguidores ou inscritos) estabelecem um ponto de partida para as dinâmicas competitivas mais simples nestes ambientes. Pode-se falar de uma “mensuração reflectiva“, através da qual as pessoas observam dados e métricas dos ambientes para comparar a si e a outros atores sociais.

Ferramentas de Comunicação e Publicação
Termos utilizados no mercado como “conteúdo gerado pelo usuário” para dar conta de algumas novas práticas, que ganham ainda mais destaque nos sites de redes sociais (especialmente os focados na publicação e disseminação de conteúdo), de publicação, circulação e edição de conteúdo. O que André Lemos chama de “liberação do pólo da emissão” reúne “inúmeros fenômenos sociais em que o antigo “receptor” passa a produzir e emitir sua própria informação, de forma livre, multimodal (vários formatos midiáticos) e planetária”.

Dessa forma, o ecossistema midiático digital é muito mais fragmentado, algo que é positivo pois permite a expressão comunicacional e afetiva pelas mais diferentes pessoas e grupos. Nesse sentido, o fenômeno da cauda longa é intensificado pelo que os prosumers publicam no dia a dia, os mais diversos comentários sobre política, consumo, entretenimento ou mesmo o cotidiano.

Nas mídias sociais, estas ferramentas de comunicação e publicação resultam em uma enormidade de conteúdo em constante criação, circulação e remix nas redes. Diversos softwares como aplicativos e buscadores buscam realizar uma organização desse conteúdo a partir de fatores como visibilidade, tópicos e interesse do usuário. Alguns exemplos são o Topsy, Migre.me e Appinions. Um interessante artigo de Allison Hearn chamado Structuring Feeling: Web 2.0, online ranking and rating and the digital ‘reputation’ economy discute como a circulação de conteúdo e a retórica da influência vista em aplicativos como Klout e Empire Avenue reforçam modos de free labour na atual economia.

E, na medida em que os usuários de internet publicam mais e mais tipos de conteúdo como fotos, atualizações textuais, comentários, postagens e afins, a possibilidade de resgatar esta memória digital recebe mais atenção por pesquisadores, desenvolvedores e publicitários. A Danah Boyd, junto a alguns colaboradores, falou recentemente de “data portraits“, o Memolane faz considerável sucesso ao oferecer uma linha do tempo da vida dos usuários e iniciativas da Intel, Itautec e Coca Cola, por exemplo, se aproveitam desse interesse:


Stream Based Updates

Talvez o aspecto mais fugidio e contestável é a “stream based update”: em uma tradução grosseira, “atualizações baseadas em fluxo”. Os exemplos mais comuns hoje são a timeline do Twitter e o news feed do Facebook. Diversos outros SRS adotaram mecanismos semelhantes, como o Orkut e, recentemente, até o SlideShare. Mas este recurso ganha mais importância na medida em que o consumo de conteúdo e as interações são realizadas nestes espaços. Um estudo recente analisou a “vida média” de um link no Twitter.

No caso desta mídia social, dois modos básicos e mensuráveis pelos quais o público pode interagir com o conteúdo é o RT e o favoritamento. O aplicativo Favstar.fm permite medir os tweets mais retuitados e favoritados. É possível observar como os dois modos são bem delimitados: o RT é utilizado de forma mais intensa para circulação rápida de comentários, piadas, notícias etc, enquanto o favoritamento está mais ligado a aspectos informacionais.

Todos estes aspectos, em determinado grau, hoje podem ser analisados pelo profissional de comunicação com o apoio de softwares e aplicativos. Sejam ferramentas de monitoramento, de análise de rede social ou de processamento de informações sociais, o conteúdo, design, conexões e interações realizadas podem ser resgatados em determinado grau para falar algo sobre as pessoas, o fluxo de informações e as redes.

Os sites de redes sociais podem ser observados de diversos modos, mas uma coisa é certa: a pesquisa acadêmica pode ajudar muito o profissional de comunicação. Muito mais pode ser encontrado na web. Veja, por exemplo: os buscadores de trabalhos Periódicos Capes e Google Acadêmico; os blogs do Grupo de Pesquisa em Interações, Tecnologias Digitais e Sociedade, das pesquisadoras Raquel RecueroDanah Boyd; revistas como Journal of Computer Mediated Communication, Media Culture & Society; e uma lista de repositórios de eventos acadêmicos.

Proposta de Processo de Gerenciamento e Análise da Imagem de Atores Políticos nos Sites de Redes Sociais

Slideshow da apresentação que Nina Santos fez de nosso artigo em parceria no ST Marketing Político, no Confibercom. O artigo será publicado em ebook a ser lançado pelo congresso em breve.

Monitoramento de Redes Sociais: muito mais que uma análise de sentimentos

O artigo “Monitoramento de Redes Sociais: muito mais que uma análise de sentimentos“, de Sérgio Salustiano, é um ótimo artigo em que o profissional explica como os dados que as pessoas publicam nas mídias sociais se tornam “fontes preciosas para construir perfis erelatórios para que empresas possam tomar decisões sobre seus produtos e serviços”, além de discutir e apontar potencialidades, problemas, desafios e motivações para o monitoramento.

Depois de falar de como o monitoramento vai muito além de apenas a análise de sentimentos, Salustiano fala das etapas para um monitoramento eficaz: planejamento; busca do conteúdo; análise das informações; classificação; consolidação; interpretação; análise; relatório.

O autor ainda propõe um método de avaliar o que medir e lista onze motivos para fazer o monitoramento de marcas, como responder a denúncias e reclamações, identificar necessidades do consumidor, calcular ROI, realizar auditoria e outros. Finaliza o artigo falando dos desafios para o monitoramento, que devem ser observados por cada profissional, para que este mercado evolua.

Leia todo o artigo, que pode ser visualizado em seu SlideShare:




Mineração de Dados em Mídias Sociais

O livro Social Network Data Analytics, organizado Charu C. Aggarwal, é composto de 16 artigos que tratam de temas como propriedades estatísticas das redes, descoberta de comunidades, classificação de nodos, algoritmos para análise de influência social, predição de links, visualização, mineração de texto, integração com setores e redes de informação multimídia.

Data Mining in Social Media, escrito por Geoffrey Barbier e Huan Liu, trata da mineração de dados em sites de redes sociais. Como os autores apontam, muitas vezes estes dados são caracterizados por serem extensos, dinâmicos e cheios de ruído. Explicam que mineração de dados é “identificar padrões novos e acionáveis nos dados”. Explicam a utilização de algoritmos, classificação, clustering e outras técnicas. O resumo do artigo:

The rise of online social media is providing a wealth of social network data. Data mining techniques provide researchers and practitioners the tools needed to analyzelarge, complex, and frequently changing social media data. This chapter introduces the basics of data mining, reviews social media, discusses how to mine social media data, and highlights some illustrative examples with an emphasis on social networking sites and blogs.

Ao tratar especificamente da mineração de dados em mídias sociais, dizem que “os dados disponíveis através das mídias sociais podem nos dar insights sobre as redes sociais e sociedades que antes não eram possíveis, tanto em escala quanto em extensão”. Para fins de pesquisa e negócios, os dados podem ser utilizados para entender: detecção de grupos; difusão de informação; propagação de influência; monitoramento e detecção de tópicos; análise de comportamento de grupos; e pesquisa de marketing.

Os autores explicam os conceitos de redes sociais e a visualização através de estruturas de grafos para, em seguida, mostrar aplicações da mineração de dados em sites de redes sociais e redes de blogs. Em relação a estes últimos, falam de métodos de classificação de blogs, identificação de nodos influentes, detecção e mudança de tópicos e análise de sentimento. Em relação aos sites de redes sociais, explicam como funciona a detecção de grupos, perfilação de grupos e sistemas de recomendações. Finalizam o artigo aproximando estas técnicas à práticas de etnografia e netnografia e a mapas de eventos.