Pontos, Linhas e Métricas #07: explore sua rede no Gmail

[O texto a seguir faz parte de uma série que pode ser visualizada em “Pontos, Linhas e Métricas: introdução à análise estrutural de redes sociais”]

Voltando às postagens da série Pontos, Linhas e Métricas, vou sugerir o primeiro exercício de exploração de redes a partir dos seus próprios dados. Antes de chegarmos aos softwares mais complexos, como NodeXL e Gephi, vou apresentar diversos softwares online de visualização de redes para que vocês possam se habituar a observar os formatos, agrupamentos e relações entre os nós.

Immersion

O projeto Immersion é uma iniciativa do estudante de mestrado no MIT Media Lab Daniel Smilkov (@dsmilkov2) do MIT Media Lab, do pesquisador do grupo Macro Connections do MIT Media Lab Deepak Jagdish (@dj247) e do líder do grupo César Hidalgo (@cesifoti). No site do Macro Connections é possível saber mais e acessar outros projetos do grupo.

Em resumo, o Immersion acessa o histórico do seu Gmail pra coletar os dados de “De”, “Para”, “Cc” e a data de cada email. Assim, a visualização transforma cada email enviado e recebido em uma aresta, onde cada nó representa uma pessoa. As datas permitem a visualização temporal das redes. Ou seja, aqui trata-se de uma rede social ego (centrada no indivíduo) e que pode trazer informações sobre padrões e intensidade da comunicação, via email, do usuário e seus contatos. Um dos principais recursos é a clusterização dos nós (agrupamento dos nós de acordo com suas conexões). Como é explicado no próprio site, trata-se de auto-reflexão, arte, privacidade e estratégia:

“So Immersion is not about one thing. It’s about four. It’s about self-reflection, art, privacy and strategy. It’s about providing users with a number of different perspectives by leveraging on the fact that the web, and emails, are now an important part of our past”.

O vídeo abaixo mostra os bastidores do projeto:

Immersion: Beneath the surface from Deepak Jagdish on Vimeo.

 

Exemplo de Análise

O Immersion, assim como centenas de outros projetos do tipo, é um exemplo do que eu chamo, na minha dissertação, de aplicativos de análise de informações sociais digitais. Hoje, aplicativos como Klout, PeerIndex, TweetStats, You Are What You Like e muitos outros são também utilizados pelas pessoas comuns para entender melhor a si e ao seu contexto social. Afinal de contas, se eu falo muito com uma pessoa através de emails, isto significa a princípio que tenho algum tipo de relação.

Rede 01 – Esta rede corresponde a fase final de meu período de graduação. Observe como os clusters (agrupamentos) são bem próximos, possuem muitas arestas em comum. Os dados estão anonimizados para exibir aqui, mas os maiores nós (o vermelho e o verde na rede abaixo) representam pra mim dois relacionamentos, respectivamente pessoal e profissional, que definem aquele período:

Rede 02 – Esta segunda rede representa a fase de idealização e construção de uma agência. Observem como é ainda mais densa. Os dois maiores nós representam parceiros profissionais e a discrepância em relação aos outros nós são indicadores da prioridade dada, no período, ao projeto:

Rede 03 – Esta fase representa o período de saída da agência e escrita da dissertação. As comunidades de contatos são mais dispersas entre si e bem definidas, pois se multiplicaram. Devido à relativa reclusa e trabalho focado, individual (dissertação), o maior nó é de um relacionamento amoroso. A comunidade azul escura são outros amigos que faziam parte deste círculo social. A comunidade verde tem como maior nó o orientador de mestrado e é composta de outros pesquisadores da pós-graduação.

Os nós vermelhos são de um projeto profissional realizado basicamente através do email. Os nós possuem quase o mesmo tamanho pois foi uma longa discussão através e uma lista de e-mails para a produção de um ebook. Os nós laranjas são os mesmos parceiros profissionais da fase anterior: aqui são menores, numa fase de transição. Os nós marrons representam contatos tanto profissionais quanto pessoais de São Paulo, pois foi uma fase de preparação para a mudança. Os algoritmos de visualização acabam por perceber esta diferença de locais: os clusters acima da metade da figura são de São Paulo, enquanto os de baixo são de Salvador:

Rede 04 – Esta rede representa os primeiros meses em São Paulo. A importância das relações presenciais para os contatos online se confirma: apenas o cluster vermelho e os pequenos nós do cluster marrom (com exceção do maior, também uma ponte) são de Salvador. Os outros clusters são de São Paulo e outras cidades: representam projetos profissionais, grupos de alunos etc. O grupo verde representa novamente a descrição de um ebook. Observe como um dos nós rosa está perto do cluster verde: é um contato profissional que foi responsável por que eu conhecesse o cluster rosa (uma indicação de trabalho). Ou seja, é possível também visualizar a importância estratégica das pessoas enquanto “pontes” sociais.

Rede 05 – por fim, esta rede representa os últimos meses, onde outro redirecionamento pessoal e profissional foi realizado. Os clusters representam pequenos projetos pontuais e grupos de amigos. A grande quantidade de nós isolados é resultado das trocas de e-mails para uma pesquisa em andamento.

Observando os dados de redes sociais extraídos e processados a partir do meu email, realizei uma ação de auto-reflexão sobre meu passado recente. É um tema cada vez mais importante na atualidade, uma vez que mais e mais rastros e traços digitais são armazenados no nosso cotidiano. Em artigo com o José Carlos Ribeiro (RIBEIRO e SILVA, 2012), propusemos o seguinte diagrama para mostrar a dinâmica envolvida em dois tipos de dinâmicas: visualização comparativa e visualização temporal abrangente.

No caso do Immersion, tratamos da segunda: a coleta e apresentação dos dados traz dados e informações sobre padrões de interação que não seriam possíveis de serem analisadas por uma pessoa comum em outros contextos. Além disso, o tipo de visualização estrutural das redes é um tpo de recurso cognitivo também próprio da contemporaneidade: vinte anos atrás seria praticamente impossível a uma pessoa comum visualizar-se deste modo.

 

Exercício

Provavelmente a descrição de minhas redes ficou vaga, devido ao caráter anônimo e os poucos detalhes resultantes disto. Então, o melhor a ser feito é você explorar sua própria rede. O software, como vimos acima, permite realizar esta análise histórica sobre os seus próprios dados.

Então, para experimentar melhor as possibilidades, consolidar aprendizados e extrair insight, recomendo que abra sua própria rede e se pergunte o seguinte:

  • Quais são os grupos que você consegue identificar? A ferramenta dividiu bem seus ambientes sociais (trabalhos, cidades, grupos de amigos, escolas, universidades etc)?
  • Quais são as díades mais intensas? Por quê?
  • Que tríades representam algo significativo pra você?
  • Compare o ano inteiro de 2011 e o ano inteiro de 2012. Quais as diferenças? Quais pessoas estão mais presentes nas trocas de e-mails? Quais sumiram de um ano para o outro? Por quê?
  • Tente dividir o período coletado em fases, como eu fiz. As diferenças nas redes dizem o quê a você?

Em breve, publicações sobre sociometria e exploração de suas próprias rede no Facebook.

 

Referências

RIBEIRO, José Carlos; SILVA, Tarcízio. Self, Self-Presentation, and the Use of Social Applications in Digital Environments. In: LUPPICINI, Rocci. Handbook of Research on Technoself: Identity in a Technological Society. Idea Group,U.S., 2012.

Pontos, Linhas e Métricas #6: Georg Simmel

[O texto a seguir faz parte de uma série que pode ser visualizada em “Pontos, Linhas e Métricas: introdução à análise estrutural de redes sociais”]

Georg Simmel e os aspectos numéricos dos grupos

Georg Simmel foi um sociólogo alemão que viveu de 1858 a 1918 e pensou o impacto da metrópole na vida social, o papel do dinheiro na sociedade e aspectos “formais” das relações sociais. Desse modo, influenciou diversas correntes teóricas e modos de ver a sociedade, tal como o interacionismo simbólico e a análise estrutural das redes sociais.

Em um dos seus ensaios, “The Metropolis and Mental Life”, Simmel discute em 1903 o impacto do excesso de estímulos que o homem passou a receber, diariamente, devido à efervescência das cidades gigantescas. Um trecho de seu texto poderia, facilmente, hoje estar presente em uma das muitas reclamações sobre o “excesso informacional” das novas tecnologias:

“A fundação psicológica sobre a qual a individualidade metropolitana está erigida é a  da intensificação da vida emocional devido à veloz e contínua mudança de estímulos internos e externos. […] Sua mente [humana] é estimulada pela diferença entre as impressões presentes e aquelas que a precederam” (Simmel, 1903, p.11)

Neste ensaio Simmel já apresenta em outros trechos a ideia de que os aspectos quantitativos, ou numéricos, da vida social influenciam as possibilidades sociais do indivíduo – seus horizontes são ampliados cultural, intelectual e economicamente – e de certa forma se estabelecem novos tipos de individualidade, uma vez que as referências grupais clássicas (religião e família) agora dividem mais espaço com outras que ganham mais importância, como grupos relacionados a trabalho, atividades culturais e sociais etc.

Ao falar dos Aspectos Quantitativos do Grupo (“Quantitative Aspects of the Group”), Simmel discute aspectos estruturais dos grupos, como seu tamanho, sub-divisões, relações inter e extra-grupais e os tipos básicos de relações: díades e tríades. Ele acreditava, por exemplo, que “um grupo que tem suas atividades totalmente sistematizadas e racionalizadas é sempre um grupo pequeno. O apoio produtivo que necessita em estágios mais avançados de civilização tem de vir de grupos maiores vizinhos para padrões de vida satisfatórios” (WOLFF, 1950, p.89).

Como explicam Alexandra Marin e Barry Wellman, Simmel “articula a premissa de que os laços sociais são primários. Ao invés de ver as coisas como unidades isoladas, elas são melhor entendidas como estando nas interseções de relações particulares e derivando suas características definidoras das interseções destas relações” (MARIN & WELLMAN, 2009, p.6).

Pra Simmel, a díade contem o esquema e material para formas sociais mais complexas. Segundo o autor “a diferença entre a díade e grupos maiores consiste no fato de que a díade possui uma diferente relação para cada um dos seus dois elementos do que grupos maiores possuem com seus membros. Embora, para o outsider, o grupo consistente de dois pode funcionar como uma unidade autônoma, geralmente não é assim para os participantes. Antes, cada um dos membros sente-se como confrontado apenas pelo outro, não por uma coletividade sobre ele. A estrutura social aqui se baseia imediatamente em um e outro dos dois, e a dissidência de um destrói o todo” (p.123).

Em termos de análise de redes sociais, a representação mais simples desta expansão da díade à tríade poderia ser a seguinte:

Para entender melhor a díade, Simmel propõe a contraposição desta à tríade. Nesta última, cada elemento se torna também um mediador entre os outros dois. Entre uma relação de A e B numa tríade, também está implícita de forma indireta a relação dos dois em comum a C. “A relação indireta não apenas fortalece a direta. Ela também pode perturbá-la. Não importa o quanto a tríade seja próxima, existe sempre uma ocasião na qual dois dos três membros consideram o terceiro como um intruso”. Em trabalho sobre a tríade, Kitts e Huang explicam que Simmel via a tríade como uma unidade fundamental de análise sociológico. Explicam que “por exemplo, entre três atores sociais/organizacionais A, B e C, o ator A pode ter uma relação diádica com C mas também ter uma relação indireta com C através de B. Dessa forma, B pode alterar a força ou natureza da relação entre A e C, assim solidificando uma aliança ou mediando um conflito. Se a e C não interagem diretamente, B pode ser uma ponte entre eles e derivar poder dessa posição intermediária”.

Apesar de hoje, facilmente, coletarmos e visualizarmos redes com milhões de atores, o início do pensamento sobre a estrutura das redes começou, obviamente, pelas suas formas mais básicas como díades e tríades. E todas as redes sociais podem ser vistas de certo modo como uma coleção de díades e tríades que se somam e apresentam formas mais complexas. Uma das propriedades básicas das redes sociais que foi comprovada ao longo do tempo é que, se um ator X possui laços fortes com Y e possui laços fortes com Z, é muito provável que Y e Z também possuam laços fortes entre si, um fenômeno chamado transitividade.

Neste texto conhecemos um dos sociólogos que precederam o desenvolvimento da análise de redes sociais. Nos próximos textos, veremos o surgimento de análises mais explicitamente topológicas, como a “Sociometria” de Jacob Moreno.

Referências

KITTS, James A; HUANG. “Triads.” Encyclopedia of Social Networks, George Barnett, Editor. New York: Sage Publications, 2010.

MARIN, Alexandra; WELLMAN, Barry. Social Network Analysis: an introduction. Handbook of Social Network Analysis.Edited by Peter Carrington and John Scott. London: Sage, 2010

SIMMEL, Georg. The Metropolis and Mental Life. 1903.

WOLFF, Kurt (ed.). The Sociology of Georg Simmel. Illinions: The Free Press, 1950.

Pontos, Linhas e Métricas #04: laços / arestas

[O texto a seguir faz parte de uma série que pode ser visualizada em “Pontos, Linhas e Métricas: introdução à análise estrutural de redes sociais”]


Linhas | Laços | Arestas

Para operacionalizar e mostrar como os nós se relacionam, são utilizadas nas visualizações “linhas” que representam ligações, conexões ou relações de algum tipo. Estas são referenciadas por diversos nomes, como laços (links), arestas (edges) etc.

Os laços podem ser de diferentes Tipos. A flexibilidade do que pode ser considerado um laço ou ligação é muito grande, por isso a análise estrutural de redes se aplica em muitos domínios diferentes do conhecimento e em diferentes tipos de problemas. Como vimos no post que definiu análise estrutural, a perspectiva de redes se aproxima das concepções de sistema ao observar elementos que fazem alguma coisa em outras. Isto significa que qualquer tipo de interação entre dois elementos, a rigor, pode ser considerado um tipo de aresta.

Transmite-se, troca-se, estabelece-se ou cria-se algo nesta relação entre dois elementos que, por sua vez, estão ligados a outros. Isto é o que compõe uma rede e o motivo da metáfora de rede ser tão útil para explicar tantos fenômenos. Por exemplo, na análise feita por engenheiros de malhas energéticas, os elementos (sub-estação, transformador etc) são ligados por linhas que transmitem energia elétrica. Uma rede de transporte como a rede de aeroportos de um país pode ser vista como diversos aeroportos (nós) que estão ligados pelos vôos realizados entre estes.

Tanto no caso da malha energética quanto no caso dos aeroportos, o que está sendo trocado é simples de ser medido. Tanto energia elétrica quanto aviões podem ser contados de modo exato, são facilmente quantificáveis. Mas, no caso da análise de redes sociais, as trocas são aparentemente bem menos quantificáveis. O que é ser amigo de outra pessoa? O que é admirar outra pessoa? Como coletar dados de trocas sociais é um dos grandes desafios metodológicos que deve ser pensado caso a caso. Entender as principais variáveis envolvidas nos laços sociais ajudará nesta tarefa.

Nas pesquisas em torno de redes sociais, entre os laços mais comuns temos os de amizade e conhecimento. Podemos avaliar muitas coisas a partir deste tipo de laço, que é socialmente estabelecido. Retomando a rede que utilizamos no último post, podemos observá-la novamente, desta vez contando o número de laços sociais. Os 13 nós somam, entre si, 18 laços:

Para cada rede social que vai sendo construída ou revelada, é preciso identificar quais são os tipos de conexões que serão consideradas. Em análise de redes sociais no contexto organizacional, por exemplo, um método simples de coleta de dados envolve perguntar “Se você tiver que tomar uma decisão difícil, quais são os três primeiros colegas que você consultaria?” ou “Quais são os colegas que mais te ensinaram coisas úteis ao seu trabalho?”. Construir as redes em torno destes tipos de trocas permite gerar muitas informações para projetos de inovação, endomarketing ou mesmo na seleção de novos líderes formais.

Mas as conexões não são necessariamente recíprocas, especialmente nas redes sociais.  Alguém que você admira talvez nem o conheça. A relação professor x alunos é uma na direção professor -> aluno e outra bem diferente, e mais numerosa, na direção aluno -> professor. Então os laços podem ser caracterizados de acordo com sua Direção.

Existem laços Não-Dirigidos, como o laço de casamento (uma pessoa é casada com a outra e vice-versa, necessariamente), ou o laço fraternal (uma pessoa é necessariamente irmã de seu irmã/o, perdoem-me a tautologia), a co-autoria de um documento, ou ainda alguns tipos de amizades (se A é amigo de B, então B é amigo de A).

Mas também existem muitos laços Dirigidos: como no exemplo citado, se uma pessoa é professor da outra, provavelmente o inverso não é verdadeiro. Mas também existem relações dirigidas que ocorrem nas duas direções. Por exemplo, eu envio diversos e-mails a um contato profissional e este mesmo contato profissional também me envia diversos e-mails. A depender dos objetivos da análise, podemos considerar dois laços aqui (um indo de mim a meu interlocutor e outro do meu interlocutor a mim) ou um laço não-dirigido, uma vez que a troca de e-mails é recíproca.

Estes tipos de laços também são comumente chamados de Orientados (Dirigidos) ou Não-Orientados (Não-Dirigidos).

As estruturas hierárquicas tradicionais, por exemplo, pressupõe que a relação de autoridade e tomada de decisão são assimétricas e seguem a direção vertical dos postos superiores ao inferiores. Mas, como a maioria de vocês deve saber e presenciar, a realidade é muito diferente do pretendido pelos dirigentes. Abaixo um exemplo:

Digamos que aquela rede que vimos mais acima é de um grupo de pessoas. Se fizéssemos o exercício de perguntar a estas pessoas, por exemplo, “quem tomou o primeiro passo para o início da amizade?”, poderíamos dispor cada laço da seguinte forma abaixo:

Observem que as seis conexões de Carlos foram originadas por ele. Ou seja, o fato de Carlos ser a pessoa mais popular (com mais conexões), neste caso pode ser explicada por uma característica pessoal de iniciativa. Neste exemplo hipotético, começamos a entender um pouco a dinâmica social deste grupo de pessoas.

No contexto das mídias sociais a direção também é muito importante. Imaginem as relações básicas entre blogs, perfis no Facebook e Twitter. Em blogs, podemos considerar um link que pus na minha sidebar como um laço originando aqui neste endereço em direção a outro blog. Mas, possivelmente, este blog que recebe o link não criou um link em nenhuma página para meu blog. Aqui temos uma relação dirigida. O princípio básico que rege o PageRank é uma aplicação disto e pode ser explicado por métricas de redes.

No Facebook, o principal tipo de relação entre os perfis (apesar de hoje existirem outras) é o “adicionar como amigo”, que pressupõe uma relação real ou potencial de amizade entre as duas pessoas representadas. Deste modo, quando a pessoa A é amiga da pessoa B, isto também significa que a pessoa B é amiga da pessoa A. Já no Twitter a relação é de “seguir”. Quando um perfil X segue um perfil Y, isto não significa que o perfil Y segue o perfil X. Em alguns casos existe a reciprocidade, mas observem que aqui temos dois pontos de dados: X segue Y e Y segue X são duas coisas diferentes. Já no caso do Facebook, o perfil A ser amigo do B equivale a perfil B ser amigo de A.

Mas um mesmo tipo de relação entre X e Y pode não ser tão intensa quanto a relação entre Y e Z. Afinal de contas, você pode comparar a relação social que você possui com seu amigo a uma que você tem com um colega estritamente profissional? Desse modo, o Peso das arestas pode variar de acordo com a intensidade do laço ou troca que está sendo observada.

Abaixo um exemplo de análise realizada em texto. Mark Newman analisou a co-ocorrência de determinadas palavras em matérias jornalísticas da Reuters em outubro de 2001. Observem abaixo como alguns termos estão mais próximos, devido à intensidade de co-ocorrência. Os laços e sua intensidade são essenciais em algoritmos de agrupamento, como também pode ser visto no exemplo abaixo (cada cor representa um grupo):

 

Quando falamos de redes dinâmicas – e as redes sociais geralmente o são -, o peso ganha mais importância. Vamos imaginar que estamos analisando redes no Twitter. Podemos pegar a rede entre a lista de seguidores de um perfil para identificar as afiliações e conexões estabelecidas, certo? Isto pode gerar bastante informação, como veremos adiante. Mas a análise das conversações, ou seja, da comunicação realmente viva entre os perfis pode ser mais eficaz. E, aqui, a intensidade de interações entre as pessoas ali representadas é muito importante.

No caso do Twitter, é possível facilmente analisar uma conversação em torno de um tópico a partir de dois tipos de laços: quem retuita quem e quem menciona quem. No primeiro caso, estamos falando de laços que denotam geralmente concordância de opinião. No segundo, trata-se de laços que representam que alguém está sendo falado – literalmente mencionado – por outrem. Quando se trata de um tópico específico e se comprime as várias interações em arestas com peso (quanto maior o número de RTs ou mentions, maior o peso da aresta), é possível ver redes como as duas abaixo. São duas redes simplificadas (perfis que ganharam mais de 10 RTs e mais de 5 mentions) durante parte do evento Social Media Brasil 2012, em cima da hashtag #smbr2012. Observem como alguns o peso dos laços ajuda a direcionar a leitura das redes:

Exemplos de Redes [simplificadas] em torno de tópico (#smbr2012) construídas sobre dois tipos de laços – retweets e mentions

Então, como vimos os nós e laços podem ser caracterizados por um grande rol de minúcias. Aprendemos que também é importante atentar para o que flui na rede, em que direções flui e com que intensidade. Quando um laço é feito ou identificado, o que está sendo trocado pelos nós? Como uma informação é disseminada? Quais são os nós que mais se engajam naquela atividade? Entendendo melhor os laços começaremos a conseguir responder estes tipos de perguntas em nossas pesquisas.

Nos próximos textos da série, começaremos a resgatar um pouco da história dos avanços da análise estrutural de redes sociais.

Referências Bibliográficas

NEWMAN, Mark. Analysis of weighted networks. Physical Review E 70: 056131.doi:10.1103/PhysRevE.70.056131
PAGANI, G. A.; AIELLO, M. The power grid as a complex network: a survey. Power, pp. 1–29, 2011

Pontos, Linhas e Métricas #03: nós / vértices

[O texto a seguir faz parte de uma série que pode ser visualizada em “Pontos, Linhas e Métricas: introdução à análise estrutural de redes sociais”]

Neste e no próximo texto vamos falar dos dois principais elementos das redes sociais, os nós e os laços. Ou, como nos referimos de forma super simplificada, nos referindo à sua visualização, os pontos e linhas. Mas, antes de qualquer coisa, é preciso lembrar o seguinte. Qualquer rede é uma representação convencional do que se está sendo observado. Manejar, construir e analisar redes envolve atos de escolha sobre o que será analisado.

Desta forma, uma análise pode considerar apenas uma pequena rede na qual se considera um nó cada pessoa e um laço cada relação de amizade. Outra, por sua vez, pode considerar cada nó um artigo acadêmico e um laço as referências bibliográficas. Tudo vai depender dos objetivos e informações buscadas. Para entendermos estes elementos básicos, precisamos entender bem o que são nós e laços. Vamos começar pelos primeiros:

Pontos | Nós | Vértices

Como puderam perceber, os nomes utilizados aqui para falar dos nós (e na próxima seção para falar das ligações) são muitos: pontos, nós, vértices…. Geralmente, existe pouca distinção entre um termo ou outro e, na maioria dos casos, não importa. Mas, como Barabási (2012, p.26) nos explica, na ciência das redes se fala de redes, nós (nodes) e laços (links), enquanto na teoria dos grafos se fala de grafo, vértices (vértices) e arestas (edges). A teoria dos grafos, proveniente da matemática, é uma das bases para a ciência das redes e sua análise estrututural, mas falaremos dela em uma postagem mais à frente.

Aqui, voltando aos nós, devemos pontuar que, na análise estrutural de redes sociais, os elementos analisados são aqueles que podem ser individualizados e representam algum ator social, grupo social ou produto realizado por estes. O conceito de nó é extremamente simples, como podemos ver nas definições que são dadas a estes, geralmente durante a própria apresentação do que é uma rede:

“Um grafo consiste de um conjunto de objetos, chamados nós, com certos pares destes objetos conectados por ligações chamadas arestas” (EASLEY & KLEINBERG, 2009, p.31);

“Nós são os atores individuais dentro das redes, enquanto laços são as relações entre os atores” (PASSMORE, 2011, p. 1);

“Enquanto os nós são geralmente representados pelos atores envolvidos e suas representações na internet […], as conexões são mais plurais em seu entendimento” (FRAGOSO, RECUERO e AMARAL, 2011, p.16);

“Vértices, também chamados de nós, agentes, entidades ou itens, podem representar muitas coisas. Frequentemente representam pessoas ou estruturas sociais como grupos de trabalho, times, organizações, instituições, estados ou mesmo países. Em outros casos eles representam conteúdo como web pages, tags keywords ou vídeos. Eles ainda podem representar locais ou eventos físicos ou virtuais. (HANSEN, SCHNEIDERMAN & SMITH, 2011, p.34).

Observe, na imagem abaixo, uma pequena rede. Cada um dos pontos serve para representar uma pessoa, por exemplo:

Cada um destes nós representa um dos elementos da rede. No caso, é uma rede construída em torno de atores sociais, pessoas. Nesta rede são 13 nós ao todo, como etiquetados abaixo:

É uma rede, com 13 elementos, com seus laços visíveis e que pode ser analisada de acordo com os nossos objetivos, por exemplo: encontrar que pessoas servem de “pontes” entre os grupos da rede, descobrir qual pessoa é mais conectada ou analisar sua densidade.

Como vimos, a análise estrutural de redes pode se debruçar sobre as redes e ligações entre diversos tipos de coisas: elementos químicos, servidores, aeroportos etc.  No caso da análise estrutural de redes sociais, trabalhamos com pessoas, grupos e coisas que podem representar pessoas ou aspectos das pessoas.  Às vezes, os nós podem ser tais objetos, que estão ligados ou desconectados entre si devido a outros parâmetros. O exemplo abaixo é de um projeto da Amazon Labs, que mostra a rede de co-ocorrência de compras em torno de um determinado livro.

 

O programa de visualização acima, produzido por Andrei Kashcha, cria um laço para cada livro recomendado pela Amazon no quesito “livros comprados juntos”. Em outras palavras, para cada livro no site, é criado um nó que tem laços com outros a partir das compras realizadas por usuários reais. Não existe um laço social propriamente dito entre as pessoas que nem sequer estão representadas diretamente nesta rede. Mas os laços apresentados são fruto de milhares de ações sociais (consumo) e, portanto, a rede pode ser considerada fruto das dinâmicas sociais e nos permitem apreender algumas tendências.

Voltando aos nós que representam diretamente atores sociais, podemos adicionar atributos aos nós analisados. Não é algo obrigatório, pois como enfatizamos no último post e estamos demonstrando, a simples estruturação dos nós em formato de rede, através das ligações, gera uma amplitude de informações. Mas os atuais programas de coleta e armazenamento de dados de redes permitem adicionar variáveis personalizadas. Por exemplo: idade, sexo, classe, categoria de cliente, etc. Novamente utilizando aquela rede como exemplo, digamos que desejamos mostrar visualmente o gênero da rede, utilizando as cores historicamente associadas aos conceitos de homem e mulher:

A visualização acima, extremamente simples, enfatiza algo muito importante para a análise de redes: é possível manipular as características visuais de todos os elementos das redes para mostrarmos as informações que desejamos. Neste caso, utilizamos duas cores (azul e vermelho) para representar uma codificação binária (homem/mulher). Mais para a frente, mostraremos como manipular tamanho, cor, formato, legendas, posição, opacidade e outros elementos.

Outro exemplo de dados que podem estar vinculados a cada um dos nós são os dados específicos dos perfis de mídias sociais, tais como Facebook e Twitter. Observem as imagens a seguir, que representam agrupamentos em rede e a wordcloud respectiva das bios:

Estas imagens são exemplo fruto de uma das etapas executadas em projetos de Perfilização de Público em Mídias Sociais (Social Media Public Profiling), uma metodologia que criei e explicarei mais à frente, como uma das aplicações da análise de redes sociais. Durante uma das etapas de coleta de dados, realizamos agrupamento (clustering) dos perfis de acordo com algoritmos de rede. Em seguida, extraímos e agrupamos as bios dos membros de cada grupo, para identificar um primeiro nível de afiliação. Isto foi possível porque cada perfil no Twitter, que aqui foi considerado um laço, traz alguns dados adicionais que foram analisados – neste caso, o texto declarativo do campo Bio.

Em resumo: os nós podem representar pessoas, organizações e objetos; podemos adicionar dados relacionais ou de atributos nos nós; e estes dados podem ser calculados e visualizados nas redes. Mas os nós só ganham o status de tais e suas importâncias em rede quando existem os laços, descritos a seguir.

Referências Bibliográficas

BARABÁSI, Albert-Laszló. Network Science. 2012.

FRAGOSO, Suely; RECUERO, Raquel; AMARAL, Adriana. Métodos de Pesquisa para Internet. Porto Alegre: Sulina, 2011. [compre]
HANSEN, Derek; SHNEIDERMAN, Ben; SMITH, Marc. Analyzing Social Media Networks with NodeXL. Burlington: Morgan Kaufamman, 2011. [compre]

PASSMORE, David. Social Network Analysis – Theory and Applications. Online, 2011.

EASLEY, David & KLEINBERG, Jon. Networks, Crowds and Markets: Reasoning about a Highly Connected World. Cambridge University Press, 2010.

12 Livros para o profissional de mídias sociais ler em 2013 – parte 4

O último post desta série (ver partes 1, 2 e 3) está relacionado ao projeto “Pontos, Linhas e Métricas“: indico aqui três livros essenciais para quem deseja conhecer melhor a análise estrutural de redes sociais.

Análise Estrutural das Redes Sociais, de Vincent Lemieux e Mathieu Ouimet é um livro mais tradicional sobre o tema, escrito por professores do departamento de Ciência Política da Universidade de Laval, no Canadá. No livro se aprofundam em conceitos sobre redes sociais e análise estrutural, técnicas de recolha e tratamento de dados, teorias explicativas que podem ser utilizadas na análise e ainda sete estudos de caso. Todos os casos analisados são de redes “offline”, com coleta de dados também offline, trazendo uma ampla variedade de questões de pesquisa: relações de parentesco, rede sociométrica, capital social, redes de apoio, redes de mobilização, redes de empresa e redes de política pública. É um excelente ponto de partida para quem deseja se aprofundar no tema.

Já uma indicação três-em-um é dos livros dos pesquisadores Albert-László Barabási, Duncan J Watts e Mark Buchanan, respectivamente: Linked, Nexus e Seis Graus de Separação. No Brasil, não por acaso, as três publicações são editadas pela Editora  Leopardo. Os três autores são físicos e procuram mostrar como as dinâmicas de rede estão presentes em praticamente todos os fenômenos naturais e sociais. Barabási, inclusive, posteriormente lançou o livro Bursts – The Hidden Pattern Behind Everything We Do ampliando o debate. Recomendo esta palestra que ele realizou no authors@google.

Porém, destaco aqui o Linked – A Nova Ciência dos Networks, pois Barabási conseguiu gerar uma repercussão maior. Linked é um daqueles livros sobre ciência que procura ser o mais palatável possível, alcançando o grande público. Desse modo, o estilo ficcionalizado, repleto de histórias e anedota ajuda no entendimento. Nos capítulos, explica os principais temas que conseguem alcançar a imprensa, como “seis graus de separação”, “regra 80/20”, “ricos ficam mais ricos” etc.

Por fim, Analyzing Social Media Networks with NodeXL – Insights from a connected world é um excelente manual de como realizar análise de redes sociais com dados extraídos de mídias sociais: Twitter, fóruns, Wikipedia, Facebook e listas de emails. Foi escrito por três dos protagonistas no projeto que criou e desenvolve a ferramenta NodeXL, que o leitor deste blog aprenderá a usar em muito breve.

O livro é dividido em três partes. Na primeira, uma ótima introdução à análise de redes sociais. Em seguida, um tutorial do NodeXL, mostrando as funções básicas, como calcular e visualizar redes, preparo e filtro de dados e técnicas de clustering e agrupamento. A terceira parte, que é maior, mostra na prática como utilizar o NodeXL para gerar informação, com estudos de caso sobre email, fóruns, Twitter, Facebook, hyperlinks, Flickr, YouTube e Wiki.

Bom, estas foram as indicações de leituras para 2013. Para quem estiver acompanhando o projeto “Pontos, Linhas e Métricas“, estas últimas indicações serão especialmente úteis na nossa jornada. Um bom 2013 cheio de conteúdo pra você!