A revista de acesso aberto Big Data & Society, editada por Evelyn Ruppert, da Goldsmiths, University of London, foi lançada em 2014 e continua a trazer relevantes reflexões sobre o impacto dos modelos de big data em aspectos sociais.
O artigo “Between technical features and analytic capabilities: Charting a relational affordance space for digital social analytics“, de Anders Koed Madsen, traz uma interessante classificação de variáveis presentes em projetos de digital social analytics. A partir da análise de 8 projetos, o autor discorre sobre duas características tecnológicas que influenciam qualquer aplicação do método.
O primeiro deles se refere aos formatos dos dados distribuídos. Em seus pólos, temos duas possibilidades: structured channeling e adaptative tracking. Os canais que são percebidos como relevantes (por popularidade [como Twitter] ou objetivo [como Reclame Aqui]) são tomados como referenciais para a estruturação de coleta e organização dos dados. Tal postura acaba por definir affordances de ferramentas e potenciais/limites de projetos de digital social analytics. Vejamos, por exemplo, o caso das ferramentas de monitoramento de mídias sociais. Hoje vistas como principal técnica de análise de percepção das imagens das marcas nas mídias sociais, são firmadas, desde 2006~2007, em dados baseados em modelo de stream (fluxo) e real-time possibilitados pela coleta de blogs através de feeds e expandindo para APIs especialmente de Twitter e Facebook. Este modelo direcionou a construção do mercado de monitoramento de mídias sociais, seus tipos de entregas e monetização. Mas cada plataforma possui sua “unidade de conteúdo” com especificidades, especialmente quanto a modalidade de texto e restrição de tamanho.
No outro pólo, o tracking adaptativo tenta perceber os dados online para um referencial único. Estão, relativamente, em pouco número quanto comparados ao modo de estruturação dos canais. O excelente exemplo provido pelo autor é a ideia de link ou conexão. A transformação das relações entre entidades sociais, sejam físicas ou corporativas, em redes de conexões é apontada como a possibilidade final de adaptação dos dados de diferentes plataformas em um mesmo tipo.
A segunda característica descrita pelos autores é a necessidade por automatização. Em determinado grau, a maioria dos projetos de digital social analytics trazem algum tipo de automatização.
No pólo do Following (seguir os algoritmos), Madsen traz como exemplo a aplicação de clustering em uma rede de blogs. A distribuição dos blogs em grupos, uma vez que é baseada no algoritmo, engendra esquemas classificatórios que podem superar os preconceitos dos analistas. Enquanto Training, o autor traz exemplo de nuvem de palavras codificadas cromaticamente a partir de sentimentos vinculados às palavras pela percepção dos analistas em determinado domínio semântico.
Gosto particularmente deste exemplo pois acredito que estamos em um momento de cisão quanto à relação entre análise humana e automatização no mercado brasileiro de mídias sociais. Determinados tipos de automatização são vistos com desconfiança desde a emergência deste mercado no país, o que congelou, de certo modo, a demanda e aprendizado mais amplos sobre técnicas de computação social pelos profissionais. As mudanças na API do Facebook forçarão o preenchimento desta lacuna e superação da falsa dicotomia entre processamento computacional e análise humana, o que torna o artigo especialmente relevante para diversos tipos de stakeholders do mercado.
Não esqueça também de assinar o blog da Big Data & Society: http://bigdatasoc.blogspot.co.uk/