[Publiquei originalmente no blog do IBPAD – confira lá este e outros textos meus e dos demais professores]
Iniciando a série de postagens sobre capítulos do livro Handbook of Social Media Research Methods, vamos falar de um dos textos dedicados à pesquisa qualitativa que usa, deliberadamente, o termo small data em seu título. Merece ser o primeiro também para chamar atenção para os procedimentos metodológicos necessários em qualquer pesquisa e monitoramento de mídias sociais – que muitas vezes são esquecidos por ansiosos que perseguem os novos termos da onda.
Small Data, Thick Data: Thickening Strategies for Trace-based Social Media Research foi escrito por Guillaume Latzko-Toth, Claudine Bonneau e Mélaine Millette, pesquisadores da Université Laval e Université du Québec à Montréal – ambas do Canadá. O objetivo do capítulo é ir além da infrutífera cisão entre quanti-quali ou big-small data, buscando reduzir o “fôlego” dos dados (breadth) em prol de sua profundidade – ou thickening – engrossamento.
Os autores explicam que o termo se assimila a ideias de thick data do Geertz (1973) ou rich data do Becker (1970). O conceito de thickening usado no capítulo vem de Tricia Wang
“Thick data é o oposto de ‘Big Data’; é a cola pegajosa que é difícil de quantificar – emoções, estórias, visões de mundo – o que se perde no processo de normalização, padronização, definição e clustering que torna os datasets massivos analisáveis por computadores” (WANG, 2016: online)
Assim, a ideia de thick data se aproxima das ideias de etnografia online e netnografia (Hine, 2015; Kozinets, 2010). Ao definir small data, os autores enfatizam a ideia de manejabilidade (manageability): uma quantidade de pontos de dados que é pequena demais para ser representativa no sentido estatístico e pequena o suficiente para ser gerenciada por um time pequeno de analistas humanos. A rigor, trata-se da grande maioria dos casos de estudos de dados em mídias sociais em empresas e agências.
São três camadas essenciais para o engrossamento dos dados: uma camada de informação contextual, que dá conta das affordances técnicas e convenções culturais que dão forma às práticas online; uma camada de “descrições grossas” sobre as práticas sendo estudas, os produtos sociais a partir das perspectivas dos vários atores envolvidos; e uma camada de entendimento dos significados das experiências sendo estudadas – incluindo a interpretação dos próprios envolvidos.
A partir desse entendimento, os autores propõem três tipos de estratégias de data thickening: entrevista baseada em rastros e traços nas mídias sociais; coleta manual de dados; e observação ágil de longa duração.
Entrevista baseada em rastros e traços nas mídias sociais – Trace Interview
Aqui a ideia é convidar os participantes/sujeitos de pesquisa a refletir sobre seus próprios dados nas mídias sociais. Usando aplicativos de análise de informação social disponíveis largamente como Twitonomy, Tweetstats, Sociograph, Digital Footprints ou outros, o entrevistado pode se confrontar com seus próprios padrões de interação ou dados resgatados para refletir e falar sobre suas práticas online.
A utilização de sociogramas simples – criados de forma mista analógica e digital é um recurso comum, como mostrou Elizabeth Dubois em seu metodologia, citada pelos autores:
Coleta Manual de Dados
Demonizar a coleta manual de dados fez com que muitos pesquisadores e analistas confiassem demais na coleta baseada em palavras-chave, deixando de lado o potencial de se estudar elementos para além do texto, por exemplo. Escolha de imagem de avatares e “capas” e a posterir análise de seus elementos, muito úteis para a construção de personas – é um exemplo de coleta manual relevante.
Mesmo em termos de publicações – tweets, postagens, comentários – , a coleta manual a partir da navegação do pesquisador, usando de conceitos de bricolagem e serendipidade, pode expandir o horizonte e quebrar com os limites consciente e inconscientemente impostos pelo escopo do analista.
Observação ágil de longa duração – Agile long-term online observation
Por fim, com o conceito de observação ágil de longa duração, os autores vão tratar da necessidade de seguir os sujeitos de pesquisa através de diversas comunidades e plataformas. A agilidade é essencial para transformar a observação contínua dos fenômenos e interações sociais em novos escopos de pesquisa, configuração de ferramenta e registros de dados. As menções a eventos exógenos, conteúdos e memes em outras plataformas são pistas para o pesquisador encontrar novas referências e caminhos a percorrer para o entendimento das comunidades sendo estudadas.
A seção seguinte do capítulo traz estudos de caso de cada uma das estratégias citadas acima. Para as entrevistas baseadas em traços, os pesquisadores relatam como os participantes descreveram as pessoas e relacionamentos em suas timelines – com várias informações que não seriam descobertas por um pesquisador isolado daquele contexto social. Para a segunda estratégia, os autores falam sobre pesquisa em torno do fenômeno Working Out Loud (relatos do cotidiano de trabalho através de tweets). O monitoramento de palavras-chave foi o passo inicial para, em seguida, a coleta manual permitir registrar o contexto de publicação de cada tweet, para cada usuário. Finalmente, um estudo sobre a comunidade francófila do Canadá foi objeto do terceiro relato de caso, resgatando o mapeamento realizado pelos pesquisadores através da metodologia de observação ágil de longa duração.
Os autores concluem o capítulo sublinhando três características das metodologias e casos estudados: contextualidade, temporalidade e flexibilidade. O entusiasmo com os métodos digitais de pesquisa não podem se restringir a suas capacidades de automatização, aplicação de algoritmos e procedimentos padronizados. Aquelas características da thick data só poderão ser alcançadas com olhares qualitativos de pesquisadores imersos em seus objetos de pesquisa.
Referências
Becker, H. S. (1970) Sociological Work: Method and Substance. New Brunswick, NJ: Transaction Books
Dubois, E. and Ford, H. (2015) ‘Trace interviews: An actor-centered approach’, International Journal of Communication, 9(25): 2067–2091.
Geertz, C. (1973) Interpretation of Cultures: Selected essays. New York: Basic Books.
Hine, C. (2015) Ethnography for the Internet: Embedded, Embodied and Everyday. London: Bloomsbury Publishing.
Kozinets, R.V. (2010) Netnography: Doing Ethnographic Research Online. London: Sage.
Latzko-Toth, G., Bonneau, C. et Millette, M. (2017). Small data, thick data : thickening strategies in trace-based social media research. In: A. Quan-Haase et L. Sloan (dir.). The SAGE handbook of social media research methods (p. 199–214). Thousand Oaks, CA : Sage Publications.
Wang, T. (2016, January 20) ‘Why Big Data Needs Thick Data’, Ethnography Matters (Medium channel) (https://medium.com/ethnography-matters/why-big-data-needs-thick-data-b4b3e75e3d7#.y9plmare1)