Interrogando Plataformas e Algoritmos Digitais

Acabou de ser publicado o ebook da edição 2018 do Congresso Nacional de Estudos Comunicacionais da PUC Minas Poços de Caldas. Fui um dos conferencistas e apresentei a palestra Interrogando Plataformas e Algoritmos Digitais. A publicação inclui um resumo da palestra que transcrevo abaixo logo depois do slideshow utilizado (confira também no ResearchGate). Ao final do post, referências e como citar.

A crença tanto em que os algoritmos estatísticos e softwares são neutros quanto a crença de que são substitutos da ciência são erradas em dimensão comparável apenas à sua aceitação por um número cada vez mais crescente de grupos sociais filiados à ideais neoliberais e tecnocráticos de eficácia e otimização de processos. Estas presunções de neutralidade dos algoritmos e sistemas automatizados em campos da comunicação, direito, segurança e políticas públicas (SILVEIRA, 2017) impactam efetivamente indivíduos e comunidades de modo relativo à distribuição de poder quanto às classes, gênero, raças e grupos sociais que os constroem e gerenciam. Quanto ao aspecto de racialização, podemos falar de uma opacidade dupla. De um lado os algoritmos – e a tecnologia de modo geral – são vistos como neutros, como se fossem construídos, desenvolvidos e performados independente do contexto e pessoas envolvidas. De outro, a ideologia da negação e invisibilidade da categoria social “raça” na sociedade como um todo impede consensos e avanços quanto à justiça e equidade de representação.

Esta construção possui tanto impactos diretos quanto indiretos, tal como o gap de capacidade de interpretação da realidade social, demográfica e política contemporâneas. Ecossistemas de plataformas e infraestruturas digitais como Google, Amazon, Facebook e Apple (chamados pelo acrônimo GAFA) construíram capacidades de análise de dados internos e externos que ultrapassam em muito o potencial de universidades de ponta e até de estados. E tudo isto sem as prerrogativas de transparência e accountability exigidas pelas populações da maioria das democracias. Investigar e entender os impactos de algoritmos e plataformas na democracia e nas populações é um desafio ainda mais – aparentemente – intransponível.

Estas perspectivas neoliberais ativistas tem sido centrais no reforço de lógicas que são “antidemocratic, anti-affirmative-action, antiwelfare, antichoice, and antirace discourses that place culpability for individual failure on moral failings of the individual, not policy decisions and social systems”, inclusive em esferas tecnológicas (NOBLE, 2018, pos.2781). A opacidade dos sistemas é vista de forma acrítica, desde que não traga malefícios para o sujeito em sua individualidade e fins pragmáticos. E quando acontece são vistas como responsabilidade do próprio indivíduo que deveria ser “gerente de si mesmo”, como acontece com os sistemas de autogestão de escores de créditos, cada vez mais pervasivos. Impactos no social e no comunitário são ignorados. A legitimidade das “data-driven decision-making hinges not only on the presumed objectivity of its methods, but on the unquestioned acceptance of productivity, performance, merit” (RIEDER, 2016a, p.51). É preciso, então, ver as atuais práticas em torno de big data e análise pervasiva dos indivíduos com olhares multiculturais. Os dados, como “a medium or representational form and envelops data science within a cultural matrix. Data criticism also tackles data science’s idealistic view of data head-on, in addition to its self-proclaimed democratic leanings and liberalism” (BEATON, 2016, p.368).

A chamada à crítica dos dados e plataformas vai ao encontro do que Dardot e Laval (2017) diagnosticam como uma falta de compreensão das relações entre as condutas dos neossujeitos e as formas de controle, vigilância e análise exercidas na suposta hiper-racional contemporaneidade. Alertam que é preciso “examinar de perto tecnologias de controle e vigilância de indivíduos e populações, sua medicalização, o fichar, o registro de seus comportamentos, inclusive os mais precoces” (DARDOT & LAVAL, 2017, pos.7932). Mesmo antes da popularidade esmagadora de plataformas como o Facebook, a ligação entre inteligência artificial e pilares do neoliberalismo, como o capital financeiro, podem ser sentidas como aponta Achille Mbembe, ao descrever como este, “simultaneamente força viva e criadora […] e processo sangrante de devoração […] aumentou descontroladamente a partir do momento em que os mercados bolsistas escolheram apoiar-se na inteligência artificial para optimizar movimentos de liquidez” (MBEMBE, 2017, p.30).

Neste sentido, acreditamos ser essencial a realização de esforço de pesquisa e atuação crítica na realidade para combater os vieses não só algorítmicos, mas também a opacidade destes vieses fruto da lógica neoliberal que glorifica corporações de tecnologia do Vale do Silício enquanto deixa sujeitos atomizados em busca de uma autogestão cada vez mais opressiva. E levando em conta o “contrato racial” (MILLS, 2014) que cria processos de racialização nas mais diferentes esferas sociais com objetivos de dominação, é preciso esforço conjunto para entender a fundo novas tecnologias como plataformas de comunicação e suas relações com dados e inteligência artificial.

As proposições que estão surgindo nos últimos anos para interrogar as plataformas e sistemas algorítmicos merecem circulação e aplicação em diferentes contextos (BROCK, 2016; RIEDER, 2016; OSOBA & WELSER VI, 2017; SILVEIRA, 2017; NOBLE, 2017; WILLIAMS, BROOKS & SHMARGAD, 2018; BUOLAMWINI & GEBRU, 2018), sendo ainda raras as proposições que levam em conta a estruturação do racismo na sociedade ocidental e como impacta produções de centros de tecnologia como o Vale do Silício.

A Teoria Racial Crítica (Critical Race Theory), fruto e atuante nos movimentos de direitos civis desde a década de 60, aplicada no Brasil por estudiosos do Direito e da Educação, merece o seu lugar também na Comunicação. É baseada em pilares de compreensão da sociedade especialmente úteis para compreender os pontos de contato entre opacidade algorítmica e invisibilidade dos processos de racialização, tais como: compreensão desta como de relações raciais hierarquizadas estruturantes e estruturadas pelo racismo; percepção da ordinariedade do racismo nas mais diferentes esferas sociais, econômicas, políticas e biopolíticas; a convergência interseccional do determinismo material dos interesses de grupos dominantes; a visão das relações raciais como construção social; e, por fim, a TRC é agente efetiva no combate da opressão racial (CRENSHAW, GOTANDA & PELLER, 1995; MATSUDA et al, 1993; DELGADO, STEFANCIC & HARRIS, 2017).

Vemos estes esforços como um trabalho internacional em progresso e propomos três estratégias para reunir a colaboração da Teoria Racial Crítica ao estudo dos algoritmos: a) análise crítica, localizada e com consciência racial das particularidades do contexto brasileiro, onde entram também hierarquias de dominação imperialistas mediadas pelo Vale do Silício e cultura de startups; b) uso de colaborações das ciências sociais, humanidades digitais e computação social para entender e interrogar as plataformas; e c) uso de métodos mistos (JOHNSON & ONWUEGBUZIE, 2004), incluindo também mapeamento, engajamento de profissionais e ativistas para compreender toda a rede produtiva a partir de um olhar da economia política de produção dos algoritmos e sistemas. A governança algorítmica tende a ser cada vez mais presente e comunicadores e cientistas sociais devem mergulhar na temática para agir junto a desenvolvedores e legisladores pra analisar danos individuais, discriminação ilegal e práticas injustas, perda de oportunidades, perdas econômicas e estigmatização social.

Referências

BEATON, Brian. How to Respond to Data Science: Early Data Criticism by Lionel Trilling. Information & Culture, v. 51, n. 3, p. 352-372, 2016.

BROCK, André. Critical technocultural discourse analysis. New Media & Society, p. 1461444816677532, 2016.

BUOLAMWINI, Joy; GEBRU, Timnit. Gender shades: Intersectional accuracy disparities in commercial gender classification. In: Conference on Fairness, Accountability and Transparency. 2018. p. 77-91.

CRENSHAW, Kimberlé; GOTANDA, Neil; PELLER, Garry. Critical race theory: The key writings that formed the movement. The New Press, 1995.

DARDOT, Pierre; LAVAL, Christian. A nova razão do mundo. Boitempo Editorial, 2017.

DELGADO, Richard; STEFANCIC, Jean. Critical race theory: An introduction. NYU Press, 2017.

JOHNSON, R. Burke; ONWUEGBUZIE, Anthony J. Mixed methods research: A research paradigm whose time has come. Educational researcher, v. 33, n. 7, p. 14-26, 2004.

MATSUDA, Mari J.; LAWRENCE III, Charles R.; DELGADO, R.; CRENSHAW, Kimberlè W. Words That Wound – Critical Race Theory, Assaultive Speech, and the First Amendment. Nova Iorque: Routledge, 1993.

MBEMBE, Achille. Políticas da Inimizade. Lisboa (Portugal: Antígona, 2017.

MILLS, Charles W. The racial contract. Cornell University Press, 2014.

NOBLE, Safiya Umoja. Algorithms of Oppression: How search engines reinforce racism. NYU Press, 2018.

OSOBA, Osonde A.; WELSER IV, William. An intelligence in our image: The risks of bias and errors in artificial intelligence. Rand Corporation, 2017.

RIEDER, Bernhard. Big Data and the Paradox of Diversity. Digital Culture & Society, v. 2, n. 2, p. 39-54, 2016a.

SILVEIRA, Sérgio Amadeu da. Tudo sobre Tod@s: redes digitais, privacidade e venda de dados pessoais. São Paulo: Edições Sesc, 2017.

WILLIAMS, Betsy Anne; BROOKS, Catherine F.; SHMARGAD, Yotam. How algorithms discriminate based on data they lack: Challenges, solutions, and policy implications. Journal of Information Policy, v. 8, p. 78-115, 2018.

 

Como citar
SILVA, Tarcízio. Interrogando Plataformas e Algoritmos Digitais. In: Congresso Nacional de Estudos Comunicacionais da PUC Minas, 2018, Poços de Caldas, Minas Gerais, Brasil. Anais do 3 CONEC Congresso Nacional de Estudos Comunicacionais da PUC Minas, 2018. p. 32-26. Disponível em < https://conec.pucpcaldas.br/wp-content/uploads/2019/06/anais2018.pdf >

Apresentação sobre Visão Computacional e Vieses Racializados no COPENE

No último dia 29 de maio, apresentei no COPENE Nordeste o trabalho Visão Computacional e Vieses Racializados: branquitude como padrão no aprendizado de máquina, que fez parte da Sessão Temática “Branquitude, Representações e Mídia”. O slideshow já está disponível:

Em breve o artigo completo será publicado nos anais do evento. Acompanhe as publicações relacionadas no ResearchGate ou Lattes.

Por Humanidades Digitais Negras

As Humanidades Digitais ganharam mais visibilidade nos últimos 20 anos, graças à gradativa expansão do campo em termos de pesquisadores engajados, produção bibliográfica, ferramentas e projetos públicos. Um dos principais destes é a série Debates in the Digital Humanities. O livro, que pode ser lido na versão impressa ou digital interativa, reúne diversas abordagens sobre as humanidades digitais em seções com reflexões sobre sua história e futuros, métodos, práticas, disciplinas e críticas, com um foco bem relevante em text analysis.

O capítulo “Making a Case for the Black Digital Humanities“, Kim Galllon busca apresentar reflexões, casos, referências e possibilidades para uma abordagem das digitais humanidades do ponto de vista do campo chamado por ela de forma resumida de Black Studies (incluindo a linha de Africana/African American studies). Recomendo a leitura do capítulo e da produção de Gallon, que atualmente é Professora de História na Purdue University, mas aqui vou enfatizar alguns pontos do excelente texto.

Para Gallon, “os black studies tem sido entendidos como estudos comparativos das experiências culturais e sociais negras sob sistemas eurocêntricos de poder nos Estados Unidos, na diáspora Africana mais ampla e no continente africano”.

Um dos principais pontos é a percepção de Gallon sobre a pesquisa dos black studies nas humanidades digitais como um tipo de “tecnologia de recuperação(technology of recovery). As “humanidades digitais negras ajudam a desmascarar os sistemas racializados de poder em jogo quando entendemos as humanidades digitais como um campo e utilizamos suas técnicas associadas”. As tecnologias de recuperação são os esforços de grupos minorizados/marginalizados em usar plataformas e ferramentas digitais tanto para resgatar história e literatura não-registrada, apagada, invisibilizada ou intencionalmente destruída quanto para recuperar a humanidade das pessoas negras em um sistema de racialização global.

Gallon cita o papel do Digital Schomburg, um dos primeiros grandes projetos de digitalização de história afro-americana, reunindo informações, literatura e arquivos de fotografias e imagens dos séculos 19 e 20. Abaixo uma das exposições online do centro, com história de nova-iorquinos afro-americanos:

Além do aspecto histórico, Gallon explica como grandes movimentações ativistas online do “Black Twitter” e comunidades negras nas mídias sociais como #SayHerName, #BlackLivesMatter e #ICanBreathe fazem parte de esforço de recuperação também sobre o presente: os ativistas e participantes destes movimentos lembram a si mesmos e o resto da população sobre a disparidade gigantes de indicadores sociais de violência policial, emprego, educação, habitação, saúde e outros.

Em seguida, a autora discorre sobre a saliência de alguns métodos específicos, como a relativa pouca exploração de text analysis sobre literatura negra. Aqui cita o Project on the History of Black Writing, fundado por Maryemma Graham, que realizou eventos e visualizações de análise de literatura assistida por computador.

Seguindo no debate sobre o caráter das humanidades digitais negras, Gallon cita Johanna Drucker e sua defesa de “usar e construir ferramentas e infraestrutura embebidas de teoria humanística de modo que funcionem de modos que reflitam os valores das humanidades”. Isto sigficaria, então, para Gallon, que

As humanidades digitais negras então apresentam o digital como hospedeiro mútuo tanto de racismo quanto de resistência e jogam luz sobre o papel da raça como uma metalinguagem que forma o terreno digital, fomentando estruturas hegemônicas que são tanto novas e antigas e replicam e transcendem as análogas

Essa perspectiva pode gerar questões sobre a relação entre racialização da humanidade e o digital como poder, superando a percepção ainda disseminada da “neutralidade” do digital ou tecnologia, nos levando e entender melhor a condição humana.

Kim Gallon não cita no texto o projeto Black Press Research Collective, fundado pela própria. Recomendo a navegação no site e visualização que inclui registros da imprensa afro-americana do início do século XX, visualizações, mapas e gráficos sobre circulação e localização, além de registro de eventos e trabalhos derivados. Uma das visualizações mais interessantes (o mapa abaixo) é a lista de vendedores do jornal The Chicago Defender, que ajudava negros do Sul com informação sobre como se defender e migrar para sobreviver. Os dados foram retirados de base de dados do FBI, que vigia(va) qualquer iniciativa de auto-defesa dos negros americanos:

Esta resenha foi motivada pelo workshop AfricanaDHi e faz parte da bibliografia do evento.

Crises com Bancos de Imagens: autenticidade e visibilidade no conteúdo em mídias sociais

Neste maio (2019), aconteceu o XIII Congresso da Abrapcorp, em São Paulo. Daniele Rodrigues e eu apresentamos trabalho inédito com o título “Bancos de imagens em conteúdo nas mídias sociais: entre (in)visibilidade e autenticidade“. O artigo teve dois objetivos. Em primeiro lugar, enfatizar a relevância dos bancos de imagens na cadeia produtiva da comunicação, uma vez que os bancos de imagens foram objeto relativamente negligenciado nos estudos científicos em língua portuguesa. Internacionalmente, passaram a ser foco de estudo recentemente do ponto de vista de representatividade, como o trabalho Interrogating Vision APIs. Em segundo lugar, o trabalho se dedicou a discutir conceitos como visibilidade, invisibilidade e autenticidade nos bancos de imagens através de uma coleção de anti-cases.

O resumo oficial do trabalho: “O presente artigo busca informações e reflexões sobre um ponto específico da cadeia de produção de conteúdo para mídias sociais: o uso de bancos de imagens na comunicação de marcas. Criados no início no século XX, os bancos de imagens influenciaram os campos da produção editorial, publicitária e midiática como um todo. Nos últimos anos, graças ao modelo de microstock e à disseminação das mídias sociais, os sites de venda ou aluguel de imagens ganham espaço e relevância nas culturas visuais corporativas. O texto apresenta, por meio de levantamento de trabalhos e casos relacionados a bancos de imagens, reflexões sobre aspectos produtivos do uso desses acervos no cotidiano de profissionais e sua relação com o conceito de autenticidade.

Veja apresentação em slideshow sobre o artigo e leia completo no ResearchGate:

Text Analysis with AntConc for social media data: Concordancer and Concordance Plot

In the lasts posts, we learn the basics about AntConc and how to generate and analyze word lists. Now we are going to show you how to use AntConc to study concordances through allowing the navigation of instances of a keywords in context.

Don’t forget that this post is part of a series of tutorials:

  1. Intro, Opening a File and Settings
  2. Word Lists and File Viewer 
  3. Concordancer and Concordance Plot (we are here)
  4. Clusters and N-Grams (soon)
  5. Collocations (soon)

 

Concordance basics

1. Open your file(s). In that example, we are going to use a simple example of only two texts: the english webpages about the countries United States and United Kingdom. You can find them at our datasets folder.

 

2. Generate a Word List.

 

3. Click on the Concordance tab. Now you can search for a letter, word or expression. We searched for the term ‘war’ and, as you can see, we got a total of 107 Concordance Hits. This is the sum of the total amount of results to that specific search in the two files.

 

4. By default, the search term will be highlighted in blue and up to three terms on the right will be highlighted in red, green and purple. You can change those colors in Global Settings.

They are useful to understand and sort the words in the vicinity of our term (or terms) of interest.

 

5. At the bottom, you can change the Kwic (Keyword-in-context) settings and choose which items you want to highlight and sort in the Concordance tab. You can select up to three levels. In the following images, 1R stands for “1 Right, or first item on the right”, 1L stands for “1 Left, or first item on the left” and so on.

 

Changing the levels to 1L, 2L and 3L will result on something like the following:

 

World War

 

as * as

 

Concordance plot

The concordance plot is a straightforward way to compare two or more corpora, their concordance hits and the distribution of words or phrases along them.


1. It is very simple to use the Concordance Plot. Just generate a Word List (if you haven’t already), search for a word or phrase on the Concordance tab and click on the Concordance Plot tab. Let’s use that same example from before, searching for ‘war’:

 

2. As we can see, the word ‘war’ is much more common on the United States WIkipedia page. What does that mean? It could be a indication of more interest on war between the editors of the USA wikipedia page, for example?

 

3. You can increase the zoom on the visualization in the option Plot Zoom:

 

4. You can observe in Step 2 that besides the number the fact that the characters in each file are different (126k x 135k), the rectangle representing the files has the same width. This is because the visualization is normalized to facilitate some comparisons. You can change that going in Tool Preferences -> Concordance Plot and selecting the option “Use a relative lenght” in the Plot Length Options.

Now you can see a width that better represents the length and the difference between the files:

 

Searching for a list of words

1. At the Concordance tool, as well in other AntConc tools, we can search for a list of words at once. Those words could be inserted manually or through a txt file.

 

2. In the Advanced Search options you can check the option “Use search term(s) from list below” and input the words. In the following example, we used the expressions below to include also terms like “economics”, “economically”, “finance”,  “financial” etc.

 

3. Alternatively, you can click on “Load File” and upload words from a .txt file.

 

4. With this technique you can look and explore concordances for words with semantic similarity:

 

5. Finally, another option on the Advanced Search specifications is to use Context Words and Horizons. The terms searched are filtered out according to proximity to other words. In the example below, the combination of terms related to war and conflicts to a filter of instances next to ‘crisis’ and ‘depression’ could be used for understanding the relations between war and economic problems: