Analisando mediações algorítmicas em bancos de imagens e APIs de visão computacional

O artigo “APIs de Visão Computacional: investigando mediações algorítmicas a partir de estudo de bancos de imagens” foi resultado de trabalho colaborativo em parceria com André Mintz, Janna Joceli Omena, Beatrice Gobbo, Taís Oliveira, Helen Tatiana Takamitsu, Elena Pilipets, Hamdan Azhar a partir da penúltima edição do SMART Data Sprint. Faz parte de dossiê “Instabilidade e Conflito das/nas Imagens” da revista Logos. Resumo:

O artigo apresenta resultados de estudo sobre Interfaces de Programação de Aplicações (API, na sigla em inglês) de visão computacional e sua interpretação de representações em bancos de imagens. A visão computacional é um campo das ciências da computação dedicado a desenvolver algoritmos e heurísticas para interpretar dados visuais, mas são ainda incipientes os métodos para sua aplicação ou investigação críticas. O estudo investigou três APIs de visão computacional por meio de sua reapropriação na análise de 16.000 imagens relacionadas a brasileiros, nigerianos, austríacos e portugueses em dois dos maiores bancos de imagens do ocidente. Identificamos que: a) cada API apresenta diferentes modos de
etiquetamento das imagens; b) bancos de imagens representam
visualidades nacionais com temas recorrentes, mostrando-se úteis
para descrever figurações típicas emergentes; c) APIs de visão
computacional apresentam diferentes graus de sensibilidade e
modos de tratamento de imagens culturalmente específicas.

Leia em https://www.e-publicacoes.uerj.br/index.php/logos/article/view/51523

Google acha que ferramenta em mão negra é uma arma

A desinteligência artificial é uma constante mesmo em grandes empresas reconhecidas pelos seus feitos na tecnologia digital. Na minha Linha do Tempo do Racismo Algorítmico há alguns casos como: a Google marcando pessoas negras como gorilas; Instagram vendo violência e armas onde não há; IBM e Microsoft não reconhecendo gênero de mulheres negras.

Internacionalmente esforços coordenados buscam proibir ou ao menos suspender o uso de inteligência artificial por instituições públicas, sobretudo em segurança pública. As taxas de erro são enormes, de Salvador até centros globais financeiros e tecnológicos como Londres. Atualmente a pandemia de COVID-19 tem sido a desculpa para empresas questionáveis forçarem a normalização de uso de tecnologias problemáticas seja no Brasil ou no exterior.

Mais um caso vulgar de erro em visão computacional foi mapeado. Nas imagens abaixo, o pesquisador Nicolas Kayser-Bril rodou duas imagens de pessoas segurando um termômetro na Google Vision, recurso de análise de imagens. Na foto com a pessoa asiática, as etiquetas “Tecnologia” e “Dispositivo Eletrônico” lideraram. Na com a pessoa negra, a etiqueta “Arma” foi marcada com 88% de certeza.

Esse tipo de erro é causado por um acúmulo de fatores, que vai da base de dados de péssima qualidade, lógica relacional do aprendizado de máquina falta de diversidade no campo e ao technochauvinismo dos profissionais da área que não criam ou reforçam mecanismos de representação adequada. A depender do seu ceticismo você está buscando motivos na imagem para justificar a questão? O pesquisador Bart Nagel responde com o experimento abaixo, onde embranqueceu a mão da foto:

Este é mais um de inúmeros casos da vulgaridade da aplicação da inteligência artificial para supostamente entender questões complexas e sociais da realidade. Mas quando falamos de segurança pública, o horror da necropolítica está agindo claramente. Os inúmeros casos de assassinato de cidadãos por policiais que se “confundiram” possuem uma ligação que não é coincidência com a estupidez da visão computacional. Não podemos, enquanto sociedade, permitir que o technochauvinismo avance ainda mais na segurança pública.

Veja mais casos do horror do racismo algorítmico na Linha do Tempo, entenda como estes recursos funcionam e são nocivos no artigo Visão computacional e Racismo Algorítmico: branquitude e opacidade no aprendizado de máquina e no relatório Interrogating Vision APIs, onde propomos metodologia de auditoria destes sistemas.

“Tranças feias” e “tranças bonitas”: como Google intensifica racismo

Viralizou na última semana um exercício de interrogação crítica do buscador Google: basicamente pesquisar “tranças feias” e “tranças bonitas” e conferir quais imagens são destacadas na aba de resultados de imagens do buscador. Longe de ser algo pontual, estes casos, mecanismos e problemas no excelente livro de Safiya Noble “Algoritmos de Opressão: como mecanismos de busca reforçam o racismo“. Outros casos similares mantenho na minha Timeline do Racismo Algorítmico. Ontem falei com o jornalista Tiago Rugero, do blog do Ancelmo (O Globo) sobre a questão. Seguem minhas respostas:

Você considera esse um caso de racismo algorítmico?
Sim. Racismo não se trata apenas de xingamentos horrorosos contra uma minoria. Trata-se também da manutenção de desigualdades estruturadas e microagressões no cotidiano que podem ser resultado de como sistemas automatizados, como buscadores, reagem ao comportamento dos usuários. No caso que está sendo viralizado, sobre as tranças feias e bonitas, o buscador não apenas reflete percepções da sociedade, mas também pode intensificá-las ao repetir em massa sem responsabilidade. Se uma criança negra, por exemplo, vê estes resultados continuamente, sem ver outros conteúdos positivos, isto gera sentimentos negativos sobre sua estética e autoestima. Há vários pesquisadores e pesquisadoras em universidades internacionais, como Joy Buolamwini, Safiya Noble, Frank Pasquale, Cathy O’Neill, Sil Bahia, Sérgio Amadeu que tratam de impactos sociais dos algoritmos há anos, mas agora o debate se populariza.

As tecnologias não são neutras. Mas isto não quer dizer que são negativas ou positivas. Significa que podemos gerar esforços coletivamente para criar ambientes favoráveis a todas as pessoas. Algumas plataformas digitais já possuem esforços neste sentido. Microsoft e IBM, por exemplo, já reagiram a pesquisas sobre casos anteriores. É importante debater tudo isto entre desenvolvedores, sociedade, jornalistas e afins.

O que é racismo algorítmico?
O racismo algorítmico trata de entender como sistemas regidos por algoritmos podem tomar decisões negativas contra um grupo racial específico. Há casos mapeados em áreas claramente muito graves, como decisões judiciais automatizadas ou reconhecimento facial que podem gerar, por exemplo, a prisão injusta de uma pessoa inocente. Isto mostra a necessidade, já avançada em alguns países, de permitir a “auditoria algorítmica” para que sistemas contratados por governos sejam justos e não possam ser usados para fins nocivos.
Mas na comunicação também há problemas possíveis para milhões de pessoas, uma vez que hoje nós passamos a maior parte do nosso tempo em ambientes como Google e Facebook. Assim como acontece com a publicidade tradicional, a invisibilidade ou representação nociva de grupos minorizados deve ser debatida pois prejudica os grupos citados, a sociedade e a própria economia e consumo.
Na maioria dos casos, os estudos mostram que os problemas não são claramente “intencionais”. Não é um desenvolvedor racista, geralmente, que vai incluir aquelas decisões que prejudicarão alguém. Mas pecar por omissão pode ser tão negativo quanto por intenção. Por isto tanto a pressão pela transparência das plataformas quanto falar sobre casos como este é importante para gerar o debate que vai ajudar os próprios criadores destes ambientes a melhorar seus sistemas. O campo da inteligência artificial, de modo amplo, está desenvolvendo modos de treinar melhor os sistemas e desenhar melhor as interfaces para isto, com apoio também das humanidades, artes, sociólogos e jornalistas.

 

Horas depois, a Google emitiu uma nota, que reproduzo a seguir:

“Construir uma experiência de busca é um desafio complexo, dinâmico e em constante evolução. Como nossos sistemas encontram e organizam informações disponíveis na web, eventualmente, a busca pode espelhar estereótipos existentes na internet e no mundo real em função da maneira como alguns autores criam e rotulam seu conteúdo. Entendemos que pessoas de todas as raças, gêneros e grupos podem ser afetadas por essas representações. Compartilhamos essa preocupação e continuaremos trabalhando para melhorar os resultados de busca de imagens para todos nossos usuários.”

Esta pretensão de neutralidade, de que o buscador é “só uma tecnologia” está sendo combatida internacionalmente. Gostaria de destacar o artigo “Por que empresas de mídia insistem que não são empresas de mídia, por que estão erradas e por que isso importa“, de Philip Napoli e Robyn Caplan, que explicam como discursos tais como o acima são problemáticos.

Por que empresas de mídia insistem que não são empresas de mídia, por que estão erradas e por que isso importa?

Mais um caso de racismo em plataformas de mídias sociais. Desta vez, o criador de “conteúdo” ou “influenciador” Cocielo, que já trabalhou pra marcas como Coca Cola, Asus, Submarino e outras publicou um tweet racista contra o jogador Mbappé e deletou em seguida, preocupado com os impactos comerciais que teriam. Quando o print do tweet começou a circular, tanto o youtuber quanto amigos e fãs argumentaram que “quem conhecece o Cocielo sabe que ele não é assim” e variantes. Foi o estopim para mostrar que sempre foi assim, na verdade: publicações racistas, misóginas, homofóbias, transfóbicas e violências de todo o tipo foram descobertas por outros tuiteiros e a reincidência em crimes de ódio ficou mais que evidente.

O absurdo de marcas e agências contratarem gente como o Cocielo, permitindo que suas vozes sejam replicadas e fortalecidas (uma vez que os remuneram aumentando seu público) foi coberto por várias analistas, como  Stephanie Ribeiro que comentou que “marcas patrocinam qualquer um, menos os negros com discurso engajado“. Em reportagem no Alma Preta, Thalyta Martins cita fala da historiadora Suzane Martins sobre as “desculpas” do YouTube – “Isso seria trabalhar a política racial em um âmbito individual mediado por conceitos como ‘culpa’ ou ‘perdão’, que dizem mais sobre uma visão cristã e maniqueísta do mundo do que sobre política e projeto de sociedade”. Anderson França em postagem relembra que “eleger pessoas negras engajadas nessa pauta, mudar leis, agir, de cima pra baixo, na educação, no judiciário, nas polícias, nas estruturas fundamentais do estado e da sociedade, para que possamos evitar os novos atos de racismo e mais: eliminar a cultura do racismo.”

Mas este caso está longe de ser novo. Como ocorreu em vários momentos nos últimos anos, criadores de conteúdo, atores e apresentadores de TV cometem repetidamente crimes de ódio nas mídias sociais. Então este caso é um ótimo momento para refletir: por que as plataformas de mídias sociais protegem criminosos? E por que não estamos falando disto?

Plataformas como Twitter, YouTube e Facebook devem ser vistas como mídia, não só como tecnologia. Algoritmos, recursos como Moments, termos de uso e aplicação restrita ou alargada dos Termos de Uso (como encobrir e até remunerar racistas com recursos como Conta Verificada) são, efetivamente, decisões editoriais. Elas não possuem o formato de decisão editorial como em jornais tradicionais, mas o são. E precisamos falar sobre isso.

Um ótimo ponto de partida é o artigo Por que empresas de mídia insistem que não são empresas de mídia, por que estão erradas e por que isso importa?, escrito por Philip Napoli e Robyn Caplan e publicado ano passado na First Monday. Acabou de ser publicado em versão em português, com tradução feita por mim e Willian Araújo na revista Parágrafo. Esta edição da revista Parágrafo inclui um dossiê completo sobre mediações algorítmicas, editado por Willian Araújo e Carlos D’Andrea, com artigos, traduções e entrevista.

No caso do artigo em questão de Napoli e Caplan, resumo pode ser visto a seguir:

Uma posição comum entre plataformas de mídia social e agregadores de conteúdo é sua resistência em ser caracterizados como empresas de mídia. Ao contrário, empresas como Google, Facebook e Twitter tem constantemente insistido que deveriam ser pensadas como puramente empresas de tecnologia. Este artigo critica a opinião que estas plataformas são empresas de tecnologias ao invés de empresas de mídia, explora seus argumentos subjacentes e considera as implicações políticas, legais e regulatórias associadas com o aceite ou recusa desta opinião. Como o artigo ilustra, não é apenas uma distinção semântica, dado que o histórico de classificação precisa de tecnologias e serviços da comunicação possui profundas implicações em como estas tecnologias e serviços da comunicação são avaliadas por decisores políticos e tribunais.

Os autores cobrem os vários argumentos usados por estas plataformas para se posicionarem no campo da “tecnologia”, contra-argumenta mostrando suas fragilidades e, por fim, apresentam a importância desta crítica e os papéis que a academia e sociedade civil podem exercer para uma internet mais justa.

Acesse o artigo diretamente e confira todo o dossiê em http://revistaseletronicas.fiamfaam.br/index.php/recicofi/issue/view/59/showToc

 

Algoritmos de Opressão: como mecanismos de busca reforçam o racismo

Algoritmos e plataformas não são neutros. São construídos de modo que algumas visões de mundo, ideologias e pontos de vista se destacam e impõem-se, seja de forma intencional ou não. Apesar de estarmos em 2018 e centenas de pesquisadores, desenvolvedores e profissionais destacarem isto, a plataformização da mídia e do capitalismo através de empresas como Google, Facebook, Uber, AirBnB e similares surfa (e alimenta) a onda do individualismo, livre mercado e endeusamento estúpido da “tecnologia” para argumentar justamente o contrário: que seriam ambientes neutros por serem, justamente, criados com mecanismos de automatização de decisões livres da interferência humana.

Pesquisadores sérios e alguns segmentos da população como, por exemplo, mulheres negras, não podem se dar ao luxo de ignorar impacto e vieses dos algoritmos. Nesta interseção, a pesquisadora e professora Safiya U. Noble nos presenteou com a indispensável publicação de Algorithms of Oppression: how search engines reinforces racism lançado oficialmente neste mês de fevereiro de 2018. é Ph.D. pela University of Illinois, professora na University of Southern California (USC), previamente tendo ensinado também na UCLA, além de ser co-fundadora do Information Ethics & Equity Institute. Também é sócia de empresa focada em ciência de dados e pesquisa, a Stratteligence. Antes desse livro, co-editou “The Interesectional Internet: Race, Sex, Culture and Class Online” e “Emotions, Technology & Design”.

Em Algorithms of Oppression: how search engines reinforces racisma autora apresenta os resultados de ampla pesquisa sobre algoritmos e representação de determinados grupos, sobretudo mulheres e garotas negras no Google. A autora abre o primeiro capítulo, “A Society, Searching”, relembrando a campanha circulada pela UN Women que usou telas reais do recurso “Autocompletar” do buscador Google para mostrar como o sexismo e misoginia são representados pelas sugestões reais.

A campanha é o gancho para começar a discussão sobre a relevância e utilidade destes recursos como fortalecedores dos comportamentos que representam. Em seguida, a autora traz mais exemplos sobre representações de mulheres a partir de buscas tão simples quanto “black girls”, “why are women so” ou “why are Black people so” para mostrar como mecanismos de acesso a informação privilegiam pontos de vista de posições de poder – por exemplo, a hiperssexualização das garotas negras nos resultados é fruto de padrões de busca por conteúdo sexual e pornográfico, desrespeitando as mulheres negras como construtoras de narrativas e conteúdos próprios. Para tratar deste problema de pesquisa, Noble propõe a aplicação de uma abordagem com método e epistemologia feminista ao citar Sandra Harding, que diz que “Definir o que é necessário em termos de explicação científica apenas da perspectiva da experiência de homens brancos burgueses leva a compreensão parcial e até perversa da vida social”.

O segundo capítulo “Searching for Black Girls” traz diversos estudos de caso sobre representação de minorias políticas nos resultados da Google, para buscas como “black girls”, “latina girls”, “asian girls” etc.  A tela abaixo é inclusa no livro e mostra como os resultados para “black girls” oferecem uma representação pornográfica de meninas negras nos resultados.

Noble critica o uso puramente comercial, pela Google, de iniciativas como Black Girls Code, que não se reflete na melhoria de práticas na empresa de tecnologia ou na contratação minimamente representativa de profissionais negros. A distribuição de profissionais em empresas como a Google, Facebook e outras gigantes da tecnologia não representam nem de longe a distribuição de gênero e raça no país.

É especialmente relevante o fato de que a Google não só contrata engenheiros e cientistas da computação de forma enviesada, como também não constrói cargos e departamentos direcionados a tarefas de otimização da oferta de mídia quanto a diversidade cultural e respeito à humanidade dos seus clientes. Não são práticas novas, apesar das embalagens do Vale do Silício, como Noble demonstra ao fazer ligações destas representações ao histórico de construção de categorias raciais discriminatórias com fins de dominação. É imprescindível, então, adereçar a opacidades das tecnologias que regem as trocas comunicacionais:

“The more we can make transparent the political dimensions of technology, the more we might be able to intervene in the spaces where algorithms are becoming a substitute for public policy debates over resource distribution – from mortgages to insurance to educational opportunities”

O terceiro capítulo trata da representação de pessoas e comunidades na web em resultados de busca, especialmente o caso de sites de notícias falsas criadas por racistas supremacistas brancos nos EUA. Usando o exemplo de termos como “black on white crime”, a autora mostra como os resultados melhor rankeados levam a sites com dados falsos e cheios de discurso de ódio, com SERPs (“search engine results page”, termo usado geralmente para se referenciar à primeira página) que geram receita para a organização.

O quarto capítulo se debruça sobre ações realizadas por grupos e indivíduos para se proteger dos malefícios dos vieses dos mecanismos de busca e do registro ilegal ou antiético de dados. A partir de casos famosos como o IsAnyoneUp (site que hospedava ilegalmente “pornô de vingança”), a autora mostra correlatos relacionados à perfilização de indivíduos em categorias criminosas. Sites como UnpublishArrest e Mugshots cobram para retirar fotos de fichamento (“mugshots”) divulgadas amplamente na internet, que prejudicam indivíduos tanto culpados quanto inocentes. Como dados mostram, minorias étnicas são presas e fichadas de forma errônea e/ou abusiva com muito mais frequência nos EUA, o que leva a morosidade (4 a 6 semanas, quando acontece) de tentativas de “limpar” resultados de busca um mecanismo de intensificação da violência contra as minorias. O “direito ao esquecimento”, tema que já tratamos aqui no blog a partir de Mayer-Schonberger, é explorado a partir do pensamento de autores como Oscar Gandy Jr., mostrando alternativas para a materialização de aspectos negativos da ultra-racionalização enviesada da sociedade.

O fechamento deste capítulo tenta enfatizar a importância da retomada da transparência sobre decisões quanto a construção de índices e sistemas de informação:

In addition to public policy, we can reconceptualize the design of indexes of the web that might be managed by librarians and info rmation institutions and workers to radically shift our ability to contextualize information. This could lead to significantly greater transparency, rather than continuing to make the neoliberal capitalist project of commercial search opaque.

O quinto capítulo, então, parte para imaginar o “Future of Knowledge in the Public” a partir de uma revisão crítica sobre o histórico de problemas de classificação de temas, pessoas e grupos em repositórios de informação. Até muito recentemente categorias como “Jewish Question”, “Yellow Peril” eram usadas no sistema de classificação da Biblioteca do Congresso nos EUA, que estabelece os padrões seguidos no país. A dominação cultural sobre minorias é estruturada e materializada em códigos de enquadramento de estudos, literatura e pensamento sobre a sociedade de um modo que direciona as interpretações e desdobramentos possíveis. Sistemas de informação não são objetivos e não podem ser vistos dessa forma. Noble propõe seguir as recomendações do prof. Jonathan Furner para se aplicar Teoria Racial Crítica a estudos de informação, através de procedimentos como:

  •  Aceitação, pelos criadores dos sistemas, que os vieses existem e são resultados inevitáveis dos modos pelos quais são estruturados;
  • Reconhecimento que a aderência a uma política de neutralidade contribuir pouco para a erradicação dos vieses e pode, na verdade, estender suas existências;
  • Construção, coleta e análise de expressões narrativas de sentimentos, pensamentos e crenças de usuários de populações racialmente diversas dos esquema de classificação.

Buscando discutir como encontrar informação “culturalmente situada” na web, a autora explica o valor e potencial de alteridade de sites e buscadores focados em minorias como Blackbird (www.blackbirdhome.com),as BlackWebPortal (www.blackwebportal.com), BlackFind.com (www.blackfind.com), Jewogle (www.jewogle.com), Jewish.net (http://jewish.net/), JewGotIt (www.jewgotit.com) e  Maven Search (www.maven.co.il).

No sexto e último capítulo, “The Future of Information Culture”, Noble critica o monopólio da informação e o papel de organismos regulatórios como a FCC (Federal Communications Commission) nos EUA. Discutir o papel de organizações de mídia cada vez mais concentradas é uma questão de políticas públicas. A autora mostra, através da revisão de várias decisões judiciais, como os possíveis malefícios desta concentração tem impactos que são materializados em casos “extremos” ao mesmo tempo que influenciam a sociedade como um todo. A insistência de enquadrar ecossistemas da Google, Facebook e afins como “neutros”, como se não tivessem responsabilidade tais como organizações de mídia e imprensa também é endereçada pela autora. Para que a internet seja de fato uma fonte de oportunidades para as pessoas de forma democrática, os modos pelos quais suas principais propriedades são construídas deve estar sob princípios de transparência e acontabilidade.

Assim como a diversidade no Vale do Silício ter diminuído ao invés de aumentado nos últimos anos, a desigualdade econômica entre famílias brancas, negras e hispânicas cresceu. Segundo dados da Federal Reserve, o patrimônio líquido de famílias brancas era cerca de 10x o de famílias negras.

A autora traz as colaborações da pesquisa sobre exclusão digital para detalhar como aspectos econômicos, educacionais, culturais são materializados em três pontos principais de desigualdade quanto a tecnologia: acesso a computadores e softwares; desenvolvimento de habilidades e treinamento; e conectividade à Internet, como banda larga.

Por fim, como diz de forma “a desigualdade social não será resolvida por um app”. A nossa atual confiança excessiva nas tecnologias e auto-regulação de mercados esconde os impactos e decisões feitas dia a dia por profissionais, designers, engenheiros, cientistas e executivos de negócio que pecam por intenção ou omissão quanto à efetiva liberdade de expressão e uso da web. Somente a associação intencional, inteligente e diversa de pessoas de diferentes backgrounds profissionais e culturais engajadas em tornar o mundo um lugar melhor pode salvar a internet. As concepções neoliberais sobre mercado, comunicação e democracia vão contra este objetivo, como aponta em:

New, neoliberal conceptions of individual freedoms (especially in the realm of technology use) are oversupported in direct opposition to protections realized through large-scale organizing to ensure collective rights. This is evident in the past thirty years of active antilabor policies put forward by several administrations47 and in increasing hostility toward unions and twenty-first-century civil rights organizations such as Black Lives Matter. These proindividual, anticommunity ideologies have been central to the antidemocratic, anti-affirmative-action, antiwelfare, antichoice, and antirace discourses that place culpability for individual failure on moral failings of the individual, not policy decisions and social systems.

É possível ver uma palestra de Safiya U. Noble realizada no Personal Democracy Forum 2016 que cobre as ideias principais da publicação:

Saiba mais sobre o livro e o trabalho da autora em seu site: https://safiyaunoble.com/research-writing/