Disparidades interseccionais em sistemas de classificação automatizada de gênero

Mecanismos de inteligência artificial tal como reconhecimento automatizado de faces são, como toda tecnologia, repletos de particularidades sociais de produção que muitas vezes são deixados de lado em prol de supostas eficiências que trazem mais problemas – geralmente para grupos desprivilegiados.

No artigo Gender Shades – Intersectional Accuracy Disparities in Commercial Gender Classification, as pesquisadoras Joy Buolamwini (MIT Media Lab) e Timnit Gebru (Microsoft Research) apresentam pesquisa sobre vieses interseccionais negativos em sistemas automatizados de classificação. Um agravante é que, na medida em que sistemas de inteligência artificial se baseiam em bases de dados construídas a partir de inputs preexistentes, a tendência é que sistemas derivados intensifiquem os vieses já presentes nas sociedades.

Os exemplos destes vieses são inúmeros. Já falamos aqui sobre estudos sobre reconhecimento de rostos (realizado pela própria Buolamwini), mecanismos de buscas e modelos preditivos para intensificação de vigilância. Nos EUA, mais de 117 milhões de pessoas estão inclusas em redes policiais de identificação de faces – e diferenças na precisão destes sistemas podem arruinar vidas.

No artigo, as autoras apresentam histórico de estudos e debate sobre a construção de bases de treinamento para identificação de gênero para aprendizado de máquina, partindo da discussão de duas bases públicas bastante utilizadas: a IJB-A e o gerado pela Adience. O primeiro, IJB-A, foi criado pelo Intelligence Advanced Research Projects Activity do governo americano e incluía, no momento de produção do artigo, 500 imagens de rostos indivíduos públicos. Já o Adience, por sua vez, possui imagens cerca de 2.284 indivíduos únicos e foi gerada a partir de coleta no Flickr.

Detalhes sobre a base Adience

Mas usar estas bases públicas de treinamento gera bons resultados? Entender os vieses em bases públicas é essencial pois inúmeros softwares e sistemas podem ser construídos de forma derivada a partir deles, reforçando os problemas. E a investigação sobre estas bases permite estabelecer procedimentos para auditoria de sistemas comerciais e sistemas criados/contratados por instituições públicas. Para fim de comparação, então, a autoras criaram uma base de dados própria com procedimentos mais rigorosos.

A Pilot Parliaments Benchmark reúne fotos de 1270 membros parlamentares de seis países: Ruanda, Senegal, África do Sul, Finlândia, Islândia e Suécia. Estes países foram escolhidos por terem proporção relativamente alta de distribuição entre homens e mulheres e representarem tons de pele variados, dos mais escuros aos mais claros. Levando em conta que o construto “raça” é contextual de acordo com cada cultura e país, as autoras optaram por fazer a intersecção de gênero com a variável de cor de pele, a partir da tipologia Fitzpatrick Skin Type, muito usada também por dermatologistas.

Exemplo de faces no Pilot Parliaments Benchmark

Depois de construir o PPB mais preciso e confiável do que as outras bases citadas, as autoras partem então para comparar os resultados dos classificadores comerciais. Buolamwini e Gebru selecionaram IBM Watson, Microsoft Cognitive Services e o Face++  para avaliar a precisão de identificação de gênero no dataset construído. Os resultados variaram de forma impressionante:

  • Todos classificadores foram mais precisos em faces de homens (8,1% – 20,6% diferência de taxa de erro)
  • Todos classificadores performaram melhor em faces mais claras do que faces mais escuras (11,8% contra 19,2% de erro)
  • Todos classificadores performaram pior em faces mais escuras de mulheres (20,8% comparado a 34,7%)
  • Os classificadores da Microsoft e IBM performaram melhor em rotos de homens de pele clara (taxas de erro de 0,0% e 0,3%)
  • Os classificadores do Face++ performaram melhor em rostos masculinos de pele escura (0,7% de taxa de erro)
  • A diferença máxima de taxa de erro entre dois grupos foi de 34,4%!

Ao longo da seção de análise do artigo, as autoras apresentam detalhamento de resultados e comparações entre sub-datasets controlando variáveis como qualidade das imagens. Os resultados apontam inconsistência nas classificações que deixam negros e, sobretudo, mulheres negras em desvantagens, enfatizando a importância de auditoria algorítmica e acompanhamento da sociedade civil sobre agentes artificiais que possam tomar decisões quanto a identificação de pessoas, comunicação automatizada e, sobretudo, aplicações relacionadas a vigilância.

Algorithmic transparency and accountability reach beyond technical reports and should include mechanisms for consent and redress which we do not focus on here. Nonetheless, the ndings from this work concerning benchmark representation and intersectional auditing provide empirical support for increased demographic and phenotypic transparency and accountability in arti cial intelligence.

Assista abaixo um sumário em vídeo do artigo:

A Cor como Informação, de Luciano Guimarães

a-cor-como-informacao-luciano-guimaraesLuciano Guimarães é jornalista, designer, doutor em Comunicação e Semiótica e professor da UNESP. Em 2001 lançou o livro A Cor como Informação – a construção biofísica, linguística e cultural da simbologia das cores.

A partir do trabalho do semioticista Ivan Bystrina (especialmente Semiótica da Cultura), o livro atravessa os vários níveis (biofísicos, linguísticos e culturais ) que estão envolvidos na linguagem das cores.

Os títulos de capítulos são um tanto lúdicos:
1. Introdução: preto no branco
2. Capítulo violeta: a cor para todos os olhares
3. Capítulo azul: a cor profunda
4. Capítulo verde: fotossíntese da cor
5. Capítulo amarelo: tesouros do arco-da-velha
6. Capítulo laranja: a hora da digestão
7. Capítulo vermelho: violência e paixão
8. Conclusão: cinza no ventilador

Confesso que foi este livro que finalmente me fez entender o sistema aditivo e o subtrativo na composição de cores, e como eles se relacionam. O “Capítulo verde: fotossíntese da cor” trata dos vários sistemas de cor existentes, dos métodos compositivos e das diversas denominações conflituosas das características da cor, propondo o estabelecimento de matiz, valor e croma.

O capítulo Vermelho é a aplicação do que foi discutido no livro, depois de ter culminado numa síntese durante o capítulo Laranja. A análise do uso do vermelho nas capas da revista Veja é bastante interessante. Conotações ideológicas, biológicas ou conjunturais são observadas durante os mais de 30 anos de publicação analisados.

Este livro foi lançado em 2001. Em 2003, o autor lançou “As Cores na Mídia – a organização da cor-informação no jornalismo”, todo voltado para análise da cor em produtos jornalísticos como telejornais, jornais impressos, revistas e websites.

+ Mais
– Compre A Cor como Informação
– Compre As Cores na Mídia
– Compre A Semiótica da Cultura

Cor, Contraste e Volume no Design de Notícias

Color, Contrast & Dimension in News Design é um guia sobre cor criado por Pegie Stark Adam. Trata de teoria da cor e sua aplicação no design de notícias, com exercícios práticos. Também fala de Eye-Track Research, uma pesquisa sobre a influência da cor na leitura, trajetória do olhar e percepção de páginas de jornais. O guia e a pesquisa foram financiados pela organização Poynter, uma escola e instituto de jornalismo da Flórida. A página de internet (aqui) traz vários artigos sobre fotojornalismo e design de notícias, vale a visita.

Color in Motion


A página Color in Motion é uma “Experiência interativa de comunicação por cor e simbolismo das cores”. Criada por Maria Claudia Cortes, a página em flash traz “fichas técnicas” sobre as três cores primárias e secundárias, um laboratório para manipular as cores e, a mais criativa de todas as opções: vídeos em que as cores, antropomorfizadas, fazem ações relacionadas ao ”simbolismo” de cada uma delas.