Interrogando APIs de Visão Computacional – publicado relatório do #SMARTDataSprint

No final de janeiro aconteceu mais uma edição do SMART Data Sprint, um evento que reúne pesquisadores, programadores e designers para trabalho colaborativo sobre um determinado tema de pesquisa – e bases de dados. Tive a oportunidade de, junto ao Andre Mintz, idealizar o projeto “Interrogating Vision APIs“. Durante quatro dias, Mintz se juntou aos pesquisadores Beatrice Gobbo, Elena Pilipets, Hamdan Azhar, Helen Takamitsu, Janna Joceli Omena e Taís Oliveira para analisar ao mesmo tempo, com métodos digitais, duas perguntas de pesquisa:

a) Quais são as diferenças entre os principais fornecedores de visão computacional?

b) Podemos investigar representações nacionais usando ferramentas de visão computacional?

Para responder estas perguntas, foram processadas mais de 60 mil imagens provenientes de bancos de imagens (Shutterstock, Adobe Stock e Getty Images) para resultados à buscas como “brazilian”, “british”, “indian”, “portuguese” e outros marcadores de nacionalidade em cada um dos recursos de visão computacional citados anteriormente. O time focou em quatro nacionalidades (brasileiros, nigerianos, austríacos e portugueses).

Foram aplicados de modo emergente métodos como text analysis, visualização de redes, descrição densa e cálculos estatísticos para entender as similaridades e diferenças tanto entre os fornecedores de visão computacional quanto entre os diferentes bancos de imagens e nacionalidades representadas.

Como primeiro resultado público do esforço, um extenso relatório que também inclui protocolos de pesquisa (para replicação), detalhes sobre a metodologia, questões de pesquisa, design da pesquisa, descobertas e dicussão foi publicado no site do Inova Media Lab, organizador do evento. Em breve os autores produzirão textos acadêmicos e desdobramentos sobre o estudo, mas gostaria de adiantar – para os lusófonos, um mini-resumo das principais descobertas.

 

Diferenças entre fornecedores de computação visual

As três APIs de computação visual abordadas – desenvolvidas por Google, IBM e Microsoft – apresentam características bem diferentes de etiquetagem que descrevem diferentes ontologias e espaços semânticos. Sobre níveis de detalhes, a API da Google tende a maiores níveis de especificidade; IBM apresenta alguma especificidade mas não tanta quanto a da Google; e a da Microsoft é geralmente muito genérica e possui um escopo limitado de etiquetagem. A imagem abaixo apresenta uma comparação anedótica sobre as abordagens:

 

Redes visuais como ferramentas descritivas úteis à pesquisa social sobre representação

Sites de bancos de imagens representam visualidades com temas recorrentes para os quais as APIs de computação visual são úteis como recursos descritivos, mostrando configurações e padrões emergentes dos temas construídos como típicos para cada grupo – nacionalidade no caso. A visualização abaixo, por exemplo, mostra na rede de labels (etiquetas) como, para cada país, as APIs e a clusterização em rede (no Gephi) permitiu encontrar um padrão recorrente de grupos ligados a: a) natureza; b) comida; e c) pessoas. Para cada país um grande grupo de imagens sobre algum aspecto cultural (ou estereótipo online) esteve também presente: Carnaval para Brasil; Têxtil para Portugal; Cidade e Arquitetura para Áustria; e Dinheiro para Nigéria.

 

Visão computacional e culturas

As APIs de visão computacional apresentaram diferentes níveis de sensibilidade e modos de tratamento de imagens de culturas específicas. Por exemplo, enquanto o Google reconheceu vários itens específicos sobre comida ou instrumentos musicais, a precisão nem sempre foi satisfatória tanto no serviço da Google quanto na dos demais. Em alguns casos, as APIs reproduziram invisibilidades de marcadores culturais de grupos minorizados, possível reforço de relações étnico-raciais hierarquizadas. Na imagem abaixo vemos um dos exemplos nos quais a Google Vision marcou como peruca (“wig”) um cabelo natural:

Há muito mais no relatório que pode ser lido em toda sua extensão em https://smart.inovamedialab.org/smart-2019/project-reports/interrogating-vision-apis/

8 livros e pesquisadoras sobre tecnologia digital, plataformas, algoritmos e genética

Neste Dia Internacional da Mulher vale notar/celebrar um resultado dos vieses de experiência, expectativas laborais e educação no mundo: as mulheres pesquisadoras estão liderando o debate sobre plataformas e algoritmos digitais e seus impactos na sociedade. Então aproveito a data para celebrar 8 livros publicados nos últimos anos indispensáveis para quem deseja compreender a contemporaneidade:

 

#1 Algorithms of Oppression: How Search Engines Reinforce Racism

Em Algorithms of Oppression: How Search Engines Reinforce Racism (2018), Safiya Noble apresenta pesquisa focada em como plataformas de busca de informação – sobretudo buscadores como Google – reproduzem e reforçam aspectos nocivos da sociedade como o racismo. Através de experimentos, levantamento bibliográfico, histórico e entrevistas, Safiya Noble mostra casos e ações relacionadas à populações minorizadas sobretudo dos EUA, como afro-americanas, latinas, judeus e asiáticos.

Clique na imagem ao lado para ler uma resenha e assista TEDx com Noble em:

 


 

#2 Artificial UnIntelligence: How Computer Misunderstand the World

Em Artificial UnIntelligence: How Computers Misunderstand the World (2018), Meredith Broussard explica os problemas dos sistemas considerados inteligência artificial hoje (como carros autônomos, métricas de plataformas digitais e outros) em três partes: “Como computadores funcionam”, “Quando computadores não funcionam” e “Trabalhando juntos”. Um destaque da publicação é que Broussard apresenta alguns conceitos através de tutoriais no Python acessíveis até para quem nunca escreveu uma linha de código na vida.

Clique na imagem ao lado para ler uma resenha e assista entrevista com Broussard abaixo:


 

#3 The Intersectional Internet: Race, Sex, Class and Culture Online

Intersectional Internet: Race, Sex, Class and Culture Online (2016) é uma coletânea editada por Safiya Noble e Brendesha Tynes. Reúne capítulos de pesquisadoras e pesquisadores estudando questões de raça, gênero e classe na internet tais como: políticas de viralidade e virilidade em masculinidades asiáticas; moderação comercial de conteúdo; análise interseccional de apps de encontros; memes no Instagram e adolescentes negras e outros.

Assista entrevista com Brendesha Tynes abaixo:

Expert Interview with Dr. Brendesha Tynes from The Steve Fund on Vimeo.


 

#4 Twitter and Tear Gas: the power and fragility of networked protest

Zeynep Tufekci é pesquisadora, ativista e jornalista turca. Em Twitter and Tear Gas: the power and fragility of networked protest, Tufekci trouxe em 2017 um outro olhar sobre os ainda festejados protestos impulsionados por plataformas de mídias sociais, como a “Primavera Árabe”. Como a veloz história mostrou, o resultado de movimentos como estes, inclusive no Brasil, foi muito diferente do que os mais empolgados da esquerda previam. Nos últimos 5 anos sobretudo a inocência sobre as mídias sociais ficou de lado em grande medida, mas o livro de Tufekci traz a tecno-sociológico sobre a contemporaneidade que vai além do simplista. O livro está disponível em versão impressa, ebook, audiobook e também um PDF de acesso livre, exigência da autora devido à importância do debate.

Assista palestra da autora em:


#5 Fatal Invention – how science, politics, and big business re-create race in the twenty-first century

Em um mundo supremacista branco, a ciência, política e grandes empresas de tecnologia estão empenhadas em recriar a noção biológica de raça através de sistemas pervasivos de tecnologia como inteligência artificial, reconhecimento de imagens, biometria e testes genéticos. Este é o tema de Fatal Invention – how science, politics, and big business re-create race in the twenty-first century de Dorothy Roberts (2012). O livro revisa conceitos de raça, eugenia, o papel da ciência racial na supremacia branca e trata de manifestações contemporâneas na genética, desenvolvimento de farmacológicos customizados, vigilância genética e outras tecnologias.

Abaixo um vídeo no qual Roberts explica o problema com medicina baseada em “raça”:


#6 The Social Life of DNA: Race, Reparations, and Reconciliation after the Genome

Em The Social Life of DNA: Race, Reparations, and Reconciliation after the Genome (2016),  Alondra Nelson traz um outro olhar ao discutir como a tecnologia de identificação de DNA, sobretudo levantamento de genealogia e origens geográficas da diáspora africana possuem impactos relevantes. Uma vez que os milhões de africanos sequestrados entre os séculos XVI e XIX foram torturados, desumanizados e impedidos de desenvolver sua educação, história e memória, Alondra Nelson mostra como das já numerosas iniciativas de afro-diaspóricos de se reconectar com a África emergem potencial e os benefícios dessa tendência.

Alondra Nelson também é autora de outros livros como Body and Soul: The Black Panther Party and the Fight Against Medical Discrimination (2011), Technicolor: Race, Technology, and Everyday Life (2001) e editora de um número especial de revista Social Text que discutiu afrofuturismo em 2002. Veja entrevista com a autora sobre o tema:

 


#7 A Networked Self and Human Augmentics, Artificial Intelligence, Sentience

Zizi Papacharissi pesquisa comunicação digital há décadas e é responsável por algumas coletâneas mais influentes no campo, como o excelente A Networked Self: Identity, Community, and Culture on Social Network Sites. Em 2018 Papacharissi lançou nada menos que três coletâneas a partir da ideia de networked self: um com recorte sobre nascimento, vida, morte e família; outro sobre plataformas, estórias e conexões; e, por fim, o que destaco sobre inteligência artificial, senciência e augmentics: A Networked Self and Human Augmentics, Artificial Intelligence, Sentience (2018). O livro reúne 14 capítulos sobre aspectos tecnológicos e éticos como direitos de agentes artificiais e impactos da IA no self.

Palestra recente da Papacharissi:

 


#8 Digital Sociologies

Organizado por Jessie Daniels, Karen Gregory e Tressie Mcmillan Cottom, Digital Sociologies (2016) é fruto de conferência sobre as sociologias digitais plurais. Na primeira parte, em 7 capítulos, trata da sociologia digital na vida cotidiana, falando de temas como estudos de comunidades online, análise de discurso digital em pequenos espaços ou gerenciamento de impressões digitais na “economia do compartilhamento. A segunda parte foca em instituições e traz 11 capítulos em torno de desigualdade e instituições, papel dos algoritmos em decisões educacionais, raça e racismo na educação e convergência de audiências online em torno de produtos culturais. A terceira parte traz mais 10 capítulos e é repleta de estudos de caso sobre corpos e corporeidade nas interseções com raça, gênero, classe e sexualidades em ambientes como Twitter, websites, apps de quantified self e tecnologias vestíveis.

Assista palestra de Tressie McMillan Cottom:

 

Quer acompanhar em tempo real o que algumas destas pesquisadoras estão produzindo? Siga lista curada no Twitter!

Salvador sediará o IV Simpósio Lavits: vigilância, gênero e raça

A LAVITS é a Rede Latino-Americana de Estudos sobre Vigilância, Tecnologia e Sociedade. De 26 a 27 de junho organizará seu sexto simpósio com o tema Assimetrias e (In)Visibilidades: Vigilância, Gênero e Raça. As chamadas para trabalhos individuais, sessões livres, oficina e mostras artísticas estão abertas até o dia 15 de março. No caso dos trabalhos individuais, o envio no momento é apenas dos resumos (até 300 palavras) e os trabalhos completos aprovados deverão ser enviados até 30 de maio. Confira mais informações:

 

W. E. B. Du Bois e a visualização de dados sobre os negros nos EUA no início do século XX

W. E. B. Du Bois (1863 – 1963) foi um dos maiores sociólogos e ativistas americanos desde a virada do século XX até sua morte nos anos 60. Invisibilizado pelo racismo generalizado também na ciência social, Dubois teve uma prolífica produção através de livros acadêmicos, revistas científicas e fundador do Movimento Niagara de ativismo pelos direitos humanos. Também foi Secretário do Primeiro Congresso Pan-Africano e fundou a importante National Association for the Advancement of Colored People (NAACP). Apesar da enorme produção, seu único livro traduzido para o português é o essencial The Souls of Black Folk, publicado em 1903 e traduzido para o português como As Almas do Povo Negro apenas em 1998, esgotado e sem novas edições (veja tradução/transcrição alternativa por José da Costa).

Primeiro negro a prestigiar Harvard com sua pesquisa de doutorado, nunca permitiu que seu pensamento e trabalho se restringissem ao mundo puramente acadêmico. Entre seus maiores feitos está a exposição American Negro Exhibit, que tomou lugar corajosamente na Exposição Universal de Paris de 1900. Na virada do século XIX ao XX as feiras mundiais tomaram lugar nas grandes metrópoles e tinham o objetivo de celebrar os avanços da humanidade – sobretudo dos países patrocinadores – em termos de indústria, maquinaria, invenções, arquitetura e ciência de todo o tipo. A Exposição Universal de Paris de 1900 foi visitada por cerca de 50 milhões de pessoas de todo o mundo. Thomas Junius Calloway, advogado, educador e jornalista, com o apoio de Booker T. Washington, solicitou ao governo dos EUA espaço no pavilhão estadunidense para mostrar o suposto compromisso do país com reformas sociais através da exposição, com colaborações de universidades e colégios industriais afro-americanos.

W. E. B. Du Bois foi convidado a participar com estudos sociais sobre a vida dos afro-americanos. Reuniu, então, dois grupos de visualizações de dados produzidas por sua equipe de estudantes e alunos da Universidade de Atlanta. O primeiro deles, chamado The Georgia Negro: A Social Study, apresentou informações sobre a população negra do estado da Georgia, então o estado com a maior população negra nos EUA. O segundo grupo de infográficos foi chamado de A Series of Statistical Chats Illustrating the Condition of the Descendants of Former African Slaves Now in Residance in the United States of America. Este grupo reuniu informações sobre educação, emprego, aspectos financeiros e outros.

Lançado no final de 2018, o livro W. E. B. Du Bois’s Data Portrais: VIsualizing Black America traz esta história, artigos, fotografias da exposição e visualizações produzidas por Du Bois com o enfoque na visualização de dados e seu impacto. Foi organizado por Whitney Battle-Baptiste e Britt Rusert,  do Departamento de Estudos Afro-Americanos W. E. B. Dubois da Universidade de Massachusetts Amherst.  Com 200 páginas, 150 são dedicadas a impressões em boa definição dos gráficos, mapas e linha do tempo apresentadas por Du Bois. Para as organizadoras, “as políticas da visualidade e a questão específica da visualidade negra eram centrais para o pensamento de Du Bois e sua teoria da dupla consciência foi expressa em um registro visual único”.

Depois da introdução pelas organizadoras, o livro inclui também textos de convidados. O primeiro é American Negro at Paris, 1900, de Aldon Morris, onde o autor traz mais informações sobre a exposição e conclui que “previu novas possibilidades de comunicar conhecimento sociológico para o público geral. Do vantajoso ponto de vista da virada do século, a sociologia inovadora na exposição segue resistindo ao teste do tempo”.

Em The Cartography of W. E. B. Du Bois’s Color Line, Mabel O. Wilson se debruça com mais atenção aos mapas e cartografias incluídas na exposição, partindo da visualização sobre o sequestro e tráfico negreiro para as Américas e Europa. A autora destaca especialmente como Du Bois conseguiu, a partir de seu trabalho e visualizações, combater a desinformação racista proposta por Hegel, que dedicou textos a negar a história da África e promover o racismo “científico”.

Por fim, em Introduction to the Plates, Silas Munro sublinha o aspecto inovador das produções de Du Bois e como avançou e aplicou na prática as invenções de William Playfair e Florence Nightingale. Para Munro, “A inovação retórica nas ciências sociais combinada com uma estética visual no início do século XX tornou a exposição um material presciente de trabalho em design. Estas visualizações ofereceram um protótipo de práticas de design que não foram amplamente usadas até um século depois, antecipando as tendências – hoje vitais no mundo contemporâneo – de design para inovação social, visualização de dados em serviço de justiça social e a decolonização da pedagogia”.

Veja algumas das visualizações e imagens do livro (algumas fotografias minhas e outras da Smithsonian mas todas estão no livro):

a) Índice das visualizações

 

b) Visualização do sequestro e tráfico negreiro

 

c) Cartão postal da exposição Pan-Americana em Nova Iorque, realizada no ano seguinte

 

d) Ocupação dos negros americanos depois da emancipação

 

e) Estudantes negros em escolas da Georgia

 

f) População negra e status de escravidão/liberdade de 1790 a 1870

 

g) Comparação de ocupação entre negros e brancos na Georgia

Evocando Cartões Postais no Instagram: estudo automatizado de imagens

Escrito em parceria com a orientanda de especialização Mariana Zanotti, aprovei artigo Evocando Cartões Postais no Instagram: estudo automatizado de imagens no Congresso Nacional da Intercom deste ano, que acontecerá em Joinville. O artigo faz parte de uma série de experimentos sobre a aplicação de computação visual ao estudo da comunicação e cultura, que estamos desenvolvendo no IBPAD e já teve estudos sobre marketing turístico, estudo de influenciadores, construção de imagem política entre outros.

Resumo: Os cartões postais são materiais mistificados desde a sua gênese no final do século XX. Entre sinais de crise e ressignificação, mantêm-se como objeto cultural reconhecível por indivíduos de todo o mundo, a despeito de serem efetivamente usuários ou não do formato. Com a popularização de sites de redes sociais e aplicativos voltados a publicação cotidiana de fotografias, como o Instagram, usuários evocam estilos de formatos consagrados. O artigo apresenta experimento de análise e visualização apoiada por computação visual de 14 mil publicações com a hashtag #postcard. Como resultado da aplicação de algoritmos de modularidade, identificou 7 agrupamentos de entidades visuais presentes nas fotografias, através das quais os usuários se apropriam do conhecimento tácito dos públicos sobre o formato para gerar conteúdos de construção estratégica de seus perfis pessoais para suas audiências.

A imagem abaixo representa a rede de imagens gerada durante a análise e descrita no trabalho. Além do artigo, compartilhamos também os datasets principais.

 

Saiba mais sobre o evento em http://www.portalintercom.org.br/eventos1/congresso-nacional/2018  e acesse o artigo diretamente no ResearchGate