Premiação de Jornalismo incentiva o technochauvinismo do Estadão e Microsoft

Qual o limite entre as decisões e direcionamento editoriais quanto a aspectos narrativos e de reportagem de fatos do jornalismo e a seleção de técnicas e ferramentas aparentemente neutras? Que o Estadão é um veículo que frequentemente representa o pior que há no jornalismo brasileiro é algo pouco questionável mas e sobre o excelente trabalho técnico das equipes de jornalismo de dados e infografia?

Gostaria de tratar aqui de um caso que me chocou nas eleições passadas. O Estadão buscou usar uma técnica de “inteligência artificial” para supostamente medir em tempo real as emoções dos candidatos durante o debate presidencial. No dia do debate comentei no Twitter sobre os problemas da matéria, mas para minha surpresa o projeto foi indicado ao Prêmio de Inovação em Jornalismo de Dados do Data Journalism Award em 2019.

(Clique para abrir no Wayback Machine)

Considerando o absurdo de uma matéria deste tipo ser indicada a um prêmio deste monte, vale adicionar algumas reflexões, comentários e dados para que jornalistas reflitam sobre o uso destas tecnologias.

Análise de emoções por visão computacional deveria ser estreada em um debate eleitoral à presidência? Este primeiro ponto é uma simples questão de responsabilidade. Assumindo por enquanto que a tecnologia tenha algum nível de precisão, será que os jornalistas deveriam fazer suas primeiras reportagens com a tecnologia justamente em algo tão relevante quanto um debate presidencial? A atribuição de juízos pode ser feita na imagem abaixo, por exemplo. Em trecho sobre Marina, afirma que a candidata “entra no grupo dos candidatos infelizes”.

Gráfico desenvolvido pelo Estadão

A atribuição a um grupo específico associa a imagem da candidata a valores que são rejeitados por eleitores (como inércia, fragilidade, falta de espontaneidade) a partir da avaliação de uma ferramenta automatizada. Até que ponto esta avaliação é justa?

Seduzidos pela quantidade de dados – que estão longe de se transformarem em informação -, os redatores chegam a falar de “depressão na reta final” ao comentar sobre a mensuração das supostas emoções do Álvaro Dias. A empolgação com a tecnologia leva a outros absurdos conceituais sobre emoções e condições mentais que nos fazem lembrar que a reportagem não incluiu um psicólogo entre os redatores, caso típico de colonialismo de campo: a tecnologia é mais importante que os especialistas?

Um veículo jornalístico deveria depender um fornecedor que oferece seu serviço como “caixa preta”? A ideia de caixa preta na Engenharia e nos Estudos de Ciência e Tecnologia se refere a dispositivos ou sistemas que se baseiam em entradas (“inputs”) e saídas (“outputs”) sem que o usuário entenda o que acontece entre estas duas etapas. Mas como funciona em suas minúcias? Quais fatores estão sendo levados em conta? Boa parte dos sistemas de aprendizado de máquina caem nesta categoria, sobretudo os sistemas proprietários e fechados oferecidos através de APIs como a Microsoft.

A Microsoft tem histórico de erros terríveis com inteligência artificial e visão computacional. Isto não deveria ser levado em conta? Talvez o caso mais famoso de auditoria algorítmica seja o projeto Gender Shades de Joy Buolamwini e colaboradoras. Num dos primeiros estudos (realizado por Buolamwini e Timnit Gebru), as pesquisadoras identificaram que a Microsoft a taxa de acerto em classificadores de gênero, por exemplo, foi de 79,2% em mulheres de pele escura em comparação a 100% em homens de pele clara.

O estudo acima é um dos mais robustos na história da auditoria algorítmica e gerou diversos resultados, como alguma melhoria do sistema pela Microsoft e competidores. Mas são inúmeros os outros estudos que mostram os problemas interseccionais do uso de análise de emoções em tecnologias do tipo, como o trabalho de Laura Rhue:

Por que usar especificamente uma API comercial? E por que a Microsoft? Um ponto relevante é que análises similares ao que foi feito na reportagem podem ser feitas com conjuntos de deep learning como a TensorFlow. Não acredito que o jornalismo em sua área mais importante, política, deve se pautar por lobby de corporações, sobretudo estrangeiras. Para além disto, a Microsoft seria a melhor opção? Em projeto que o Andre Mintz e eu lideramos sobre image labelling, o produto da Microsoft esteve muito aquém de seus principais competidores, a IBM e a Google:

Como é possível ver acima, em projeto realizado em janeiro de 2019, o recurso de etiquetamento de imagens da Microsoft esteve muito atrás de seus principais competidores em datasets que analisamos. É importante olhar para este dado para lembrar que a análise de imagens é uma tarefa muito complexa e ideias de “neutralidade” ou “objetividade” são risíveis.

Análise (automatizada) de emoções deveria ser utilizada pelo jornalismo? Aqui é importante que eu esclareça que não tenho restrições à tecnologia de reconhecimento de emoções ou etiquetamento de imagens em si. Pelo contrário, além do projeto que referencio nas imagens acima também aplico a tecnologia em algumas áreas como análise de consumo e tendências para clientes de várias áreas. Mas jamais usaria para atribuir julgamentos de performance ou disposições a seres humanos em um evento tão relevante para o futuro do país.

Há muitas controvérsias sobre a efetividade das propostas do Paul Ekman, o psicólogo que inventou esta tipologia de emoções e suas técnicas para supostamente identificá-las, assim como sua metodologia para interrogar suspeitos. Expressões faciais não são universais como se pensava e Ekman usou literalmente a metáfora da “mina de ouro” para falar de sua pesquisa – ganhando milhões em aplicações questionáveis ideologicamente.

Em conclusão, acredito que tanto a idealização da matéria quanto a injusta indicação ao prêmio pelo Data Journalism Awards são exemplos do technochauvinismo. Este é um conceito proposto por Meredith Broussard no livro Artificial Unintelligence. Segundo Broussard, seria:

a crença de que mais “tecnologia” é sempre a solução. Tecnochauvinismo é frequentemente acompanhado por meritocracia neoliberal, defesa distorcida da “liberdade de expressão” para manter discurso de ódio; da ideia de que computadores seria objetivos e uma fé de que o mundo com mais computadores resolveriam problemas sociais.

Mais pirotecnia tecnológica não é a solução pro jornalismo, sobretudo em temas e eventos sensíveis, sobretudo quando se trata de normalizar o produto de corporações tecnológicas que estão bem longe da precisão. Uma premiação para a reportagem como a citada pode dar a impressão a jovens jornalistas que os campos da infografia, análise e visualização de dados devam ser um fim em si mesmos, independente dos impactos nocivos que possam trazer.

É preciso pensar no papel social não só do jornalismo “em si”, mas também como escolhe, aplica e reproduz tecnologias.

W. E. B. Du Bois e a visualização de dados sobre os negros nos EUA no início do século XX

W. E. B. Du Bois (1863 – 1963) foi um dos maiores sociólogos e ativistas americanos desde a virada do século XX até sua morte nos anos 60. Invisibilizado pelo racismo generalizado também na ciência social, Dubois teve uma prolífica produção através de livros acadêmicos, revistas científicas e fundador do Movimento Niagara de ativismo pelos direitos humanos. Também foi Secretário do Primeiro Congresso Pan-Africano e fundou a importante National Association for the Advancement of Colored People (NAACP). Apesar da enorme produção, seu único livro traduzido para o português é o essencial The Souls of Black Folk, publicado em 1903 e traduzido para o português como As Almas do Povo Negro apenas em 1998, esgotado e sem novas edições (veja tradução/transcrição alternativa por José da Costa).

Primeiro negro a prestigiar Harvard com sua pesquisa de doutorado, nunca permitiu que seu pensamento e trabalho se restringissem ao mundo puramente acadêmico. Entre seus maiores feitos está a exposição American Negro Exhibit, que tomou lugar corajosamente na Exposição Universal de Paris de 1900. Na virada do século XIX ao XX as feiras mundiais tomaram lugar nas grandes metrópoles e tinham o objetivo de celebrar os avanços da humanidade – sobretudo dos países patrocinadores – em termos de indústria, maquinaria, invenções, arquitetura e ciência de todo o tipo. A Exposição Universal de Paris de 1900 foi visitada por cerca de 50 milhões de pessoas de todo o mundo. Thomas Junius Calloway, advogado, educador e jornalista, com o apoio de Booker T. Washington, solicitou ao governo dos EUA espaço no pavilhão estadunidense para mostrar o suposto compromisso do país com reformas sociais através da exposição, com colaborações de universidades e colégios industriais afro-americanos.

W. E. B. Du Bois foi convidado a participar com estudos sociais sobre a vida dos afro-americanos. Reuniu, então, dois grupos de visualizações de dados produzidas por sua equipe de estudantes e alunos da Universidade de Atlanta. O primeiro deles, chamado The Georgia Negro: A Social Study, apresentou informações sobre a população negra do estado da Georgia, então o estado com a maior população negra nos EUA. O segundo grupo de infográficos foi chamado de A Series of Statistical Chats Illustrating the Condition of the Descendants of Former African Slaves Now in Residance in the United States of America. Este grupo reuniu informações sobre educação, emprego, aspectos financeiros e outros.

Lançado no final de 2018, o livro W. E. B. Du Bois’s Data Portrais: VIsualizing Black America traz esta história, artigos, fotografias da exposição e visualizações produzidas por Du Bois com o enfoque na visualização de dados e seu impacto. Foi organizado por Whitney Battle-Baptiste e Britt Rusert,  do Departamento de Estudos Afro-Americanos W. E. B. Dubois da Universidade de Massachusetts Amherst.  Com 200 páginas, 150 são dedicadas a impressões em boa definição dos gráficos, mapas e linha do tempo apresentadas por Du Bois. Para as organizadoras, “as políticas da visualidade e a questão específica da visualidade negra eram centrais para o pensamento de Du Bois e sua teoria da dupla consciência foi expressa em um registro visual único”.

Depois da introdução pelas organizadoras, o livro inclui também textos de convidados. O primeiro é American Negro at Paris, 1900, de Aldon Morris, onde o autor traz mais informações sobre a exposição e conclui que “previu novas possibilidades de comunicar conhecimento sociológico para o público geral. Do vantajoso ponto de vista da virada do século, a sociologia inovadora na exposição segue resistindo ao teste do tempo”.

Em The Cartography of W. E. B. Du Bois’s Color Line, Mabel O. Wilson se debruça com mais atenção aos mapas e cartografias incluídas na exposição, partindo da visualização sobre o sequestro e tráfico negreiro para as Américas e Europa. A autora destaca especialmente como Du Bois conseguiu, a partir de seu trabalho e visualizações, combater a desinformação racista proposta por Hegel, que dedicou textos a negar a história da África e promover o racismo “científico”.

Por fim, em Introduction to the Plates, Silas Munro sublinha o aspecto inovador das produções de Du Bois e como avançou e aplicou na prática as invenções de William Playfair e Florence Nightingale. Para Munro, “A inovação retórica nas ciências sociais combinada com uma estética visual no início do século XX tornou a exposição um material presciente de trabalho em design. Estas visualizações ofereceram um protótipo de práticas de design que não foram amplamente usadas até um século depois, antecipando as tendências – hoje vitais no mundo contemporâneo – de design para inovação social, visualização de dados em serviço de justiça social e a decolonização da pedagogia”.

Veja algumas das visualizações e imagens do livro (algumas fotografias minhas e outras da Smithsonian mas todas estão no livro):

a) Índice das visualizações

 

b) Visualização do sequestro e tráfico negreiro

 

c) Cartão postal da exposição Pan-Americana em Nova Iorque, realizada no ano seguinte

 

d) Ocupação dos negros americanos depois da emancipação

 

e) Estudantes negros em escolas da Georgia

 

f) População negra e status de escravidão/liberdade de 1790 a 1870

 

g) Comparação de ocupação entre negros e brancos na Georgia

Visualização de Dados: entrevista com Julie Teixeira

social analytics summit

Nos próximos dias 27 e 28, acontecerá em São Paulo workshop e palestras do Social Analytics Summit, principal evento de monitoramento, mensuração e pesquisa em mídias sociais no Brasil. Tenho o prazer realizar a curadoria junto a Mariana Oliveira e estamos entrevistando alguns dos palestrantes.

julie teixeiraNeste post a conversa é com Julie Teixeira, Coordenadora de Business Intelligence na Trip Editora. Formada em Relações Públicas, tem experiência em agências como Ogilvy & Mather e Remix Social Ideias, além de outros projetos culturais/editoriais como Inmovimento Filmes, Grupo RBS e Revista Noize. Nos últimos anos tem estudado e aplicado técnicas de visualização de dados à inteligência em mídias sociais. Será responsável pelo módulo sobre o tema no workshop do evento.
Tarcízio: Qual impacto a visualização de dados traz para entregas de informação que, ao contrário de uma página de jornal ou revista, não será vista por milhares de pessoas? Vale a pena o apuro estético e conceitual para meia dúzia de “leitores”?

Julie: O objetivo do dataviz ~spoiler alert~ é comunicar um dado da melhor maneira possível: fácil e rápida de ser absorvida. Então, ao contrário do que muitos pensam, dataviz não é sobre apelo estético, isso é só uma consequência de um trabalho bem feito.

A entrega desse material (relatórios e análises de dados) tem como objetivo ajudar na tomada de decisão. As pessoas responsáveis costumam ter rotinas atarefadas e caóticas e não podem perder tempo tentando decifrar um relatório bagunçado.

Então o trabalho de dataviz é fundamental para que as poucas pessoas que vejam esse material absorvam rapidamente o conteúdo que foi proposto, sem nenhum grau de imprecisão ou dúvida.
Se as pessoas que usam as análises da minha equipe para decidir a estratégia do próximo semestre não entendem direito o que quis ser comunicado, o trabalho está incompleto (pra não dizer completamente inútil).
Então a resposta curta é: sim, é imprescindível.

E SE EU PUDER FAZER UM ADENDO AQUI:
Migos dos infográficos, não joguem um monte de informação em cima do diretor de arte e vão embora. O diretor de arte muitas vezes não tem conhecimento sobre dados – e na maioria dos contextos nem é obrigado a ter – aí terminamos com aqueles infográficos lindos, cheios de ícones completamente fora de proporção, com informações sem referência e incomparáveis entre si (quando deveriam ser).

Pra maioria das pessoas, dados são um mistério e o nosso trabalho é facilitar o entendimento e não o contrário.

T: Quais as diferenças e particularidades de trabalhar com dados em uma editora, em comparação à agências?

J: Do que eu observei, entre os veículos mais tradicionais, existe um apego muito grande ao papel ainda. Mas ao mesmo tempo, existe grande preocupação com o digital, estamos numa fase de transição cultural.
Tive surpresas muito positivas em editoria, estou tendo a sorte de trabalhar com pessoas que gostam do que fazem e existe um senso de propriedade e responsabilidade com o produto final que poucas vezes eu encontrei na publicidade.

Apesar de ter encontrado menos profissionais com background em métricas, as pessoas tem muito interesse no que eu tenho a dizer, elas querem usar as informações para melhorar o trabalho delas, descobrindo novas abordagens, novos caminhos.

Eu também estou aprendendo muito sobre equilíbrio por aqui, muitas empresas que ficaram obcecadas com “data driven decisions” acabaram mudando seus valores e tiveram resultados ruins. Acho que “data oriented” é mais saudável.

Pronto, podem me crucificar. beijos.

T: O que os inscritos do workshop (que já esgotou as vagas!) podem esperar aprender sobre visualização durante seu módulo?

J: Como contar uma história usando os números. Todo número tem uma história e toda história tem a maneira certa de ser contada. Vou usar exemplos comuns na vida de um analista de social/web analytics e mostrar como coisas simples podem melhorar muito o resultado final. Meu objetivo é que as pessoas saiam com ideias pra aplicar imediatamente em seu dia a dia e que elas saibam como aplicar essas ideias.

Bônus: dúvidas sobre o assunto podem ser enviadas por inbox antes do evento. Prometo responder pontualmente ou abordar no workshop dentro do limite do meu conhecimento.

As inscrições para o combo com o workshop já estão esgostadas, mas que tal conferir a programação do dia de palestras? Acesse em mediaeducation.com.br/socialanalytics

Visualizando receitas: Graphical Cooking

Entender as relações de ingredientes de receitas com visualização de dados não é exatamente algo novo. O famoso caso da rede de ingredientes da All Recipes, que já mencionei em outras ocasiões, é um marco. Mas a Graphical Cooking transformou visualização de receitas em produto e facilidade para cozinheiros. Confira dois exemplos:

graphica cooking - palak panner

sopa de abobora

Dica da Mariana Oliveira

Webinar sobre Novas Abordagens na Apresentação de Dados

Em 23 de junho acontecerá mais um evento da NewMR. Dessa vez o tema é “New Approaches to Present Data“. Veja a programação e se inscreva.

Asia/Australia Session – Sydney 3 pm to 5.15 pm (Auckland 5pm, Singapore 1pm, Mumbai 10.30 am)

  • Sue York, Trends in Presenting
  • Mike Sherman, Sevendots, Less is More: Getting Value (Not Just Reams of Data) From Your Research
  • Peter Harris, Vision Critical, Data Visualisation, enabling the one slide story
  • Ray Poynter, The Future Place, The strengths and drawbacks of Prezi

Europe/Africa Session – 11 am to 1.15 pm (Mumbai 3.30 pm, Paris 12 Noon, New York 6 am)

  • Ray Poynter, The Future Place, Understanding the role of data in a presentation
  • Tom De Ruyck, InSites Consulting, Infotainment – Going beyond the 30 minute debrief!
  • Ken Brewster, E-Tabs Ltd, Dashboards – the new PowerPoint?
  • Chris Morgan, Data Liberation – Interactive reporting and dashboards – knowledge from the trenches

Americas Session – 2 pm to 4.15 pm (London 7 pm, Seattle 11 am)

  • Ray Poynter, The Future Place, Combating ChartJunk
  • Justine Carleton Gage, Lextant, Insight Translation – Turning Data into Action
  • Nima Srinivasan, Added Value, Connectonomics – Online Connections of Women
  • Kathryn Korostoff, Research Rockstar, Using Social Media to Boost Market Research Learning: The Twitterversity