(Des)Inteligência Artificial: como computadores não compreendem o mundo

Quem acompanhou o caso dos 12 garotos presos na caverna Tham Luang Nang Non, na Tailândia, possivelmente acompanhou a iniciativa do bilionário Elon Musk em criar um submarino para resgate. Ignorando os esforços locais de profissionais da Tailândia e outros países empenhados no resgate, o rosto público das empresas Tesla, Boring Company e SpaceX, Musk chegou a agredir verbalmente e difamar um jornalista que criticou a iniciativa do empresário como apenas uma iniciativa fútil de RP. E realmente era. Os 12 garotos foram resgatados por heróis incansáveis e especialistas em suas áreas, atividades e na região da caverna. Como disse o coordenador do centro de comando do resgate, Narongsak Osatanakorn, “Apesar de sua tecnologia ser boa é sofisticada, não é prática para esta missão”.

Essa postura delirante e egoica de tentar consertar o que não está quebrado com mais tecnologia, ignorando esforços, especialistas e dinâmicas anteriores, já pôde ser vista recentemente em figuras similares como Steve Jobs e Mark Zuckerberg. Entretanto, o histórico da computação e inteligência traz casos similares ao de Musk aos borbotões. Um particularmente anedótico é uma conversa atribuída a Marvin Minsky, um dos grandes nomes da área, que fundou o laboratório de inteligência artificial do MIT e ensinou centenas de cientistas e professores que desenvolveram a área. Stephen Wolfram conta que, no início dos anos 1980, em visita a Minsky na casa de sua filha, que tinha uma coleção de plantas, Wolfram percebeu que algumas delas estavam com pragas de insetos. A partir daí seguiu-se uma longa discussão sobre desenvolvimento de micro-robôs que poderiam eliminar os insetos. Porém, ao perguntar o que fazer com as plantas, Minsky responde: “Ah, acho melhor você falar com minha esposa”.

Este caso, incluído no livro, é um dos melhores exemplos da importância da publicação de trabalhos como Artificial (Un)Intelligence: how computer misunderstand the world, de Meredith Broussard. Foi lançado em abril deste ano e reúne estudos e aprendizados da autora como jornalista, programadora e pesquisadora.  Meredith Broussard é professora do Arthur L. Carter Journalism Institute da NYU e pesquisadorea no Moore-Sleam Data Science Environmnent. Neste livro, apresenta 12 capítulos divididos em três partes chamadas “Como computadores funcionam”, “Quando computadores não funcionam” e “Trabalhando juntos”.

Em comparação a outros livros sobre viés algorítmicos e problemas na inteligência artificial que recomendei no blog, Artificial (Un)Intelligence possui uma vantagem muito interessante: em vários capítulos Broussard faz uma espécie de tour guiado por conceitos básicos da programação, de modo a levar até o leitor mais leigo a compreender como funciona parte do trabalho de construção de códigos e decisões imbricadas que depois se invisibilizam nas caixas pretas dos dispositivos. É o que acontece no capítulo 02, chamado “Hello World” – saber como imprimir/visualizar estas duas palavras estão entre os primeiros passos de mais que 9 entre 10 cursos de novas linguagens. A partir da tarefa do título, a autora apresenta alguns passos simples para a criação de um algoritmo condicional simples.

Porém, não se trata efetivamente de ensinar a leitora ou leitor a começar a programar. Mas sim levar quem lê a entender, na prática, que os códigos são socialmente construídos.

Although the data may be generated in different ways, there’s one thing all the preceding examples have in common: all of the data is generated by people. This is true Although the data may be generated in different ways, there’s one thing all the preceding examples of all data. Ultimately, data always comes down to people counting things. If we don’t think too hard about it, we might imagine that data springs into the world fully formed from the head of Zeus. We assume that because there is data, the data must be true. Note the first principle of this book: data is socially constructed. Please let go of any notion that data is made by anything except people.

Na primeira parte do livro, ao longo dos outros capítulos “Hello, reader”, “Hello AI” e “Hello, data journalism”, Broussard apresenta uma excelente introdução aos conceitos de inteligência artificial, jornalismo de dados e o papel destes nas democracias. Enfatiza bem a diferença entre “inteligência artificial geral” e “inteligência artificial estrita” para dissipar percepções erradas, criadas em parte pela ficção, sobre agentes artificiais que tomariam o mundo, de Skynet à Samantha de Her. Não é este o problema quanto à inteligência artificial e uso pervasivo de dados sociais, mas sim a sua interface com aumento de desigualdade, concentração de poder e piora das relações internacionais.

Apesar disso, existe uma adesão voluntária à ideia de que mais computadores, big data e inteligência artificial é algo necessariamente bom e remediador. É o “tecnochauvinismo” que, de modo resumido, seria a crença de que mais “tecnologia” é sempre a solução. Tecnochauvinismo é frequentemente acompanhado por meritocracia neoliberal, defesa distorcida da “liberdade de expressão” para manter discurso de ódio; da ideia de que computadores seria objetivos e uma fé de que o mundo com mais computadores resolveriam problemas sociais.”Para descrever casos reais e combater o tecnochauvinismo, Broussard se debruça na parte dois em cinco capítulos sobre questões e problemas muito reais sobre computadores e inteligência artificial: testes padronizados no sistema de ensino; raízes de desigualdade de gênero e raça na academia e mercado que produzem as tecnologias e sistemas de AI; corrida por legalização de carros autônomos; e os malefícios de equalizar popularidade com qualidade nas plataformas de comunicação como Google e Facebook. Também faz parte da segunda parte do livro um capítulo sobre  aprendizado de máquina (machine learning). Broussard ataca a frequente confusão quanto a este termo, que leva leigos a acreditar que os sistemas aprendem “sozinhos”, ao invés de serem ensinados a partir de bases de dados criadas por seres humanos.

No atual momento, no qual inteligência artificial é uma “buzzword”, ou palavra da moda no marketing, esta crença é perigosa. Para explicar as diferenças entre os tipos de aprendizado de máquina, assim como apresentar passos e decisões comuns que os desenvolvedores deveriam enfrentar de forma responsável, Broussard volta às linhas de código. No capítulo “Machine Learning: the DL on ML“, Broussard explora junto conosco um dataset com informações sobre as pessoas que morreram no naufrágio do Titanic. Passando por variáveis como gênero, classe, idade e tipo de cabine a autora explica como a construção de um sistema preditivo requer muitas decisões difíceis quando está ligado a vidas humanas. E está longe de ser apenas um recurso pedagógico: decisões similares são feitas em sistemas de policiamento, planos de saúde, crédito financeiro e afins.

A terceira parte do livro traz dois casos mais particulares da autora. O primeiro capítulo desta parte é um relato de participação da autora  em um evento de um hackaton para criação de startups chamado Startup Bus. Broussard usa o relato da experiência e construção de um pitch de startup para discorrer sobre o ethos das startups e como seus afiliados deixam de lado com frequência – seja por ignorância, seja por má fé – muitas reflexões e responsabilidades éticas e morais em prol de construção de possíveis sucessos comerciais. O segundo descreve a construção do sistema Bailiwick Campaign Finance. Broussard construiu este website para oferecer “histórias automatizadas” sobre financiamento de campanha: ao cruzar dados de políticos e financiadores, tem como objetivo ajudar jornalistas a encontrar possíveis temas para investigação. Veja abaixo:

O livro Artificial (Un)Intelligence é uma leitura necessária e rápida para qualquer comunicador e pesquisador interessado no tema da pervasividade dos algoritmos e seus impactos. Para finalizar, veja abaixo uma entrevista sobre o livro:

Estudando Cultura e Comunicação com Mídias Sociais

Lançamos o livro Estudando Cultura e Comunicação com Mídias Sociais! Organizado por mim, Jaqueline Buckstegge e Pedro Rogedo, a publicação reúne 20 capítulos de autores com diferentes níveis de experiência, de graduandos a pesquisadores-doutores como Raquel Recuero, Sérgio Braga e Mirna Tonus. Clique para saber mais:

Livro “Monitoramento e Pesquisa em Mídias Sociais” já está disponível!

livro-monitoramento-e-pesquisa-em-midias-sociaisÉ com muito prazer que anuncio a publicação do quinto livro co-organizado por mim! Eu e Max Stabile, meu sócio e idealizador do IBPAD, organizamos o livro Monitoramento e Pesquisa em Mídias Sociais: metodologias, aplicações e inovações e acabamos de disponibilizá-lo online.

O livro reúne colaborações de uma rede de profissionais e pesquisadores que atuam em universidades, empresas e agências.  Temas basilares, mas ainda controvertidos, como análise de sentimento, atendimento ao consumidor ou etnografia somam-se a aplicações e inovações que vão de reconhecimento de imagem a estudos sobre memes, compondo contribuição sólida ao campo.

Para todos aqueles que querem iniciar suas pesquisas utilizando dados de mídias sociais, este livro será um excelente guia no desenvolvimento de seus trabalhos. Para aqueles que já atuam ou querem atuar no mercado de mídias sociais, o livro traz referências a métodos e inovações que podem ser uma ampla fonte de novos produtos e pesquisas. 

Sumário:

  • Prefácio – Fábio Malini
  • Inteligência de Mídias Sociais no Brasil – Ana Claudia Zandavalle
  • Análise de Sentimento – Skrol Salustiano
  • Informação e Tagging – Ronaldo Araújo e Dora Steimer
  • Abordagens da coleta de dados nas mídias sociais – Marcelo Alves
  • SAC e Social CRM – Marcelo Salgado
  • Relacionamento – Clarissa Motta
  • Gestão de Crises – Mariana Oliveira
  • Brand Awareness –  Juliana Dias
  • Comunidades de Marca – Andrea Hiranaka
  • Etnografia para Mídias Sociais – Débora Zanini
  • Criação de Personas e Ilustrações – Tarcízio Silva e Yuri Amaral
  • Pesquisando Memes – Viktor Chagas e Janderson Pereira Toth
  • Análise de Redes – Max Stabile e Tarcízio Silva
  • Influenciadores – Gabriel Ishida
  • Jornalismo de Dados – Soraia Lima
  • Campanhas Eleitorais – Max Stabile e Jaqueline Buckstegge
  • Gestão do Conhecimento – Cinara Moura
  • Posfácio – Rodrigo Helcer e Milton Stiilpen

Faça o download do livro no site do IBPAD.

Discurso no Twitter e Mídias Sociais: como usamos linguagem para criar afiliação na web

discourse and social media

O livro “Discourse of Twitter and Social Media: How We Use Language to Create Affiliation on the Web” foi lançado em 2012 pela professora Michelle Zappavigna, da University of South Wales (Austrália). A discussão e análise teórico-analítica se debruçou em um corpus, chamado de HERMES, criado pela pesquisadora com cerca de 7 milhões de tweets e de 100 milhões de palavras.

É um excelente exemplo da aplicação da linguística de corpus para a análise de mídias sociais, discurso, práticas interacionais, afetivas e políticas. Ao longo de seus capítulos, a autora aplica técnicas como análise de colocações, n-gram e contagem de frequências para identificar padrões e desvios nos textos do Twitter.

O primeiro capítulo, Social Media as Corpora, discute a possibilidade de entender as mídias sociais, e a sociedade através delas, a partir da construção de corpora de conteúdos textuais gerados em tempo real no Twitter. Parte do princípio de que as mídias sociais permitiram, sobretudo, a emergência da possibilidade de “discurso buscável” (searchable talk), com impactos relevantes na sociabilidade. Qualquer pessoa que já utilizou uma hashtag para marcar uma posição política ou para falar de um programa televiso, sabe muito bem do que a autora está falando:

“searchable talk, a change in social relations whereby we mark our discourse so that it can be found by others, in effect so that we can bond around particular values”

Zappavigna utiliza a SFL (systemic functional linguistics), que direciona a análise para uma abordagem funcional de análise utilizando metodologias de linguística de corpus. A partir da base antropológica, sobretudo de Malinowski, vê a linguagem como recurso para a realização de três funções: função ideacional de determinação de experiência, função interpesssoal de negociação de relações e função de textual de organização da informação.

Deste modo, no segundo capítulo, The Language of Microblogging, descreve as particularidades da linguagem no Twitter em suas manifestações fáticas, conversacionais ou como “backchannel” de outras atividades (vide segunda tela). Fatores da affordance do Twitter, como tamanho, hashtags e sua temporalidade própria são também analisadas. Neste capítulo a autora apresenta as primeiras aplicações de técnicas de linguística de corpus, como frequência de palavras:

hermes corpus - michele zappavigna

Evaluation in Microblogging, o terceiro capítulo, percorre o corpus HERMES a partir dos marcadores de sentimento/avaliação Julgamento, Afeto e Apreciação. Cada um dos “sistemas” de avaliação é explorado em detalhes, com inúmeros exemplos. Até o uso de emoticons é analisado de forma minuciosa, a partir da compreensão das emoções  expressas pelos usuários:

articulation network for facial emoticons

A criação de afiliação através dos textos é o tema do quarto capítulo, Ambient Affiliation. Através deste termo, a Michele Zappavigna procura mostrar como a plataforma é utilizada pelos seus usuários para gerar afiliações em torno de temas, tópicos e identidades. Aplicando o sociólogo Goffman, autor que melhor entendeu os processos micro-interacionais já na década de 1930 e hoje é aplicado em inúmeros estudos online, Zappavigna fala inclusive de como diversos estudos, inclusive o seu, mostram que técnicas de agrupamento (clustering) dão resultados consistentes apesar da aparente dispersão dos usuários. A liga social, neste caso, é a própria linguagem.

“we affiliate with a co-present, impermanente community by bonding around evolving topics of interest. This function is directly inscribed in the web interface to users’ Twitter accounts as the list of trending topics”

Nos três capítulos seguintes, Internet Memes, Internet Slang Internet Humour and fail: ‘The world is full of #fail tonight”, o livro analisa algumas particularidades das gírias, memes e humor no Twitter. Em sua maioria dos casos, são circulações meméticas que perpassam várias plataformas, como reddit e 4chan. Um trecho particularmente interessante é a análise da redefinição e complexificação do termo geek.

michele zappavigna collocates - geek out

Por fim, no nono capítulo, Political discourse online, a autora analisa um sub-corpus do Hermes chamado OWC – Obama Win Corpus. São 45290 publicados nas 24 horas subsequentes à vitória de Barack Obama nas eleições de 2008. O foco da análise se dá em torno da ideia de “mudança” (change), explorada pela campanha e militantes do político. É bem interessante também o relato que a autora faz dos tweets falando do cachorro presidencial, uma tradição no processo de construção da imagem dos presidentes americanos.michele zappavigna - collocates OWC - puppy

Por fim, nas conclusões a autora problematiza o futuro e limitações da linguística de corpus para as mídias sociais, especialmente relacionados à circulação de informação, inclusive textual, em formato de imagens.

+ Mais sobre Michele Zappavigna:

Twitter – https://twitter.com/smlinguist

Publicações – http://socialmedialinguist.blogspot.com.br/p/publications.html

Página na UNWS – https://sam.arts.unsw.edu.au/about-us/people/michele-zappavigna/

Google Scholar – https://scholar.google.com/citations?user=ILicbSEAAAAJ&hl=en

A Cultura da Conectividade: uma história crítica das mídias sociais

Não canso de repetir, infelizmente, que o maior problema de grande parte dos analistas ou jornalistas do mercado da comunicação é a falta de atenção à história. Fala-se de “novidades” que não o são, “primeira vez” ou rupturas que não tem nada de novo. São explicitamente repetições ou cópias de coisas que já aconteceram ou, simplesmente, uma nova manifestação de comportamentos, affordances ou tecnologias que nos acompanham há tempos.

the culture of connectivityNa minha já tradicional “lista de livros para ler no ano” (que faço desde 2009), recomendei para 2014 o livro The Culture of Connectivity: a critical history of social media. É um livro de 2013 escrito por Jose van Dijck, pesquisadora de Amsterdam que escreveu também, entre outros trabalhos, Mediated Memories in the Digital Age, inspiração importante para minha dissertação.

Dijck se baseia em duas linhas teóricas para fazer esta história crítica das mídias sociais, a Teoria Ator-Rede e a Economia Política da Comunicação. A primeira, que está em voga e crescimento na comunicação, especialmente em cibercultura, propõe uma quebra ontológica e metodológica na relação entre os homens e seus objetos de estudo. Para a Teoria Ator-Rede, o social não é algo dado, mas construído nas relações entre actantes, sejam humanos ou não-humanos. Não se deve, portanto, usar o “social” para explicar alguma coisa, mas sim “explicar o social” ao se descrever as relações entre as coisas em dinâmicas como mediação, intermediação, pontualização e “abertura de caixa preta”. Quando falamos de mídias sociais, então, temos de abrir seus componentes:

The first [Actor-Network Theory] helps to disassemble microsystems. By taking apart single platforms into their constitutive components, we may combine the perspectives on platforms as techno-cultural constructs and as organized socioeconomic structures. But disassembling platforms is not enough: we also need to reassemble the ecosystem of interoperating platforms in order to recognize which norms and mechanisms undergird the construction of sociality and creativity.

Junto à Teoria Ator-Rede, é necessário também observar as relações de força (como relações econômicas) entre os atores que as compões. Por isto,

Proponents of a political economy approach choose organizational (infra) structures as their main focus: they regard platforms and digital networks as manifestations of power relationships between institutional producers and individual consumers.

A partir destas assunções, o livro vai se debruçar sobre as plataformas Facebook, Twitter, Flickr, YouTube e Wikipedia. A importância de observar as várias plataformas é explicada no trecho abaixo:

All platforms combined constitute what I call the ecosystem of connective media—a system that nourishes and, in turn, is nourished by social and cultural norms that simultaneously evolve in our everyday world. Each microsystem is sensitive to changes in other parts of the ecosystem: if Facebook changes its interface settings, Google reacts by tweaking its artillery of platforms; if participation in Wikipedia should wane, Google’s algorithmic remedies could work wonders. It is important to map convolutions in this first formative stage of connective media’s growth because it may teach us about current and future distribution of powers.

Em cada uma destas plataformas, alguns pontos particulares são observados durante a descrição das suas trajetórias desde a criação até as atuais polêmicas. São observadas a Tecnologia, Usuários, Conteúdo e Forma Cultural, Ownership, Governança, Modelos de Negócio e outros itens relevantes.

Ao tratar do Facebook, por exemplo, Jose van Dijck se debruça muito bem sobre a dualidade entre os conceitos de “connectedness” e “connectivity”. A missão da empresa e como ela se vende enfatiza a “connectivity” e seus valores positivos.

Zuckerberg deploys a sort of newspeak when claiming that technology merely enables or facilitates social activities; however, “making the Web social” in reality means “making sociality technical.” Sociality coded by technology renders people’s activities formal, manageable, and manipulable, enabling platforms to engineer the sociality in people’s everyday routines.

Mas a “connectedness” é o que realmente importa para o Facebook. Tecnologia, normas e modelos de negócio são moldados para que o Facebook se torne um “ponto obrigatório de passagem” no sistema midiático contemporâneo. Quanto mais os usuários estão no Facebook e usando seus recursos como APIs, logins e etc, são mais pontos de dados conectados entre si para gerar possibilidades de perfilização e rentabilizar o negócio publicitário.

Ao tratar do Twitter, um foco passa a ser a construção do quê, afinal de contas, é a plataforma. A evolução ao longo de seus anos mostrou como uma mídia social pode ser reapropriada e co-construída pelos seus usuários. Entre conversação ou fluxo de informação, as diferentes aplicações do Twitter ainda desafiam seus usuários e criadores. É uma plataforma que leva ao máximo a “flexibilidade interpretativa”:

Social constructivists would consider the platform’s development to be a stage of “interpretive flexibility”: a stage when a technology is still in flux and various, sometimes contradictory, interpretations are wagered before stabilization is reached (Bijker 1995; Pinch and Bijker 1984; Doherty, Coombs and Loan-Clarke 2006).

Outro ponto fascinante – e que interessa em especial os leitores deste blog, é o uso do Twitter como um “sensor” da sociedade – e até da natureza.

Researchers tested Twitter’s effectiveness as a “social sensor” for real-time events, such as accidents or earthquakes, which could be measured almost instantly by tracking the tagged trends on Twitter (Sakaki, Okazaki, and Matsuo 2010). In addition, academics examined Twitter’s potential as an instrument for “sentiment analysis” and “opinion mining” (Diakopoulos and Shamma 2010; Pak and Paroubek 2010) and for measuring the public mood with the help of “real-time analytics” (Bollen, Mao, and Pepe 2010).

Sobre o YouTube, a dicotomia “mídia de massa” e “mídia alternativa” é descrita, pois foi a primeira chave interpretativa durante a popularização da plataforma. Mas, ao longo do tempo, com pressões econômicas (não só de organizações, mas dos próprios usuários) somadas a desenvolvimentos tecnológicos, que fazem o YouTube hoje ser tão veloz e bem definido quanto TV tradicional, hoje o YouTube reproduz os sistemas midiáticos audiovisuais. Com características particulares, é claro, mas a ideia de “mídia alternativa” é minoritária hoje.

Ao falar do Flickr, o livro me apresentou vários comportamentos em sua história que eu não conhecia, por ser uma plataforma pouco utilizada no Brasil. O capítulo gira especialmente em torno dos conflitos dos diversos tipos de usuários – fotógrafos profissionais e amadores entre os mais engajados – com a definição do que é o Flickr e suas funcionalidades e regras quando foi comprado pelo Yahoo.

O capítulo sobre Wikipedia discute a colaboração e as lutas em torno de construções de consenso. Como cada artigo é uma produção de muitas mãos, a auto-regulação entre editores e usuários comuns força os limites entre democracia e burocracia, para manter a plataforma fiel a seus objetivos de abertura, confiabilidade e imparcialidade. Também é particularmente interessante o papel dos robôs que criam e editam artigos de forma automatizada: alguns deles superam a qualidade de editores humanos, avaliados em testes cegos.

Dijck também trata da reformulação da pesquisa acadêmica atual que, hoje, tem enormes possibilidades com as mídias sociais, mas que não podem ser aproveitadas pela academia tradicional, uma vez que as massas de dados em tempo real sobre a sociedade estão, em grande parte, nas mãos destas plataformas (recomendo ver também Manovich e Marres sobre o tema).

Connective media companies have an unfair competitive edge over (public) researchers when it comes to the availability and accessibility of Big Data for the assessment and interpretation of social and other trends, which is key to the production of knowledge. It is imaginable that scientists in the future will be dependent on commercial processing firms for obtaining access to social data.

Por fim, entre as conclusões, Dijck se posiciona sobre o velho debate em torno da computação social:

The ecosystem of connective media does not reflect social norms; interconnected platforms engineer sociality, using real-life processes of normative behavior (peer pressure) as a model for and an object of manipulation (popularity ranking).

Em resumo, é um livro necessário para profissionais e estudiosos das mídias sociais, especialmente para aqueles que teimam em não “olhar para trás“.