Interrogando APIs de Visão Computacional – publicado relatório do #SMARTDataSprint

No final de janeiro aconteceu mais uma edição do SMART Data Sprint, um evento que reúne pesquisadores, programadores e designers para trabalho colaborativo sobre um determinado tema de pesquisa – e bases de dados. Tive a oportunidade de, junto ao Andre Mintz, idealizar o projeto “Interrogating Vision APIs“. Durante quatro dias, Mintz se juntou aos pesquisadores Beatrice Gobbo, Elena Pilipets, Hamdan Azhar, Helen Takamitsu, Janna Joceli Omena e Taís Oliveira para analisar ao mesmo tempo, com métodos digitais, duas perguntas de pesquisa:

a) Quais são as diferenças entre os principais fornecedores de visão computacional?

b) Podemos investigar representações nacionais usando ferramentas de visão computacional?

Para responder estas perguntas, foram processadas mais de 60 mil imagens provenientes de bancos de imagens (Shutterstock, Adobe Stock e Getty Images) para resultados à buscas como “brazilian”, “british”, “indian”, “portuguese” e outros marcadores de nacionalidade em cada um dos recursos de visão computacional citados anteriormente. O time focou em quatro nacionalidades (brasileiros, nigerianos, austríacos e portugueses).

Foram aplicados de modo emergente métodos como text analysis, visualização de redes, descrição densa e cálculos estatísticos para entender as similaridades e diferenças tanto entre os fornecedores de visão computacional quanto entre os diferentes bancos de imagens e nacionalidades representadas.

Como primeiro resultado público do esforço, um extenso relatório que também inclui protocolos de pesquisa (para replicação), detalhes sobre a metodologia, questões de pesquisa, design da pesquisa, descobertas e dicussão foi publicado no site do Inova Media Lab, organizador do evento. Em breve os autores produzirão textos acadêmicos e desdobramentos sobre o estudo, mas gostaria de adiantar – para os lusófonos, um mini-resumo das principais descobertas.

 

Diferenças entre fornecedores de computação visual

As três APIs de computação visual abordadas – desenvolvidas por Google, IBM e Microsoft – apresentam características bem diferentes de etiquetagem que descrevem diferentes ontologias e espaços semânticos. Sobre níveis de detalhes, a API da Google tende a maiores níveis de especificidade; IBM apresenta alguma especificidade mas não tanta quanto a da Google; e a da Microsoft é geralmente muito genérica e possui um escopo limitado de etiquetagem. A imagem abaixo apresenta uma comparação anedótica sobre as abordagens:

 

Redes visuais como ferramentas descritivas úteis à pesquisa social sobre representação

Sites de bancos de imagens representam visualidades com temas recorrentes para os quais as APIs de computação visual são úteis como recursos descritivos, mostrando configurações e padrões emergentes dos temas construídos como típicos para cada grupo – nacionalidade no caso. A visualização abaixo, por exemplo, mostra na rede de labels (etiquetas) como, para cada país, as APIs e a clusterização em rede (no Gephi) permitiu encontrar um padrão recorrente de grupos ligados a: a) natureza; b) comida; e c) pessoas. Para cada país um grande grupo de imagens sobre algum aspecto cultural (ou estereótipo online) esteve também presente: Carnaval para Brasil; Têxtil para Portugal; Cidade e Arquitetura para Áustria; e Dinheiro para Nigéria.

 

Visão computacional e culturas

As APIs de visão computacional apresentaram diferentes níveis de sensibilidade e modos de tratamento de imagens de culturas específicas. Por exemplo, enquanto o Google reconheceu vários itens específicos sobre comida ou instrumentos musicais, a precisão nem sempre foi satisfatória tanto no serviço da Google quanto na dos demais. Em alguns casos, as APIs reproduziram invisibilidades de marcadores culturais de grupos minorizados, possível reforço de relações étnico-raciais hierarquizadas. Na imagem abaixo vemos um dos exemplos nos quais a Google Vision marcou como peruca (“wig”) um cabelo natural:

Há muito mais no relatório que pode ser lido em toda sua extensão em https://smart.inovamedialab.org/smart-2019/project-reports/interrogating-vision-apis/

Participe do III Colóquio de Análise de Redes Aplicada – CARA 2019

Em 11 e 12 Julho de 2019 acontecerá, em Lisboa, o III Colóquio de Análise de Redes Aplicada – CARA 2019. É possível submeter resumos até o dia 01 de abril (data atualizada!).

A análise de redes permeia diversas áreas do conhecimento e oferece novas ferramentas para uma ampla gama de campos de investigação, a sociologia, economia, gestão, história, matemática, educação, geografia, psicologia, saúde, comunicação, biologia, física, etc. O III Colóquio de Análise de Redes Aplicada – CARA 2019 – tem como propósito discutir avanços na aplicação da análise de redes em diversas áreas do conhecimento e promover a incorporação de novos recursos e conhecimentos à comunidade científica, difundindo o uso da análise de redes para a interpretação e compreensão das diferentes estruturas e processos de interação.

São 15 sessões ao todo e diversas devem interessar aos leitores do blog! Destaco Comunicação e Media Sociais, organizada por mim e Inês Amaral (Universidade de Coimbra). A sessão busca reunir comunicações que apliquem a ARS à investigação de fenômenos comunicacionais em diversos media, sobretudo os que tomam corpo ou são perpassados por ambientes digitais tais como blogs, Facebook, Twitter, YouTube e Instagram. Projectos de análise e descrição de dinâmicas e fluxos informacionais; construção e afiliação de grupos e comunidades; ativismos, controvérsias e movimentações político-sociais; entre outros olhares em rede sobre esferas da sociedade são bem-vindos.

Confira mais informações em: https://medium.com/@csg.iseg.ulisboa/col%C3%B3quio-de-an%C3%A1lise-de-redes-aplicada-c4208f4984c1

Curso online de Análise de Redes em Mídias Sociais

Em 12 de junho começará o curso online de Análise de Redes em Mídias Sociais, que desenvolvemos no IBPAD depois de anos de experiência prática na área e mais de 10 edições de cursos abertos ou in-company. Idealizado por mim e meu sócio Max Stabile (Mestre em Ciência Política), o curso conta também com conteúdo de Marcelo Alves (Mestre pela UFF e cofundador da Vértice).

Serão mais de 90 aulas divididas em 5 módulos, que podem ser acessados pelo aluno por 6 meses. Saiba mais abaixo, veja uma aula gratuita e use o código taruvector10 para um desconto exclusivo:

.

Cinco livros (e + cinco artigos gratuitos) sobre métodos digitais de pesquisa

[Artigo originalmente publicado no blog do Instituto Brasileiro de Pesquisa e Análise de Dados]

livrosAs mídias sociais trouxeram possibilidades e desafios muito relevantes para a pesquisa empírica em comunicação e demais ciências sociais aplicadas. Em alguns ambientes hoje fala-se muito com termos e jargões de mercado como social big data mas, apesar da grande abundância de dados produzida a cada segundo, existem muitas restrições à viabilidade destes dados. Especialmente nos dois âmbitos a seguir. O primeiro é o acesso em si a estes dados, uma vez que, além das questões de privacidade, algumas plataformas como Facebook promovem o gradual fechamento de seus fluxos de comunicação. O segundo é o ferramental metodológico e instrumental para acessar, manipular e transformar estes dados em informações, conceitos, teorias e aplicações levando em conta as affordances destes ambientes.

Levando isto em conta, quero indicar aqui cinco livros recentes sobre métodos digitais que podem ser o pontapé inicial da bibliografia do pesquisador interessado nestas trajetórias.

Continuar lendo

O que você precisa saber sobre redes?

O que qualquer estudante precisa saber sobre redes atualmente, já que estamos em um mundo conectado? O termo “sociedade em rede” circula a imprensa e cultura popular há décadas, mas os conhecimentos sobre análise de redes ainda não fazem parte da educação básica. Este é um dos objetivos do NetSciEd, que lançou o documento Network Literacy: Essencial Concepts and Core Ideas. Realizamos a tradução para o português, veja abaixo: