Congresso Internacional sobre Vigilância, Raça e Gênero acontecerá em Salvador

Passando para relembrar que a sétima edição do Simpósio Internacional da Rede Latino-Americana de Vigilância (Lavits) acontecerá em Salvador. Organizado pela rede, pelo IHAC e GIGA, incluirá palestras, mesas de discussão, grupos de trabalho, oficinas e performances artísticas entre 26 e 28 de junho.

O grande destaque entre as conferências é a vinda da Simone Browne, pesquisadora canadense e professora da Universidade do Texas (EUA). Browne é autora do livro “Dark Matters: On the Surveillance of Blackness”, no qual revisa a história da vigilância mostrando como tecnologias de controle e opressão contra a negritude desde o período colonial foram germinadoras das práticas hiper-tecnológicas de hoje.

Entre as sessões livres de debate, destaco Intersecções e potências entre tecnologias, gênero e ativismos, com Josemira Reis (GIG@/UFBA), Dulcilei Lima (UFABC), Taís Oliveira (UFABC), Daniela Araújo (IG/Unicamp), Débora Oliveira (Labjor/Unicamp), Marta Kanashiro (Rede Lavits); O Comitê Gestor da Internet (CGI) e os princípios de governança democrática na Internet, com Sergio Amadeu (CGI) e Juliano Cappi (CGI); Discurso de ódio e desinformação nas redes sociotécnicas, com Erica Malunguinho (DEP. ESTADUAL SP), Isadora Brandão (UNEAFRO), Geisa Santos (Coletiva Periféricas-BA) e Maurício Bozzi (PUC-RS).

Nas sessões temáticas de discussão de artigos, são mais de 150 artigos de pesquisadores do Brasil, América Latina e de outros países. São artigos sobre vigilância, controle, big data e práticas digitais diversas. Apresentarei o trabalho Racismo Algorítmico em Plataformas Digitais: microagressões e discriminação em código em sessão sobre “Assimetrias da Vigilância: racismo e sexismo”.

Saiba mais sobre o evento em: www.lavits.ihac.ufba.br

IBPAD lança whitepaper sobre o histórico das APIs na pesquisa em mídias sociais

Em grande medida, a presença/ausência, modos de uso e escopos das chamadas APIs definiram os caminhos da pesquisa em mídias sociais. Nos últimos anos, controvérsias sobre privacidade foram a desculpa para algumas plataformas de mídias sociais – como Facebook – fecharem o acesso às suas APIs de dados. A relevância deste debate tanto para a academia quanto para o mercado é essencial. Pensando nisso, o IBPAD lançou um whitepaper sobre o tema – Histórico das APIs no Monitoramento e Pesquisa em Mídias Sociaiss, que inclui uma linha do tempo sobre os principais fatos e mudanças:

Lançada Linha do Tempo sobre Racismo Algorítmico

Lancei recentemente, como uma página do site, uma Linha do Tempo sobre Racismo Algorítmico! Se você é assinante via email ou feed talvez não tenha visto. A timeline é um resultado secundário da pesquisa de doutorado Dados, Algoritmos e Racialização em Plataformas Digitais. Desenvolvida no PCHS-UFABC, o projeto estuda as cadeias produtivas da plataformização digital (mídias sociais, aplicativos, inteligência artificial) e seus vieses e impactos raciais. Os casos, reportagens e reações ao racismo algorítmico podem ser visualizados na página (clique na imagem) e são dados para artigos, conferências, tese e livro em desenvolvimento.

Text Analysis with AntConc for social media data: Keyword Lists and Keyness

The Keyword List tool measures which words are unusually frequent or infrequent in datasets or corpora compared to a reference/benchmark word list (or files).

This post is part of a series of tutorials about AntConC:

  1. Intro, Opening a File and Settings
  2. Word Lists and File Viewer 
  3. Concordancer and Concordance Plot 
  4. Clusters and N-Grams
  5. Collocations 
  6. Keyword Lists

 

Uploading a Keyword List and analyzing keywords / keyness metric
1. As usual, the first step is to open your files/corpora and produce a word list. For that example, we are going to use the file with 16k tweets containing the term “Brazil’ (download it): .

2. Generate the word list through the Word List tab.

 

3. Basically, the Keyword List tool compares your files/corpora to one or more reference/benchmark files/corpora to highlight which words are more unusually frequent or infrequent. Or, in other words, which words are keywords in file(s)/corpora.

There are three main ways of using the Keyword List tool:

  • Compare your file(s) to a general corpus representing a national language. Here you can use a reference word list produced from texts representing a national language.
  • Comparing your file(s) to past texts or wordlists. This option could be appropriate for social media data, specially to discover new info. For example, you can compare recent texts to past corpora comprising 12-month period.
  • Comparing texts produced by different social media communities or texts reacting to different authors/pages (e.g. Facebook comments in different periods).

4. For the sake of simplicity, we’ll a comparison with the pre-produced corpus called BNC wordlist. To use it, download the wordlist from our wordlist folder (or from the BNC website), click in Use word list(s) and click in Add Files to add the BNC_WRITTEN_wordlist.txt . Click in Load then, Apply.

 

5. Now you can discover which terms/words in your dataset are the most “important” in the sense they are frequent or infrequent in a unusual amount.

Most unusually frequent words (positive Keyness):

 

Unusually infrequent words (negative Keyness). Bear in mind that we’are analyzing Twitter data, so the presence of some terms like however or although could be related to tweet formats and limitations:

 

So, this posts concludes our series on AntConc. To learn more about AntConc, text analysis and corpus linguistics:

Text Analysis with AntConc for social media data: Collocations

Collocations refers to how words occur regularly together in the texts/corpora. Searching for colocates related to a specific term could point to other words and expressions important in the documents.

This post is part of a series of tutorials:

  1. Intro, Opening a File and Settings
  2. Word Lists and File Viewer 
  3. Concordancer and Concordance Plot 
  4. Clusters and N-Grams
  5. Collocations (we are here)
  6. Keyword Lists (soon)

 

Exploring Collocation

1. As usual, open a file or set of files (don’t forget to configure the settings). In this tutorial, we are going to use the file plastic_19k_tweets_june_2018.txt available in our datasets folder.

2. Generate a Word List.

3. Go to the tab Collocates and search for a term like ‘plastic’. The following list ranks the more relevant collocates:

As you can see, most of the collocates are related to “plastic surgery”, not the material plastic.

 

4. A frequent problem is the listing of words which appears only one or few times in the file(s). So you can increase the Minimum Collocate Frequency:

 

5. The words will be searched in a Window Span to count the co-occurrences in the vicinity of the search term. You can increase or decrease the span on the left and on the right of the search term.

 

6. Since Twitter texts are very short, we recommend decrease the span. The results might be more precise, as in the following example:

With these results, you can explore the collocates to try to understand and locate meaningul words related to your keywords of interest.