Análise de Sentimento: Um Problema Multifacetado

O paper Sentiment Analysis: A Multi-Faceted Problem, de Bing Liu, explica como a “análise de sentimentos ou mineração de opiniões, avaliações e sentimentos das pessoas sobre entidades, eventos e seus atributos”. Liu é um cientista da computação e vê a análise de sentimentos nesta perspectiva. O grande desafio é, então, desenvolver métodos para “ensinar” programas de computador a identificar as opiniões e sentimentos relativos a cada entidade em textos opinativos.

É um paper extremamente útil para comunicadores e analistas de monitoramento de mídias sociais pois define muito bem os elementos que podem estar presentes em um texto com opiniões (que nas mídias sociais podem ser um post, um tweet, um comentário…). Os elementos como objeto, recurso, emissor, opinião, orientação, assim como os modelos de objeto e de documento com opiniões são ótimas bases para aplicar no planejamento do monitoramento de marcas e conversações. Cada um dos elementos pode ser pensado como operador a serem ligadas categorias de análise. Abaixo um exemplo de um gráfico resultante da comparação de orientações de opiniões a diversos aspectos de um objeto:

Depois de definir e propor os elementos e modelos para análise de sentimento, Liu mostra os desafios técnicos como identificação do objeto, extração de aspectos, agrupamento de sinônimos, classificação da orientaçaõ de opinião e integração. Finaliza o paper falando do passado e futuro sobre a pesquisa em análise de sentimentos, como a sempre presente busca da precisão da análise automatizada.

Bing Liu é autor do livro Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data, no qual ele aprofunda sobre análise de sentimentos e outros temas sobre mineração de dados.

Mineração de Dados em Mídias Sociais

O livro Social Network Data Analytics, organizado Charu C. Aggarwal, é composto de 16 artigos que tratam de temas como propriedades estatísticas das redes, descoberta de comunidades, classificação de nodos, algoritmos para análise de influência social, predição de links, visualização, mineração de texto, integração com setores e redes de informação multimídia.

Data Mining in Social Media, escrito por Geoffrey Barbier e Huan Liu, trata da mineração de dados em sites de redes sociais. Como os autores apontam, muitas vezes estes dados são caracterizados por serem extensos, dinâmicos e cheios de ruído. Explicam que mineração de dados é “identificar padrões novos e acionáveis nos dados”. Explicam a utilização de algoritmos, classificação, clustering e outras técnicas. O resumo do artigo:

The rise of online social media is providing a wealth of social network data. Data mining techniques provide researchers and practitioners the tools needed to analyzelarge, complex, and frequently changing social media data. This chapter introduces the basics of data mining, reviews social media, discusses how to mine social media data, and highlights some illustrative examples with an emphasis on social networking sites and blogs.

Ao tratar especificamente da mineração de dados em mídias sociais, dizem que “os dados disponíveis através das mídias sociais podem nos dar insights sobre as redes sociais e sociedades que antes não eram possíveis, tanto em escala quanto em extensão”. Para fins de pesquisa e negócios, os dados podem ser utilizados para entender: detecção de grupos; difusão de informação; propagação de influência; monitoramento e detecção de tópicos; análise de comportamento de grupos; e pesquisa de marketing.

Os autores explicam os conceitos de redes sociais e a visualização através de estruturas de grafos para, em seguida, mostrar aplicações da mineração de dados em sites de redes sociais e redes de blogs. Em relação a estes últimos, falam de métodos de classificação de blogs, identificação de nodos influentes, detecção e mudança de tópicos e análise de sentimento. Em relação aos sites de redes sociais, explicam como funciona a detecção de grupos, perfilação de grupos e sistemas de recomendações. Finalizam o artigo aproximando estas técnicas à práticas de etnografia e netnografia e a mapas de eventos.