Acompanhamento, análise e pesquisa de opinião pública e sentimentos

Acompanhamento, análise e pesquisa de opinião pública e sentimentos

Este projecto tem dois objectivos principais. O primeiro é a concepção de um sistema de extracção de opinião capaz de medir, quase em tempo real, os sentimentos em relação aos actores políticos e à economia no conteúdo dos media convencionais baseados na web (jornais on-line) e nos chamados media sociais (blogues e micro-blogues). O segundo é utilizar os dados recolhidos de forma a explorar e explicar a relação entre, por um lado, as diferentes tendências nos sentimentos expressos nos media convencionais e sociais e, por outro, os dados recolhidos através de inquéritos de opinião em Portugal. O conceito de "opinião pública" que prevalece nas ciências sociais modernas consiste na agregação das atitudes, preferências e crenças dos indivíduos, tal como capturadas por inquéritos a amostras seleccionadas aleatoriamente. Isso, no entanto, não nos deve levar a crer que os inquéritos possam ser a única fonte de dados teórica e empiricamente relevantes para o estudo da "opinião pública". Por um lado, como meios de captar crenças e atitudes, eles vêm enfrentando dificuldades em lidar com enviesamentos causados por problemas de cobertura em inquéritos telefónicos - o aumento dos domicílios "cell only" - e crescentes taxas de não-resposta. Por outro lado, compreender e explicar a opinião pública tem sempre exigido mais do que o uso de inquéritos. O conteúdo dos media não é apenas um objecto relevante de estudo em si mesmo para os estudiosos da comunicação, mas também pode fornecer informações cruciais sobre as fontes da opinião pública. Serão as atitudes dos indivíduos de algum modo explicadas pelas mensagens dos media a que estão expostos? Serão os conteúdos noticiosos e editoriais igualmente influentes, e será a distinção entre eles clara? Será a "opinião pública" de facto impulsionada pelas pistas e enquadramentos fornecidos pela "opinião publicada"? Ou pelo contrário, serão as opiniões transmitidas pelas elites e pelos agentes dos media determinadas pelas preferências do público em geral? Responder a tais perguntas exige a recolha de dados para além dos fornecidos pelos inquéritos de opinião. A relação entre os factos políticos e económicos e a forma como os cidadãos acabam por apreendê-los e reagir-lhes tornou-se mais complexa com a ascensão dos chamados media sociais. Blogues e micro-blogues (como o Twitter) desempenham várias funções nesta relação. Primeiro, eles podem constituir fontes adicionais de informação e estímulos politicamente relevantes para os cidadãos. Segundo, eles são fontes de informação política também para os jornalistas e as elites políticas, levantando a possibilidade de que as mensagens e conversas nos media sociais possam influenciar a opinião pública indirectamente, muito para além do que a dimensão da sua audiência directa possa sugerir.

Finalmente, elas podem fornecer uma janela para a opinião pública em si mesma: apesar de bloggers, micro-bloggers e aqueles que se envolvem na comunicação online não serem certamente um segmento representativo da população em geral, há um número ainda pequeno mas crescente de estudos sugerindo que o teor dessas mensagens e sua frequência podem fornecer indicações válidas das tendências da opinião pública e até mesmo, em alguns casos, ajudar a prever resultados eleitorais. Como notam Drezner e Farrell, um dos problemas enfrentados pelos estudiosos a este respeito é o facto de "a exploração adequada destes dados requerer habilidades e conhecimentos especializados de um tipo que os cientistas sociais muitas vezes não têm". De forma a ultrapassar este problema, o projecto integra uma verdadeira equipa multidisciplinar composta por engenheiros informáticos, linguistas, cientistas políticos e economistas com os conhecimentos técnicos e teóricos necessários para atingir os objectivos principais do projecto.

 

Estatuto: 
Entidade proponente
Financiado: 
Sim
Entidades: 
Fundação para a Ciência e Tecnologia
Keywords: 

Opinião pública; Prospecção da Web Social; Sentimentos em linha; Séries temporais

Este projecto tem dois objectivos principais. O primeiro é a concepção de um sistema de extracção de opinião capaz de medir, quase em tempo real, os sentimentos em relação aos actores políticos e à economia no conteúdo dos media convencionais baseados na web (jornais on-line) e nos chamados media sociais (blogues e micro-blogues). O segundo é utilizar os dados recolhidos de forma a explorar e explicar a relação entre, por um lado, as diferentes tendências nos sentimentos expressos nos media convencionais e sociais e, por outro, os dados recolhidos através de inquéritos de opinião em Portugal. O conceito de "opinião pública" que prevalece nas ciências sociais modernas consiste na agregação das atitudes, preferências e crenças dos indivíduos, tal como capturadas por inquéritos a amostras seleccionadas aleatoriamente. Isso, no entanto, não nos deve levar a crer que os inquéritos possam ser a única fonte de dados teórica e empiricamente relevantes para o estudo da "opinião pública". Por um lado, como meios de captar crenças e atitudes, eles vêm enfrentando dificuldades em lidar com enviesamentos causados por problemas de cobertura em inquéritos telefónicos - o aumento dos domicílios "cell only" - e crescentes taxas de não-resposta. Por outro lado, compreender e explicar a opinião pública tem sempre exigido mais do que o uso de inquéritos. O conteúdo dos media não é apenas um objecto relevante de estudo em si mesmo para os estudiosos da comunicação, mas também pode fornecer informações cruciais sobre as fontes da opinião pública. Serão as atitudes dos indivíduos de algum modo explicadas pelas mensagens dos media a que estão expostos? Serão os conteúdos noticiosos e editoriais igualmente influentes, e será a distinção entre eles clara? Será a "opinião pública" de facto impulsionada pelas pistas e enquadramentos fornecidos pela "opinião publicada"? Ou pelo contrário, serão as opiniões transmitidas pelas elites e pelos agentes dos media determinadas pelas preferências do público em geral? Responder a tais perguntas exige a recolha de dados para além dos fornecidos pelos inquéritos de opinião. A relação entre os factos políticos e económicos e a forma como os cidadãos acabam por apreendê-los e reagir-lhes tornou-se mais complexa com a ascensão dos chamados media sociais. Blogues e micro-blogues (como o Twitter) desempenham várias funções nesta relação. Primeiro, eles podem constituir fontes adicionais de informação e estímulos politicamente relevantes para os cidadãos. Segundo, eles são fontes de informação política também para os jornalistas e as elites políticas, levantando a possibilidade de que as mensagens e conversas nos media sociais possam influenciar a opinião pública indirectamente, muito para além do que a dimensão da sua audiência directa possa sugerir.

Finalmente, elas podem fornecer uma janela para a opinião pública em si mesma: apesar de bloggers, micro-bloggers e aqueles que se envolvem na comunicação online não serem certamente um segmento representativo da população em geral, há um número ainda pequeno mas crescente de estudos sugerindo que o teor dessas mensagens e sua frequência podem fornecer indicações válidas das tendências da opinião pública e até mesmo, em alguns casos, ajudar a prever resultados eleitorais. Como notam Drezner e Farrell, um dos problemas enfrentados pelos estudiosos a este respeito é o facto de "a exploração adequada destes dados requerer habilidades e conhecimentos especializados de um tipo que os cientistas sociais muitas vezes não têm". De forma a ultrapassar este problema, o projecto integra uma verdadeira equipa multidisciplinar composta por engenheiros informáticos, linguistas, cientistas políticos e economistas com os conhecimentos técnicos e teóricos necessários para atingir os objectivos principais do projecto.

 

Objectivos: 
The design of an opinion mining system able to harvest texts from web-based conventional media (news items in mainstream media sites) and social media (blogs and Twitter) and to process those texts, recognizing topics and political actors, analyzing relevant linguistic units, and generating indicators of both frequency of mention and polarity (positivity/negativity) of mentions to political actors and economic policies across sources, types of sources, and across time. The statistical analysis of the relationship between the previous indicators both among themselves and with public opinion data collected by polls and surveys, testing hypotheses about the directionality of the relationship between conventional media and social media contents, as well as their relationship with mass public opinion. Final products include a prototype of an opinion mining system specifically designed to treat Portuguese content, whose results will be made available to the public at large and will be used to investigate the importance of social media in Portugal as a source of political information and a means for politically relevant discussion.
State of the art: 
The literature that is directly relevant for this project can be organized around two fundamental questions: 1.How can mainstream and social media contents be automatically extracted and measured in a valid and reliable way? Content analysis of mass media has an established tradition in the social sciences, particularly in the study of effects of media messages, encompassing topics as diverse as those addressed in seminal studies of newspaper editorials (Lasswell et al. 1952), media agenda-setting (McCombs & Shaw 1972), or the uses of political rhetoric (Moen 1990), among many others. By 1997, Riffe & Freitag (1997), reported an increase in the use of content analysis in communication research and suggested that digital text and computerized means for its extraction and analysis would reinforce such trend. Their expectation has been fulfilled: the use of automated content analysis has by now surpassed the use of hand coding (Neuendorf 2002). The increase in the digital sources of text, on the one hand, and current advances in computation power and design, on the other, are making this development both necessary and possible, while also raising awareness about the inferential pitfalls involved (Hopkins & King 2010).</p><p>One particularly promising avenue of research concerns the use of opinion mining (or sentiment analysis), i.e., the automatic extraction and representation of subjective content underlying texts (Pang & Lee 2008). Different computational approaches have been explored to process sentiment in text, namely machine learning and linguistic based methods (Pang et al. 2002 and Choi & Cardie 2008, respectively). In practice, algorithms often combine both strategies. Recently, O'Connor et al. (2010) showed that a simple sentiment detector can be effective in capturing trends on specific topics from Twitter messages. In Portugal, a preliminary study by Carvalho et al. (2010) on a collection of comments posted by the readers of a daily newspaper to a set of news articles covering the 2009 Portuguese parliamentary election debates shows that negative opinions tend to greatly outnumber positive opinions. The sentiment classifiers and visualization software to be developed under this project will explore different strategies, taking into account the types and genres of opinionated text we want to process. Our task is made easier by the fact that we can rely on existing technology and resources developed to classify and collected news and social media by some of the proponents of POPSTAR, namely under the REACTION project (http://xldb.fc.ul.pt/wiki/Reaction).</p><p>2. What can we learn about public opinion and its formation by examining media and social media contents?</p><p>The relationship between media communication and mass level beliefs and attitudes has been a central concern of public opinion studies (for a comprehensive review, see Preiss 2007). The massive expansion of blogs and micro-blogs (such as Twitter) raises questions that seem, at first glance, quite similar. What segments of public opinion are exposed to blogs and use them as a source of information (Eveland &amp; Dylko 2007)? How do they rate them in terms of credibility as compared to other sources (Banning and Trammell 2006)? What determines exposure to political content contained in blog posts (Johnson et al. 2009)?</p><p>However, there are several obvious differences between social and conventional media that raise new relevant lines of inquiry, which are the ones we will pursue in POPSTAR. The first is related to the additional mechanisms through which social media contents might affect public opinions. Although social media contents still reach directly only a small and unrepresentative segment of the population, social media can influence public beliefs and attitudes indirectly, by shaping the agendas and views of journalists, politicians and other actors who communicate with broader audiences. Are the agenda and tone of conventional media outlets influenced by social media contents, or do blogs follow the conventional media agendas (Lloyd et al. 2006; Drezner and Farrell 2008; Wallsten 2010)? A second main line of inquiry concerns the extent to which the contents of online communications through social media can serve as a leading indicator of changes in public opinion. Although those who actively engage in broadcasting messages through either blog or micro-blogs are likely to be an even narrower and more polarized cross-section of the population, social media messages conveyed by these independent agents can provide an 'aggregative function'; through which important political parameters of interest can be estimated (Munger 2008). Social media can be seen as systems of peer-production that can generate high quality information (Tapscott & Williams 2007; Watts 2009). Tumasjan et al. (2010) show that the mere frequency of mentions of political parties in Twitter messages serves as a good predictor of electoral results. O'Connor et al. (2010) and Gonzalez-Bailon et al. (2010) explore the relationship between sentiment measures extracted from Twitter with consumer confidence and presidential job approval polls, suggesting that automatic sentiment detection of Twitter could monitor public opinion about popular topics. POPSTAR proceeds along these two lines of inquiry. In what concerns the relationship between contents of mainstream media, blogs and micro-blogs, are the paths of mutual influence that have been detected in terms of their agendas also found when one focuses in other aspects of contents, such as the tone, polarity, and intensity of opinions? What are the answers to these questions when we compare blogging with micro-blogging? And how are indicators derived from the analysis of the polarity and intensity of mainstream and social media messages related to indicators derived from conventional survey and poll data on political and economic issues, such as approval of political leaders and parties and consumer confidence?
Parceria: 
Rede Nacional
Luís Aguiar-Conraria
Maria Eduarda Rodrigues
Mário Gaspar Silva
Matko Bosnjak
Paula Cristina Quaresma da Fonseca Carvalho

POPSTAR

Coordenador 
Data Inicio: 
21/03/2012
Data Fim: 
20/03/2014
Duração: 
24 meses
Concluído