Sentiment analysis. An example of application and evaluation of RID dictionary and Bayesian classification methods in qualitative data analysis approach

Journal Title: PRZEGLĄD SOCJOLOGII JAKOŚCIOWEJ - Year 2014, Vol 10, Issue 2

Abstract

The purpose of this article is to present the basic methods for classifying text data. These methods make use of achievements earned in areas such as: natural language processing, the analysis of unstructured data. I introduce and compare two analytical techniques applied to text data. The first analysis makes use of thematic vocabulary tool (sentiment analysis). The second technique uses the idea of Bayesian classification and applies, so-called, naive Bayes algorithm. My comparison goes towards grading the efficiency of use of these two analytical techniques. I emphasize solutions that are to be used to build dictionary accurate for the task of text classification. Then, I compare supervised classification to automated unsupervised analysis’ effectiveness. These results reinforce the conclusion that a dictionary which has received good evaluation as a tool for classification should be subjected to review and modification procedures if is to be applied to new empirical material. Adaptation procedures used for analytical dictionary become, in my proposed approach, the basic step in the methodology of textual data analysis.

Authors and Affiliations

Krzysztof Tomanek

Keywords

Related Articles

Społeczny świat hodowców gołębi pocztowych

Niniejszy tekst stanowi próbę opisu społecznego świata hodowców gołębi pocztowych. Celem, jaki przed sobą postawiłam jest spojrzenie na wybrane aspekty konstytuujące grupę społeczną hodowców gołębi pocztowych z perspekty...

Autobiografia Alice Salomon - struktury procesowe biografii a losy narodu niemieckiego

W artykule podjęto zagadnienie struktur procesowych w autobiografii Alice Salomon i relacji między biograficzną i kolektywną trajektorią. Poza wstępnymi informacjami o samej pionierce pracy socjalnej w Niemczech i jej mi...

Zastosowanie oprogramowania Atlas.ti i NVivo w realizacji badań opartych na metodologii teorii ugruntowanej

Artykuł porusza problematykę zastosowania specjalistycznego oprogramowania wspomagającego analizę danych jakościowych w badaniach opartych na procedurach metodologii teorii ugruntowanej (MTU ). Celem artykułu jest pokaz...

Autoetnografia analityczna

Autoetnografia stała się w ostatnim czasie popularną formą badań jakościowych. Aktualny dyskurs autoetnograficzny odsyła jednak niemal wyłącznie do „autoetnografii ewokatywnej”, która opiera się na postmodernistycznym ty...

Czy brak naturalizacji wyklucza nową tożsamość narodową? Konstruowanie tożsamości w narracjach wieloletnich imigrantów bez obywatelstwa polskiego

Artykuł opisuje narracyjne konstruowanie tożsamości przez osiadłych w Polsce wieloletnich imigrantów, którzy spełniają kryteria naturalizacji, ale nie chcą starać się o obywatelstwo państwa przyjmującego. Wśród przyczyn...

Download PDF file
  • EP ID EP110690
  • DOI -
  • Views 137
  • Downloads 0

How To Cite

Krzysztof Tomanek (2014). Sentiment analysis. An example of application and evaluation of RID dictionary and Bayesian classification methods in qualitative data analysis approach. PRZEGLĄD SOCJOLOGII JAKOŚCIOWEJ, 10(2), 118-136. https://europub.co.uk/articles/-A-110690