Projekt – Mowa nienawiści: Od automatycznej klasyfikacji do zrozumienia dynamiki emocjonalnej

↓ English below

 

Tytuł projektu: Mowa nienawiści: Od automatycznej klasyfikacji do zrozumienia dynamiki emocjonalnej

Kierowniczka: Aleksandra Świderska, aleksandra.swiderska@psych.uw.edu.pl

Projekt finansowany ze środków: Narodowego Centrum Nauki (NCN) oraz Deutsche Forschungsgemeinschaft (DFG)

Partnerzy: Cognitive Systems Lab, Uniwersytet w Bremie, Niemcy

 

O projekcie:

Mowa nienawiści to forma agresji werbalnej wymierzonej w członkinie i członków różnych grup społecznych. Jest szeroko rozpowszechniona w życiu codziennym – słyszymy ją w interakcjach z innymi ludźmi, w przestrzeni publicznej, w telewizji, radiu i Internecie. Mowa nienawiści jest tematem o dużym znaczeniu społecznym, ponieważ ma szkodliwe konsekwencje nie tylko dla jednostek i grup, do których jest bezpośrednio skierowana, ale dla każdego, kto jest na nią narażony w różnych sytuacjach. Głównym celem naszego projektu jest zrozumienie podstawowych właściwości mowy nienawiści i jej wpływu na słuchaczy. Będziemy pracować z nagraniami mowy nienawiści, w odróżnieniu od większości poprzednich badań, które koncentrowały się na mowie nienawiści w formie tekstowej. Stworzymy bazę danych audio i opracujemy cechy akustyczne, językowe i paralingwistyczne, które pozwolą na w pełni automatyczną identyfikację mowy nienawiści. Spodziewamy się, że mowa nienawiści w formie nagrań będzie wywoływała silniejsze reakcje emocjonalne i tym samym będzie trudniej się do niej przyzwyczaić niż do jej odpowiedników tekstowych. Planujemy przeprowadzenie badań, w których będziemy manipulować treścią stwierdzeń, sposobem ich prezentacji i opcjami odpowiedzi dla uczestników. Dokonamy pomiarów aktywności psychofizjologicznej i behawioralnej uczestników (np. aktywności skóry, serca, mózgu). Będziemy również używać metod przetwarzania sygnałów i uczenia maszynowego do rozpoznawania i odróżniania mowy nienawiści od innych typów mowy, zarówno po stronie mówiących, jak i słuchaczy. W tym celu przygotujemy adnotowane nagrania nienawistnych wypowiedzi, które będą podstawą dla stworzenia automatycznych klasyfikatorów. Adnotacje będą początkowo wykonywane ręcznie, a następnie szybko rozszerzane za pomocą automatycznych transkrypcji w oparciu o automatyczne rozpoznawanie mowy. Wierzymy, że inni badacze w dziedzinie nauk społecznych będą zainteresowani wykorzystaniem wyników naszego projektu do własnej pracy, np. do badania blogów zawierających nienawistne wypowiedzi. W dziedzinie informatyki, ręcznie adnotowana baza danych zapewni bardzo użyteczną podstawę do badania i klasyfikacji skrajnych emocji w Internecie.


 

Project title: Hate speech: From automatic classification to understanding emotional dynamics

PI: Aleksandra Świderska (aleksandra.swiderska@psych.uw.edu.pl)

Funding: National Science Center, Poland and Deutsche Forschungsgemeinschaft (DFG)

Project partners: Cognitive Systems Lab, University of Bremen, Germany

 

About the project:

Hate speech is a form of verbal aggression targeting members of various social groups. It is widespread in everyday life – we hear it in interactions with other people, in public spaces, on the TV, radio, and the Internet. Hate speech is a topic of great social significance as it has detrimental consequences not just for the targeted individuals and groups, but for everybody exposed to it. In the project, our objective is to understand the underlying properties of hate speech and its impact on the listeners. We will work with audio recordings of hate speech, and refer to it as auditory hate speech to discriminate it from textual representations, which most of the previous research concentrated on. We will create an audio database and develop acoustic, linguistic, and paralinguistic features relevant to fully automatic identification of hate speech. We expect that auditory hate speech will be a more powerful elicitor of emotional responses than its textual counterpart, and people will thus not get used to it as easily as to textual hate speech. We plan on conducting studies in which we will manipulate the content of stimuli, their modality, and participants’ response options. We will then measure participants’ psychophysiological and behavioral responses (e.g., activity of skin, heart, brain). We will also use signal processing and machine learning methods to identify and differentiate hate speech from other types of speech, on the sides of both speakers and listeners. This will be achieved through the creation of a vast amount of annotated data from hateful utterances, and subsequent development of automatic learning classifiers, which will draw on the acoustic, linguistic, and paralinguistic features of hate speech. Initially, annotations will be performed manually, and rapidly extended by means of automatic transcriptions based on automatic speech recognition. We believe that other researchers in the social sciences will be interested in using the outcomes of the project for their own work, e.g., to study blogs containing auditory hate speech. For the speech community in computer science, the manually annotated database will provide a highly useful ground truth for the study and classification of extreme emotions on the Internet.