Abstract | The main objective of the thesis is to study gender differences in language use in a setting of political speeches. The 113th United States Congress, a legislative branch meeting which lasted from January 2013 until January 2015, was selected. In addition to the meeting being the most recent one, the fact that it was composed of the record number of female participants, namely 450 male and 103 female politicians, was the reason for choosing the 113th Congress. The speech transcripts, downloaded from the official repository The Library of Congress Thomas, were included in the corpus. The corpus was composed of all 100-word uninterrupted speeches. The technical prerequisite for analyzing the speech is for it to be composed of at least 100 words, hence the choice. 672 speeches by the female and 2,983 by the male politicians were included in the analysis. The corpus was analyzed with the text analysis software Linguistic Inquiry and Word Count, which calculated the degree to which the politicians used 70 language categories ranging from the word count and grammatical categories to different topics, spoken and punctuation categories. The computational analysis results were uploaded in the software for the statistical analysis Statistical Package for the Social Sciences which was used to do the Mann-Whitney U, independent sample t-test, Kruskal-Wallis, one-way ANOVA and two-tailed Spearman correlation tests. The statistical tests were used to study the differences in language use by the male and the female politicians, i.e. to calculate if the differences were statistically significant. They were also used in examining some intragroup differences and correlations between variables. The quantitative analysis results were interpreted and the possible underlying reasons for the gender differences elaborated on.
The selected tools for the computational and statistical data analysis were proven to be useful. The text analysis software LIWC is a useful tool for the fast and accurate analysis of a large corpus. The pre-established independently rated categories, containing 4,500 words and word stems, provide an unbiased word categorization. Due to their compatibility, LIWC output results are easily uploaded in SPSS, which provides a wide choice of statistical tests, thus making SPSS an excellent supplemental tool. The tools are sufficient for a quantitative data analysis, yet less helpful in results interpretation. To put it differently, the tools provide the information about the difference in frequency and not the contextual usage itself.
In the analysis of the corpus, several major gender differences emerged. The female politicians were shown to be more formal, critical and task-focused, while the male politicians were more socially oriented and elaborative, occupying the floor more than the female politicians. While the female politicians worked on establishing themselves as independent politicians, the male politicians embraced their collective identities. Also, the female politicians focused on raising the awareness of different health issues and providing support for patients and their families, the male politicians focused on the consequences and possible solutions to the problems. |
Abstract (croatian) | Ciljevi i hipoteza
Glavni je cilj ove doktorske disertacije bio utvrditi postoje li razlike u jezičnome izražavanju političara i političarki koji su sudjelovali u 113. sazivu američkoga Kongresa. Osim pobrojavanja i klasificiranja rodnih razlika, cilj je bio izračunati statističku značajnost u uporabi određene jezične kategorije. Drugim riječima, cilj je bio odrediti koja je od dviju proučavanih skupina ispitanika upotrebljavala svaku od 70 jezičnih kategorija više i je li ta razlika u uporabi bila statistički značajna ili ne. Također, jedan je od ciljeva bio istumačiti dobivene statističke rezultate nudeći moguća objašnjenja za rodne razlike u jezičnome izražavanju, odnosno u uporabi pojedine jezične kategorije. Osnovna je hipoteza da postoje statistički značajne rodne razlike u jezičnome izražavanju političara i političarki koji su sudjelovali u 113. sazivu Kongresa. Također, pretpostavilo se da će političarke, s ciljem uspješnijega etabliranja, biti pripremljenije, ozbiljnije i formalnije u iznošenju svojih ideja, dok će političari govoriti duže, biti ekspresivniji i koristiti agresivnije reference.
Metodologija
Korpus istraživanja sastoji se od transkripata govora iz 113. saziva američkoga Kongresa preuzetih sa službenoga repozitorija govora iz Kongresa Thomas. Repozitorij se sastoji od svih govora iz Doma i Senata, naknadnih replika i objašnjenja političara, rasprava, dnevnih obavijesti, poziva na sjednice, amandmana i načina glasovanja. U korpus su istraživanja uključeni svi neprekinuti govori pojedinoga političara koji ispunjavaju tehnički uvjet od najmanje 100 riječi. Točnije, 672 govora političarki i 2 983 govora političara, transkribiranih na ukupno 5 504 stranice, uključeni su u korpus istraživanja. Prije analize, transkripti su pročišćeni slijedeći službene tehničke upute.
Istraživanje se sastojalo od dvaju dijelova – kvantitativnoga i kvalitativnoga. U kvantitativnome su se dijelu istraživanja provele dvije analize. Prvo se provela računalna analiza korpusa primjenom programskoga alata Linguistic Inquiry and Word Count.
Programski alat analiza svaku pojedinačnu riječ u korpusu i uspoređuje ju sa svojim unutarnjim rječnikom koji se sastoji od 4 500 riječi i korijena riječi. Unutarnji je rječnik sastavio panel nezavisnih stručnjaka, a odabir su i kategorizacija riječi za uvrštavanje u rječnik prošli nekoliko procjenjivačkih etapa. Nakon što programski alat usporedi svaku riječ s pojavnicama u svome rječniku, svrstava ih u 80 kategorija koje se kreću od prebrojavanja riječi i gramatičkih kategorija do tematskih i interpunkcijskih kategorija. Za potrebe se ovoga istraživanja odabralo 70 kategorija koje nudi spomenuti programski alat.
Rezultati računalne analize učitani su u programski alat za statističku analizu podataka Statistical Package for the Social Sciences. Kako bi se odabrali adekvatni testovi za statističku analizu, prvo je proveden test distribucije podataka kontinuiranih varijabli. Nadalje, s obzirom na postavljena istraživačka pitanja, u programskome su se alatu koristili Mann-Whitney U i t-test za nezavisne uzorke. Također, korišteni su i jednosmjerna analiza varijance ANOVA, Kruskal-Wallis te
Spearmanov koeficijent korelacije kako bi se napravila podloga i predložio smjer budućih istraživanja u području.
U kvalitativnome su se dijelu istraživanja interpretirali rezultati dobiveni statističkom analizom te objašnjavali razlozi rodnih razlika u korištenju pojedine varijable uzimajući u obzir kontekst govora i koristeći kritičku analizu diskursa.
Rezultati i zaključci
Korišteni programski alati pokazali su se korisnima za kvantitativnu analizu podataka. LIWC je koristan programski alat koji omogućava brzu, točnu i nepristranu kategorizaciju riječi i računalnu analizu. Posebno je pogodan za analize na velikome korpusu. S obzirom na kompatibilnost dvaju programskih alata, rezultati računalne analize lako se mogu učitati u programski alat za statističku obradu podataka SPSS koji omogućava širok izbor parametrijskih i neparametrijskih testova. Međutim, programski alat SPSS može samo dati odgovor na pitanje o frekvenciji korištenja kontinuiranih varijabli i statističkoj značajnosti, ali ne i o kontekstualnoj uporabi pojedine varijable. Drugim riječima, ukoliko je istraživačko pitanje koja od dviju ili više promatranih skupina upotrebljava pojedinu varijablu više i je li razlika u uporabi statistički značajna, programski alati LIWC i SPSS mogu se koristiti kao glavna sredstva u istraživanja. No, ukoliko, pored spomenutoga, istraživačko pitanje uključuje i razloge za uporabu pojedine varijable, programski se alati mogu koristiti samo kao pomoćna sredstva u istraživanju.
Po provedbi računalne, statističke i kontekstualne analize korpusa, donijelo se nekoliko glavnih zaključaka u vezi s rodnim razlikama u jezičnoj uporabi na korpusu govora iz 113. saziva američkoga Kongresa. Političarke su imale ozbiljniji pristup formalnije se obraćajući predsjedavajućem te obrazlažući razloge svoga govora, dok su političari svoje govore češće započinjali tehnikom in medias res. Političarke su bile kritičnije u svojim govorima, koristile složeniji vokabular i više primjera vezanih uz posao, dok su političari proveli više vremena za govornicom i nerijetko iznosili primjere iz privatnoga života. Kontekstualnom se analizom uporabe zamjenica može zaključiti da političarke rade na etabliranju sebe kao nezavisnih sudionika političke scene, dok političari spremnije prihvaćaju kolektivni identitet pri čemu češće spominju doprinose svoje grupacije. Političari su ekspresivniji i češće izražavaju svoje osjećaje na različite načine tijekom čega su im govori postajali nesigurniji, dok su političarke usmjerenije na izvršavanje zadatka. I jedna i druga skupina ispitanika daju veći javi prostor osobama muškoga roda. Nadalje, ciljevi govora političarki često su bili orijentirani na podizanje svijesti o određenome problemu i pružanje podrške obiteljima oboljelih ili ratnih žrtava, dok su političari djelovali proaktivno ukazujući na posljedice i nudeći rješenja za određene probleme. I političari i političarke bavili su se pitanjima postignuća i uspjeha, no političari su uspjeh promatrali kroz prizmu poražavanja protivnika, dok su se političarke fokusirale na rezultat koji nije uključivao nečiji poraz.
Metodološki se okvir i rezultati ovoga istraživanja mogu primijeniti u daljnjim istraživanjima rodnih razlika u političkome diskursu na način da se proširi korpus, napravi komparativna analiza više saziva Kongresa, istraže jezična izražavanja u kongresima drugih zemalja, uvrste nove kategorijske varijable poput stranačke pripadnosti, sudjelovanja u izvršnoj ili zakonodavnoj vlasti i sl. |