Poprzedni zeszyt pokazał podstawy pracy z biblioteką emuR, ale posiada ona o wiele więcej funkcjonalności. Podstawowym celem biblioteki jest zaoszczędzenie czasu osobom pracującycm z korpusami. Idea pracy z nią polega na szybkim testowaniu pomsyłów i hipotez.
Zacznijmy od prawdziwej hipotezy, jaką wszyscy znamy: F0 jest zależne od płci. Co musimy zrobić, żeby przetestować prawdziwość tego stwierdzenia:
- znaleźć segmenty dla jakiejś reprezentatywnej głoski (np. a)
- podzielić je według płci
- wyliczyć F0 dla każdego segmentu
- porównać wartości używając jakiegoś sensownego narzędzia
Zacznijmy zatem od początku. Wczytajmy bazę i zobaczmy, jaką informację posiada:
r
r library(emuR) db <- load_emuDB(‘clarin’, verbose = FALSE) list_levelDefinitions(db)
Według opisu widać, że każda wypowiedź zawiera opis płci mówcy. Nasz problem możemy rozwiązać na kilka sposobów, ale tutaj wypróbujemy ten prostszy.
Znajdźmy odpowiednio segmenty należące do mężczyzn i do kobiet i zapiszmy je w osobnych zmiennych:
Powyższe polecenie szuka wszystkich wystąpień fonemu a w korpusie 10 osób, ale w taki sposób, żeby w poziomie wyższym, czyli zdaniu, annotacja płci była odpowiednio M lub F. Dokładny opis języka zapytań można przeczytać wpisując polecenie:
r
r vignette(‘EQL’)
Na szczęście ilość segmentów, zarówno jednych, jak i drugich, jest w miarę podobna, więc będzie można użyć prostych miar statystycznych do ich porównania.
Wyliczmy najpierw F0 dla poszczególnych segmetnów:
Teraz możemy użyć wykresu pudełkowego, aby porównać te dwie populacje ze sobą:
Wniosek jest oczywisty: kobiety mają głosy o wyższej częstotliwości fundamentalnej od mężczyzn. Proszę jednak docenić, jak łatwo osiągnęliśmy ten cel. Od postawienia hipotezy potrzebowaliśmy zaledwie 8 poleceń, żeby otrzymać rysunek nadający się praktycznie do umieszczenia w pracy i wysłania na konferencję!
Wiele z tego zawdzięczamy potężnemu językowi zapytań, więc warto się przyjrzeć dokładnie dokumentacji powyżej. Zawiera ona mnóstwo przykładów z życia i pokazuje, jak skomplikowane mogą być zapytania wysyłane do bazy.
Inny powód to sam fakt, że bazę zapisaliśmy w formacie EMU. System ten zmusza nas do organizacji własnych nagrań w konkretny sposób i używając specjalnej struktury informacji, ale nagradza nas bardzo przydatnymi narzędziami i wygodą pracy w wyżej zaprezentowany sposób.
LS0tCnRpdGxlOiAiRjAgdyBlbXVSIgpvdXRwdXQ6CiAgaHRtbF9kb2N1bWVudDoKICAgIGRmX3ByaW50OiBwYWdlZAotLS0KClBvcHJ6ZWRuaSB6ZXN6eXQgcG9rYXphxYIgcG9kc3Rhd3kgcHJhY3kgeiBiaWJsaW90ZWvEhSAqKmVtdVIqKiwgYWxlIHBvc2lhZGEgb25hIG8gd2llbGUgd2nEmWNlaiBmdW5rY2pvbmFsbm/Fm2NpLiBQb2RzdGF3b3d5bSBjZWxlbSBiaWJsaW90ZWtpIGplc3QgemFvc3pjesSZZHplbmllIGN6YXN1IG9zb2JvbSBwcmFjdWrEhWN5Y20geiBrb3JwdXNhbWkuIElkZWEgcHJhY3kgeiBuacSFIHBvbGVnYSBuYSBzenlia2ltIHRlc3Rvd2FuaXUgcG9tc3nFgsOzdyBpIGhpcG90ZXouCgpaYWN6bmlqbXkgb2QgcHJhd2R6aXdlaiBoaXBvdGV6eSwgamFrxIUgd3N6eXNjeSB6bmFteTogRjAgamVzdCB6YWxlxbxuZSBvZCBwxYJjaS4gQ28gbXVzaW15IHpyb2JpxIcsIMW8ZWJ5IHByemV0ZXN0b3dhxIcgcHJhd2R6aXdvxZvEhyB0ZWdvIHN0d2llcmR6ZW5pYToKICAKICAxLiB6bmFsZcW6xIcgc2VnbWVudHkgZGxhIGpha2llasWbIHJlcHJlemVudGF0eXduZWogZ8WCb3NraSAobnAuICphKikKICAyLiBwb2R6aWVsacSHIGplIHdlZMWCdWcgcMWCY2kKICAzLiB3eWxpY3p5xIcgRjAgZGxhIGthxbxkZWdvIHNlZ21lbnR1CiAgNC4gcG9yw7N3bmHEhyB3YXJ0b8WbY2kgdcW8eXdhasSFYyBqYWtpZWdvxZsgc2Vuc293bmVnbyBuYXJ6xJlkemlhCiAgClphY3puaWpteSB6YXRlbSBvZCBwb2N6xIV0a3UuIFdjenl0YWpteSBiYXrEmSBpIHpvYmFjem15LCBqYWvEhSBpbmZvcm1hY2rEmSBwb3NpYWRhOgoKYGBge3J9CmxpYnJhcnkoZW11UikKZGIgPC0gbG9hZF9lbXVEQignY2xhcmluJywgdmVyYm9zZSA9IEZBTFNFKQpsaXN0X2xldmVsRGVmaW5pdGlvbnMoZGIpCmBgYAoKV2VkxYJ1ZyBvcGlzdSB3aWRhxIcsIMW8ZSBrYcW8ZGEgd3lwb3dpZWTFuiB6YXdpZXJhIG9waXMgcMWCY2kgbcOzd2N5LiBOYXN6IHByb2JsZW0gbW/FvGVteSByb3p3acSFemHEhyBuYSBraWxrYSBzcG9zb2LDs3csIGFsZSB0dXRhaiB3eXByw7NidWplbXkgdGVuIHByb3N0c3p5LgoKWm5hamTFum15IG9kcG93aWVkbmlvIHNlZ21lbnR5IG5hbGXFvMSFY2UgZG8gbcSZxbxjenl6biBpIGRvIGtvYmlldCBpIHphcGlzem15IGplIHcgb3NvYm55Y2ggem1pZW5ueWNoOgpgYGB7cn0Kc2VnX0YgPC0gZW11Ujo6cXVlcnkoZGIsIltQaG9uZW1lPT1hIF4gR2VuZGVyPT1GXSIpCnNlZ19NIDwtIGVtdVI6OnF1ZXJ5KGRiLCJbUGhvbmVtZT09YSBeIEdlbmRlcj09TV0iKQpgYGAKClBvd3nFvHN6ZSBwb2xlY2VuaWUgc3p1a2Egd3N6eXN0a2ljaCB3eXN0xIVwaWXFhCBmb25lbXUgKmEqIHcga29ycHVzaWUgMTAgb3PDs2IsIGFsZSB3IHRha2kgc3Bvc8OzYiwgxbxlYnkgdyBwb3ppb21pZSB3ecW8c3p5bSwgY3p5bGkgemRhbml1LCBhbm5vdGFjamEgcMWCY2kgYnnFgmEgb2Rwb3dpZWRuaW8gTSBsdWIgRi4gRG9rxYJhZG55IG9waXMgasSZenlrYSB6YXB5dGHFhCBtb8W8bmEgcHJ6ZWN6eXRhxIcgd3Bpc3VqxIVjIHBvbGVjZW5pZToKYGBge3J9CnZpZ25ldHRlKCdFUUwnKQpgYGAKCk5hIHN6Y3rEmcWbY2llIGlsb8WbxIcgc2VnbWVudMOzdywgemFyw7N3bm8gamVkbnljaCwgamFrIGkgZHJ1Z2ljaCwgamVzdCB3IG1pYXLEmSBwb2RvYm5hLCB3acSZYyBixJlkemllIG1vxbxuYSB1xbx5xIcgcHJvc3R5Y2ggbWlhciBzdGF0eXN0eWN6bnljaCBkbyBpY2ggcG9yw7N3bmFuaWEuCgpXeWxpY3pteSBuYWpwaWVydyBGMCBkbGEgcG9zemN6ZWfDs2xueWNoIHNlZ21ldG7Ds3c6CmBgYHtyfQp0ZF9GIDwtIGdldF90cmFja2RhdGEoZGIsIHNlZ19GLCJQaXRjaCIsIGN1dD0wLjUsIGNvbnNpc3RlbnRPdXRwdXRUeXBlID0gRkFMU0UsICB2ZXJib3NlID0gRkFMU0UpCnRkX00gPC0gZ2V0X3RyYWNrZGF0YShkYiwgc2VnX00sIlBpdGNoIiwgY3V0PTAuNSwgY29uc2lzdGVudE91dHB1dFR5cGUgPSBGQUxTRSwgIHZlcmJvc2UgPSBGQUxTRSkKYGBgCgpUZXJheiBtb8W8ZW15IHXFvHnEhyB3eWtyZXN1IHB1ZGXFgmtvd2VnbywgYWJ5IHBvcsOzd25hxIcgdGUgZHdpZSBwb3B1bGFjamUgemUgc29ixIU6CgpgYGB7cn0KYm94cGxvdChjKHRkX0YsdGRfTSksbmFtZXM9YygiRmVtYWxlIiwiTWFsZSIpLHlsYWI9Ikh6IikKYGBgCgpXbmlvc2VrIGplc3Qgb2N6eXdpc3R5OiBrb2JpZXR5IG1hasSFIGfFgm9zeSBvIHd5xbxzemVqIGN6xJlzdG90bGl3b8WbY2kgZnVuZGFtZW50YWxuZWogb2QgbcSZxbxjenl6bi4gUHJvc3rEmSBqZWRuYWsgZG9jZW5pxIcsIGphayDFgmF0d28gb3NpxIVnbsSZbGnFm215IHRlbiBjZWwuIE9kIHBvc3Rhd2llbmlhIGhpcG90ZXp5IHBvdHJ6ZWJvd2FsacWbbXkgemFsZWR3aWUgOCBwb2xlY2XFhCwgxbxlYnkgb3RyenltYcSHIHJ5c3VuZWsgbmFkYWrEhWN5IHNpxJkgcHJha3R5Y3puaWUgZG8gdW1pZXN6Y3plbmlhIHcgcHJhY3kgaSB3eXPFgmFuaWEgbmEga29uZmVyZW5jasSZIQoKV2llbGUgeiB0ZWdvIHphd2R6acSZY3phbXkgcG90xJnFvG5lbXUgasSZenlrb3dpIHphcHl0YcWELCB3acSZYyB3YXJ0byBzacSZIHByenlqcnplxIcgZG9rxYJhZG5pZSBkb2t1bWVudGFjamkgcG93ecW8ZWouIFphd2llcmEgb25hIG1uw7NzdHdvIHByenlrxYJhZMOzdyB6IMW8eWNpYSBpIHBva2F6dWplLCBqYWsgc2tvbXBsaWtvd2FuZSBtb2fEhSBiecSHIHphcHl0YW5pYSB3eXN5xYJhbmUgZG8gYmF6eS4KCklubnkgcG93w7NkIHRvIHNhbSBmYWt0LCDFvGUgYmF6xJkgemFwaXNhbGnFm215IHcgZm9ybWFjaWUgRU1VLiBTeXN0ZW0gdGVuIHptdXN6YSBuYXMgZG8gb3JnYW5pemFjamkgd8WCYXNueWNoIG5hZ3JhxYQgdyBrb25rcmV0bnkgc3Bvc8OzYiBpIHXFvHl3YWrEhWMgc3BlY2phbG5laiBzdHJ1a3R1cnkgaW5mb3JtYWNqaSwgYWxlIG5hZ3JhZHphIG5hcyBiYXJkem8gcHJ6eWRhdG55bWkgbmFyesSZZHppYW1pIGkgd3lnb2TEhSBwcmFjeSB3IHd5xbxlaiB6YXByZXplbnRvd2FueSBzcG9zw7NiLgo=