Poprzedni zeszyt pokazał podstawy pracy z biblioteką emuR, ale posiada ona o wiele więcej funkcjonalności. Podstawowym celem biblioteki jest zaoszczędzenie czasu osobom pracującycm z korpusami. Idea pracy z nią polega na szybkim testowaniu pomsyłów i hipotez.

Zacznijmy od prawdziwej hipotezy, jaką wszyscy znamy: F0 jest zależne od płci. Co musimy zrobić, żeby przetestować prawdziwość tego stwierdzenia:

  1. znaleźć segmenty dla jakiejś reprezentatywnej głoski (np. a)
  2. podzielić je według płci
  3. wyliczyć F0 dla każdego segmentu
  4. porównać wartości używając jakiegoś sensownego narzędzia

Zacznijmy zatem od początku. Wczytajmy bazę i zobaczmy, jaką informację posiada:

rr library(emuR) db <- load_emuDB(‘clarin’, verbose = FALSE) list_levelDefinitions(db)

Według opisu widać, że każda wypowiedź zawiera opis płci mówcy. Nasz problem możemy rozwiązać na kilka sposobów, ale tutaj wypróbujemy ten prostszy.

Znajdźmy odpowiednio segmenty należące do mężczyzn i do kobiet i zapiszmy je w osobnych zmiennych:

Powyższe polecenie szuka wszystkich wystąpień fonemu a w korpusie 10 osób, ale w taki sposób, żeby w poziomie wyższym, czyli zdaniu, annotacja płci była odpowiednio M lub F. Dokładny opis języka zapytań można przeczytać wpisując polecenie:

rr vignette(‘EQL’)

Na szczęście ilość segmentów, zarówno jednych, jak i drugich, jest w miarę podobna, więc będzie można użyć prostych miar statystycznych do ich porównania.

Wyliczmy najpierw F0 dla poszczególnych segmetnów:

Teraz możemy użyć wykresu pudełkowego, aby porównać te dwie populacje ze sobą:

Wniosek jest oczywisty: kobiety mają głosy o wyższej częstotliwości fundamentalnej od mężczyzn. Proszę jednak docenić, jak łatwo osiągnęliśmy ten cel. Od postawienia hipotezy potrzebowaliśmy zaledwie 8 poleceń, żeby otrzymać rysunek nadający się praktycznie do umieszczenia w pracy i wysłania na konferencję!

Wiele z tego zawdzięczamy potężnemu językowi zapytań, więc warto się przyjrzeć dokładnie dokumentacji powyżej. Zawiera ona mnóstwo przykładów z życia i pokazuje, jak skomplikowane mogą być zapytania wysyłane do bazy.

Inny powód to sam fakt, że bazę zapisaliśmy w formacie EMU. System ten zmusza nas do organizacji własnych nagrań w konkretny sposób i używając specjalnej struktury informacji, ale nagradza nas bardzo przydatnymi narzędziami i wygodą pracy w wyżej zaprezentowany sposób.

LS0tCnRpdGxlOiAiRjAgdyBlbXVSIgpvdXRwdXQ6CiAgaHRtbF9kb2N1bWVudDoKICAgIGRmX3ByaW50OiBwYWdlZAotLS0KClBvcHJ6ZWRuaSB6ZXN6eXQgcG9rYXphxYIgcG9kc3Rhd3kgcHJhY3kgeiBiaWJsaW90ZWvEhSAqKmVtdVIqKiwgYWxlIHBvc2lhZGEgb25hIG8gd2llbGUgd2nEmWNlaiBmdW5rY2pvbmFsbm/Fm2NpLiBQb2RzdGF3b3d5bSBjZWxlbSBiaWJsaW90ZWtpIGplc3QgemFvc3pjesSZZHplbmllIGN6YXN1IG9zb2JvbSBwcmFjdWrEhWN5Y20geiBrb3JwdXNhbWkuIElkZWEgcHJhY3kgeiBuacSFIHBvbGVnYSBuYSBzenlia2ltIHRlc3Rvd2FuaXUgcG9tc3nFgsOzdyBpIGhpcG90ZXouCgpaYWN6bmlqbXkgb2QgcHJhd2R6aXdlaiBoaXBvdGV6eSwgamFrxIUgd3N6eXNjeSB6bmFteTogRjAgamVzdCB6YWxlxbxuZSBvZCBwxYJjaS4gQ28gbXVzaW15IHpyb2JpxIcsIMW8ZWJ5IHByemV0ZXN0b3dhxIcgcHJhd2R6aXdvxZvEhyB0ZWdvIHN0d2llcmR6ZW5pYToKICAKICAxLiB6bmFsZcW6xIcgc2VnbWVudHkgZGxhIGpha2llasWbIHJlcHJlemVudGF0eXduZWogZ8WCb3NraSAobnAuICphKikKICAyLiBwb2R6aWVsacSHIGplIHdlZMWCdWcgcMWCY2kKICAzLiB3eWxpY3p5xIcgRjAgZGxhIGthxbxkZWdvIHNlZ21lbnR1CiAgNC4gcG9yw7N3bmHEhyB3YXJ0b8WbY2kgdcW8eXdhasSFYyBqYWtpZWdvxZsgc2Vuc293bmVnbyBuYXJ6xJlkemlhCiAgClphY3puaWpteSB6YXRlbSBvZCBwb2N6xIV0a3UuIFdjenl0YWpteSBiYXrEmSBpIHpvYmFjem15LCBqYWvEhSBpbmZvcm1hY2rEmSBwb3NpYWRhOgoKYGBge3J9CmxpYnJhcnkoZW11UikKZGIgPC0gbG9hZF9lbXVEQignY2xhcmluJywgdmVyYm9zZSA9IEZBTFNFKQpsaXN0X2xldmVsRGVmaW5pdGlvbnMoZGIpCmBgYAoKV2VkxYJ1ZyBvcGlzdSB3aWRhxIcsIMW8ZSBrYcW8ZGEgd3lwb3dpZWTFuiB6YXdpZXJhIG9waXMgcMWCY2kgbcOzd2N5LiBOYXN6IHByb2JsZW0gbW/FvGVteSByb3p3acSFemHEhyBuYSBraWxrYSBzcG9zb2LDs3csIGFsZSB0dXRhaiB3eXByw7NidWplbXkgdGVuIHByb3N0c3p5LgoKWm5hamTFum15IG9kcG93aWVkbmlvIHNlZ21lbnR5IG5hbGXFvMSFY2UgZG8gbcSZxbxjenl6biBpIGRvIGtvYmlldCBpIHphcGlzem15IGplIHcgb3NvYm55Y2ggem1pZW5ueWNoOgpgYGB7cn0Kc2VnX0YgPC0gZW11Ujo6cXVlcnkoZGIsIltQaG9uZW1lPT1hIF4gR2VuZGVyPT1GXSIpCnNlZ19NIDwtIGVtdVI6OnF1ZXJ5KGRiLCJbUGhvbmVtZT09YSBeIEdlbmRlcj09TV0iKQpgYGAKClBvd3nFvHN6ZSBwb2xlY2VuaWUgc3p1a2Egd3N6eXN0a2ljaCB3eXN0xIVwaWXFhCBmb25lbXUgKmEqIHcga29ycHVzaWUgMTAgb3PDs2IsIGFsZSB3IHRha2kgc3Bvc8OzYiwgxbxlYnkgdyBwb3ppb21pZSB3ecW8c3p5bSwgY3p5bGkgemRhbml1LCBhbm5vdGFjamEgcMWCY2kgYnnFgmEgb2Rwb3dpZWRuaW8gTSBsdWIgRi4gRG9rxYJhZG55IG9waXMgasSZenlrYSB6YXB5dGHFhCBtb8W8bmEgcHJ6ZWN6eXRhxIcgd3Bpc3VqxIVjIHBvbGVjZW5pZToKYGBge3J9CnZpZ25ldHRlKCdFUUwnKQpgYGAKCk5hIHN6Y3rEmcWbY2llIGlsb8WbxIcgc2VnbWVudMOzdywgemFyw7N3bm8gamVkbnljaCwgamFrIGkgZHJ1Z2ljaCwgamVzdCB3IG1pYXLEmSBwb2RvYm5hLCB3acSZYyBixJlkemllIG1vxbxuYSB1xbx5xIcgcHJvc3R5Y2ggbWlhciBzdGF0eXN0eWN6bnljaCBkbyBpY2ggcG9yw7N3bmFuaWEuCgpXeWxpY3pteSBuYWpwaWVydyBGMCBkbGEgcG9zemN6ZWfDs2xueWNoIHNlZ21ldG7Ds3c6CmBgYHtyfQp0ZF9GIDwtIGdldF90cmFja2RhdGEoZGIsIHNlZ19GLCJQaXRjaCIsIGN1dD0wLjUsIGNvbnNpc3RlbnRPdXRwdXRUeXBlID0gRkFMU0UsICB2ZXJib3NlID0gRkFMU0UpCnRkX00gPC0gZ2V0X3RyYWNrZGF0YShkYiwgc2VnX00sIlBpdGNoIiwgY3V0PTAuNSwgY29uc2lzdGVudE91dHB1dFR5cGUgPSBGQUxTRSwgIHZlcmJvc2UgPSBGQUxTRSkKYGBgCgpUZXJheiBtb8W8ZW15IHXFvHnEhyB3eWtyZXN1IHB1ZGXFgmtvd2VnbywgYWJ5IHBvcsOzd25hxIcgdGUgZHdpZSBwb3B1bGFjamUgemUgc29ixIU6CgpgYGB7cn0KYm94cGxvdChjKHRkX0YsdGRfTSksbmFtZXM9YygiRmVtYWxlIiwiTWFsZSIpLHlsYWI9Ikh6IikKYGBgCgpXbmlvc2VrIGplc3Qgb2N6eXdpc3R5OiBrb2JpZXR5IG1hasSFIGfFgm9zeSBvIHd5xbxzemVqIGN6xJlzdG90bGl3b8WbY2kgZnVuZGFtZW50YWxuZWogb2QgbcSZxbxjenl6bi4gUHJvc3rEmSBqZWRuYWsgZG9jZW5pxIcsIGphayDFgmF0d28gb3NpxIVnbsSZbGnFm215IHRlbiBjZWwuIE9kIHBvc3Rhd2llbmlhIGhpcG90ZXp5IHBvdHJ6ZWJvd2FsacWbbXkgemFsZWR3aWUgOCBwb2xlY2XFhCwgxbxlYnkgb3RyenltYcSHIHJ5c3VuZWsgbmFkYWrEhWN5IHNpxJkgcHJha3R5Y3puaWUgZG8gdW1pZXN6Y3plbmlhIHcgcHJhY3kgaSB3eXPFgmFuaWEgbmEga29uZmVyZW5jasSZIQoKV2llbGUgeiB0ZWdvIHphd2R6acSZY3phbXkgcG90xJnFvG5lbXUgasSZenlrb3dpIHphcHl0YcWELCB3acSZYyB3YXJ0byBzacSZIHByenlqcnplxIcgZG9rxYJhZG5pZSBkb2t1bWVudGFjamkgcG93ecW8ZWouIFphd2llcmEgb25hIG1uw7NzdHdvIHByenlrxYJhZMOzdyB6IMW8eWNpYSBpIHBva2F6dWplLCBqYWsgc2tvbXBsaWtvd2FuZSBtb2fEhSBiecSHIHphcHl0YW5pYSB3eXN5xYJhbmUgZG8gYmF6eS4KCklubnkgcG93w7NkIHRvIHNhbSBmYWt0LCDFvGUgYmF6xJkgemFwaXNhbGnFm215IHcgZm9ybWFjaWUgRU1VLiBTeXN0ZW0gdGVuIHptdXN6YSBuYXMgZG8gb3JnYW5pemFjamkgd8WCYXNueWNoIG5hZ3JhxYQgdyBrb25rcmV0bnkgc3Bvc8OzYiBpIHXFvHl3YWrEhWMgc3BlY2phbG5laiBzdHJ1a3R1cnkgaW5mb3JtYWNqaSwgYWxlIG5hZ3JhZHphIG5hcyBiYXJkem8gcHJ6eWRhdG55bWkgbmFyesSZZHppYW1pIGkgd3lnb2TEhSBwcmFjeSB3IHd5xbxlaiB6YXByZXplbnRvd2FueSBzcG9zw7NiLgo=