Zbiór leksykalny
Zbiór leksykalny (ang. lexical set) to zbiór słów tworzących jedną kategorię na podstawie jednej wspólnej cechy fonologicznej.
Zbiór leksykalny najczęściej określany jest za pomocą określonego słowa kluczowego (ang. keyword) które pozwala zidentyfikować określoną cechę fonologiczną. Dla przykładu, w języku polskim można wyróżnić zbiór leksykalny KĄT, do którego należą wszystkie wyrazy posiadające fonem /ɔ̃/ przed spółgłoskami plozywnymi koronalnymi, np. kąt, oglądać, błąd, piąty. Innym zbiorem leksykalnym może być zbiór KRĘT, do którego należą wszystkie wyrazy posiadające w takim samym otoczeniu fonem /ɛ̃/: kręt, pęd, dęty. Wyrazy KĄT i KRĘT to słowa kluczowe, które identyfikują dane zbiory. Słowa kluczowe zazwyczaj dobiera się tak, by jednoznacznie wskazywały rozpatrywaną cechę fonologiczną.
Zbiory leksykalne często służą do definiowania tzw. mergerów i splitów – gdy dwa fonemy zapadają się w jeden, tworząc homonimy (wyrazy wymawiane tak samo) (np. cot-caught merger) lub gdy jeden fonem w efekcie rozdziela się na dwa, dystynktywne fonemy (np. foot-strut split).
Język angielski
W analizie dialektów języka angielskiego powszechnie używa się zbiorów leksykalnych, gdyż w sposób intuicyjny opisują cechy fonetyczne danego dialektu/akcentu.
Najbardziej popularną klasyfikacją są Standard Lexical Sets for English wprowadzone przez Johna C. Wellsa w Accents of English (1982). Wells definiuje tam zbiory leksykalne na podstawie wymowy słów w dwóch akcentach, RP i GenAm:
- "RP" odnosi się do Received Pronunciation.
- "GenAm" odnosi się do jednego z odmian General American, czyli geograficznie "neutralnego" akcentu używanego w Stanach Zjednoczonych. Jest to jednak wariant bardzo konserwatywny (nawet jak na rok 1982), gdyż w tej analizie słowa horse i hoarse nie są homonimami.
Wells klasyfikuje słowa w języku angielskim do 24 zbiorów leksykalnych na podstawie wymowy samogłoski akcentowanej w obu akcentach. Każdy ze zbiorów leksykalnych ma określone słowo kluczowe reprezentujące ten zbiór, zapisane przy użyciu kapitalików. Wells ponadto wyróżnia trzy zbiory opisujące wymowę samogłosek nieakcentowanych w wygłosie wyrazu (konkretnie są to zbiory happY, lettER oraz commA).
Słowo kluczowe | RP | GenAm | Przykłady |
---|---|---|---|
TRAP | æ | æ | tap, back, badge, scalp, hand, cancel |
BATH | ɑː | æ | staff, brass, ask, dance, sample, calf |
PALM | ɑː | ɑ | psalm, father, bra, spa, lager |
LOT | ɒ | ɑ | stop, sock, dodge, romp, possible, quality |
CLOTH | ɒ | ɔ | cough, broth, cross, long, Boston |
THOUGHT | ɔː | ɔ | taught, sauce, hawk, jaw, broad |
DRESS | e | ɛ | step, neck, edge, shelf, friend, ready |
commA | ə | ə | catalpa, quota, vodka |
KIT | ɪ | ɪ | ship, sick, bridge, milk, myth, busy |
happY | ɪ | ɪ | copy, scampi, taxi, sortie, committee, hockey, Chelsea |
FLEECE | iː | i | creep, speak, leave, feel, key, people |
STRUT | ʌ | ʌ | cup, suck, budge, pulse, trunk, blood |
FOOT | ʊ | ʊ | put, bush, pull, good, look, wolf |
GOOSE | uː | u | loop, shoot, tomb, mute, huge, view |
PRICE | aɪ | aɪ | ripe, write, arrive, high, try, buy |
MOUTH | aʊ | aʊ | out, house, loud, count, crowd, cow |
FACE | eɪ | eɪ | tape, cake, raid, veil, steak, day |
CHOICE | ɔɪ | ɔɪ | adroit, noise, join, toy, royal |
GOAT | əʊ | o | soap, joke, home, know, so, roll |
START | ɑː | ɑr | far, sharp, bark, carve, farm, heart |
NEAR | ɪə | ɪr | beer, sincere, fear, beard, serum |
SQUARE | ɛə | ɛr | care, fair, pear, where, scarce, vary |
NURSE | ɜː | ɜr | hurt, lurk, urge, burst, jerk, term |
lettER | ə | ər | paper, metre, calendar, stupor, succo(u)r, martyr, figure |
NORTH | ɔː | ɔr | for, war, short, scorch, born, warm |
FORCE | ɔː | or | four, wore, sport, porch, borne, story |
CURE | ʊə | ʊr | poor, tourist, pure, plural, jury |
Dla przykładu, wyraz rod jest wymawiany /rɒd/ w RP, ale /rɑd/ w GenAm. Można go przyporządkować do zbioru leksykalnego LOT. Weary jest wymawiane /ˈwɪərɪ/ w RP, ale /ˈwɪrɪ/ w GenAm, stąd też można ten wyraz przyporządkować do zbioru NEAR.
Niektóre wyrazy nie należą do żadnego ze zbiorów leksykalnych. Dla przykładu, wyraz mock wymawiany /mɒk/ w RP posiada niejednoznaczną wymowę w GenAm; wymowa mock w GenAm waha się między /mɔk/ i /mɑk/, toteż wyraz mock nie może być jednoznacznie przyporządkowany do zbioru leksykalnego.
FLEECE, FACE, GOOSE i GOAT w GenAm wahają się między wymową monoftongową [i, e, u, o] a dyftongową [ɪi, eɪ, ʊu, oʊ]. Wells zdecydował się analizować trzy z nich jako monoftongi dla uproszczenia; jedynie FACE posiada /eɪ/ by uniknąć skojarzenia z DRESS w RP, które posiada /e/.
Zbiór happY posiada taką samą głoskę co zbiór KIT, aczkolwiek jest to analiza bardzo konserwatywna; już w tamtych czasach wymowa happY była bardziej zbliżona do FLEECE (zjawisko określane jako happy tensing, gdyż ostatnia głoska w wyrazie happy przechodzi z nienapiętego [ɪ] (lax) do napiętego [i] (tense)). Współcześnie zjawisko to jest powszechne w obu akcentach i najczęściej samogłoskę w happY transkrybuje się przy użyciu ⟨i⟩.
Model Wellsa dla General American jest bardzo konserwatywny, gdyż nie uwzględniono w nim horse-hoarse (NORTH–FORCE) merger (który był już powszechny w 1982) oraz cot-caught (LOT–THOUGHT) merger (który współcześnie bardzo szybko staje się coraz bardziej powszechny w angielszczyźnie amerykańskiej).
Dobór słów kluczowych
Dobór słów kluczowych Wells uzasadnia następująco:
Słowa kluczowe zostały dobrane w celu jak największej przejrzystości: niezależnie od akcentu języka angielskiego, nie da się ich pomylić z innymi słowami. Chociaż fleece nie jest dość powszechnym słowem, to nie można go pomylić ze słowem z jakąś inną samogłoską; podczas gdy słowo beat miałoby tę wadę, że wymowa może brzmieć jak bait lub bit, w zależności od akcentu.
Gdy jest to możliwe, słowa kończą się na spółgłoskę dentalną lub alweolarną bezdźwięczną.
Analiza współczesna
Oryginalne zestawy zbiorów leksykalnych zdefiniowane przez Wellsa w 1982 są dość użyteczne i przydatne w analizie fonologicznej, nie mniej jednak posiadają parę wad:
- nie uwzględniają niektórych konserwatywnych szkockich i irlandzkich akcentów, w których wyrazy fern, fir i fur wymawiane są z różnymi samogłoskami; w modelu Wellsa, wszystkie te wyrazy należą do zbioru NURSE; stąd też niektórzy lingwiści zajmujący się tymi dialektami dzielą NURSE odpowiednio na zbiory EARTH (fern z /ɛr/), BIRD (fir z /ɪr/) oraz BURN (fur z /ʌr/),
- nie uwzględniają zmian, które zaszły zarówno w RP jak i w GenAm: wyrazy horse i hoarse są homonimami (horse-hoarse (NORTH–FORCE) merger), w odmianie amerykańskiej wyrazy cot i caught również stają się homonimami (cot-caught (LOT–THOUGHT) merger),
- nie uwzględniają tego, że niektórzy autorzy stosują odmienną terminologię dla poszczególnych zbiorów leksykalnych:
- by podkreślić, że w angielszczyźnie amerykańskiej wyrazy z PALM i LOT wymawiane są tak samo, najczęściej mówi się o father-bother merger (rzadziej: PALM–LOT),
- by podkreślić, że w angielszczyźnie amerykańskiej wyrazy z LOT i THOUGHT wymawiane są coraz częściej tak samo, najczęściej mówi się o cot-caught merger (rzadziej: LOT–THOUGHT).
Poniżej zamieszczono tabelę uwzględniającą współczesną dominującą wymowę w akcentach RP i GenAm, wraz z innymi nazwami dla przeróżnych zbiorów leksykalnych, które są równie powszechnie spotykane w literaturze. Jednocześnie nie uwzględniono rozróżnień obecnych w innych dialektach spoza RP i GenAm, jak chociażby horse-hoarse (NORTH–FORCE) czy wspomniane wcześniej fern-fir-fur (EARTH–BIRD–BURN).
Słowo kluczowe | RP | GenAm | Uwagi |
---|---|---|---|
TRAP | a | æ | w GenAm /æ/ podniesione do [ɛə] przed niektórymi spółgłoskami, np. dance [dɛəns], zjawisko zwane /æ/ tensing lub /æ/ raising |
BATH | ɑː | ||
PALM/FATHER | ɑ | w GenAm również [ä] w przypadku braku cot-caught merger | |
LOT/COT/BOTHER | ɒ~ɔ | ||
CLOTH/SOFT | ɑ~ɒ~ɔ | w GenAm warianty [ɒ~ɔ] występują w przypadku braku cot-caught merger | |
THOUGHT/CAUGHT | ɔː~oː | ||
DRESS | ɛ | ɛ | |
commA | ə | ə | |
KIT | ɪ | ɪ | |
happY/citY | i | i | zarówno w RP jak i GenAm powszechna wymowa dyftongiczna [ɪi] |
FLEECE | iː | i | |
STRUT | ɐ~ʌ̞ | ʌ~ɐ | |
FOOT | ʊ~ɵ | ʊ | |
GOOSE | uː~ʉː | u | zarówno w RP jak i GenAm powszechna wymowa dyftongiczna [ʊu~ʊ̈ʉ] |
PRICE | ɑɪ | äɪ | w GenAm /aɪ/ podniesione do [ʌɪ~ɐɪ] przed spółgłoskami bezdźwięcznymi, np. price [pɹʌɪs] (por. prize [pɹäɪz]), zjawisko zwane Canadian raising |
MOUTH | aʊ | æʊ | |
FACE | ɛɪ | eɪ | |
CHOICE/BOY | oɪ | ɔɪ~oɪ | |
GOAT | əʊ~əʉ | o~oʊ | w RP [ɔʊ] przed /l/, np. goal [ɡɔʊɫ] |
START | ɑː | ɑr | |
NEAR | ɪː~ɪə | ɪr~ir | |
SQUARE | ɛː~ɛə | ɛr | |
NURSE | əː | ɚ | |
lettER | ə | ||
NORTH/HORSE | oː | ɔr~or | |
CURE/TOUR | ʊr~ɔr |
Użycie
Zbiory leksykalne są także używane w analizie wymowy pozostałych języków, takich jak język francuski, irlandzki czy scots.