Zbiór leksykalny (ang. lexical set) to zbiór słów tworzących jedną kategorię na podstawie jednej wspólnej cechy fonologicznej.

Zbiór leksykalny najczęściej określany jest za pomocą określonego słowa kluczowego (ang. keyword) które pozwala zidentyfikować określoną cechę fonologiczną. Dla przykładu, w języku polskim można wyróżnić zbiór leksykalny KĄT, do którego należą wszystkie wyrazy posiadające fonem /ɔ̃/ przed spółgłoskami plozywnymi koronalnymi, np. kąt, oglądać, błąd, piąty. Innym zbiorem leksykalnym może być zbiór KRĘT, do którego należą wszystkie wyrazy posiadające w takim samym otoczeniu fonem /ɛ̃/: kręt, pęd, dęty. Wyrazy KĄT i KRĘT to słowa kluczowe, które identyfikują dane zbiory. Słowa kluczowe zazwyczaj dobiera się tak, by jednoznacznie wskazywały rozpatrywaną cechę fonologiczną.

Zbiory leksykalne często służą do definiowania tzw. mergerów i splitów – gdy dwa fonemy zapadają się w jeden, tworząc homonimy (wyrazy wymawiane tak samo) (np. cot-caught merger) lub gdy jeden fonem w efekcie rozdziela się na dwa, dystynktywne fonemy (np. foot-strut split).

Język angielski

W analizie dialektów języka angielskiego powszechnie używa się zbiorów leksykalnych, gdyż w sposób intuicyjny opisują cechy fonetyczne danego dialektu/akcentu.

Najbardziej popularną klasyfikacją są Standard Lexical Sets for English wprowadzone przez Johna C. Wellsa w Accents of English (1982). Wells definiuje tam zbiory leksykalne na podstawie wymowy słów w dwóch akcentach, RP i GenAm:

  • "RP" odnosi się do Received Pronunciation.
  • "GenAm" odnosi się do jednego z odmian General American, czyli geograficznie "neutralnego" akcentu używanego w Stanach Zjednoczonych. Jest to jednak wariant bardzo konserwatywny (nawet jak na rok 1982), gdyż w tej analizie słowa horse i hoarse nie są homonimami.

Wells klasyfikuje słowa w języku angielskim do 24 zbiorów leksykalnych na podstawie wymowy samogłoski akcentowanej w obu akcentach. Każdy ze zbiorów leksykalnych ma określone słowo kluczowe reprezentujące ten zbiór, zapisane przy użyciu kapitalików. Wells ponadto wyróżnia trzy zbiory opisujące wymowę samogłosek nieakcentowanych w wygłosie wyrazu (konkretnie są to zbiory happY, lettER oraz commA).

Słowo kluczowe RP GenAm Przykłady
TRAP æ æ tap, back, badge, scalp, hand, cancel
BATH ɑː æ staff, brass, ask, dance, sample, calf
PALM ɑː ɑ psalm, father, bra, spa, lager
LOT ɒ ɑ stop, sock, dodge, romp, possible, quality
CLOTH ɒ ɔ cough, broth, cross, long, Boston
THOUGHT ɔː ɔ taught, sauce, hawk, jaw, broad
DRESS e ɛ step, neck, edge, shelf, friend, ready
commA ə ə catalpa, quota, vodka
KIT ɪ ɪ ship, sick, bridge, milk, myth, busy
happY ɪ ɪ copy, scampi, taxi, sortie, committee, hockey, Chelsea
FLEECE i creep, speak, leave, feel, key, people
STRUT ʌ ʌ cup, suck, budge, pulse, trunk, blood
FOOT ʊ ʊ put, bush, pull, good, look, wolf
GOOSE u loop, shoot, tomb, mute, huge, view
PRICE ripe, write, arrive, high, try, buy
MOUTH out, house, loud, count, crowd, cow
FACE tape, cake, raid, veil, steak, day
CHOICE ɔɪ ɔɪ adroit, noise, join, toy, royal
GOAT əʊ o soap, joke, home, know, so, roll
START ɑː ɑr far, sharp, bark, carve, farm, heart
NEAR ɪə ɪr beer, sincere, fear, beard, serum
SQUARE ɛə ɛr care, fair, pear, where, scarce, vary
NURSE ɜː ɜr hurt, lurk, urge, burst, jerk, term
lettER ə ər paper, metre, calendar, stupor, succo(u)r, martyr, figure
NORTH ɔː ɔr for, war, short, scorch, born, warm
FORCE ɔː or four, wore, sport, porch, borne, story
CURE ʊə ʊr poor, tourist, pure, plural, jury

Dla przykładu, wyraz rod jest wymawiany /rɒd/ w RP, ale /rɑd/ w GenAm. Można go przyporządkować do zbioru leksykalnego LOT. Weary jest wymawiane /ˈwɪərɪ/ w RP, ale /ˈwɪrɪ/ w GenAm, stąd też można ten wyraz przyporządkować do zbioru NEAR.

Niektóre wyrazy nie należą do żadnego ze zbiorów leksykalnych. Dla przykładu, wyraz mock wymawiany /mɒk/ w RP posiada niejednoznaczną wymowę w GenAm; wymowa mock w GenAm waha się między /mɔk/ i /mɑk/, toteż wyraz mock nie może być jednoznacznie przyporządkowany do zbioru leksykalnego.

FLEECE, FACE, GOOSE i GOAT w GenAm wahają się między wymową monoftongową [i, e, u, o] a dyftongową [ɪi, eɪ, ʊu, oʊ]. Wells zdecydował się analizować trzy z nich jako monoftongi dla uproszczenia; jedynie FACE posiada /eɪ/ by uniknąć skojarzenia z DRESS w RP, które posiada /e/.

Zbiór happY posiada taką samą głoskę co zbiór KIT, aczkolwiek jest to analiza bardzo konserwatywna; już w tamtych czasach wymowa happY była bardziej zbliżona do FLEECE (zjawisko określane jako happy tensing, gdyż ostatnia głoska w wyrazie happy przechodzi z nienapiętego [ɪ] (lax) do napiętego [i] (tense)). Współcześnie zjawisko to jest powszechne w obu akcentach i najczęściej samogłoskę w happY transkrybuje się przy użyciu ⟨i⟩.

Model Wellsa dla General American jest bardzo konserwatywny, gdyż nie uwzględniono w nim horse-hoarse (NORTHFORCE) merger (który był już powszechny w 1982) oraz cot-caught (LOTTHOUGHT) merger (który współcześnie bardzo szybko staje się coraz bardziej powszechny w angielszczyźnie amerykańskiej).

Dobór słów kluczowych

Dobór słów kluczowych Wells uzasadnia następująco:

Słowa kluczowe zostały dobrane w celu jak największej przejrzystości: niezależnie od akcentu języka angielskiego, nie da się ich pomylić z innymi słowami. Chociaż fleece nie jest dość powszechnym słowem, to nie można go pomylić ze słowem z jakąś inną samogłoską; podczas gdy słowo beat miałoby tę wadę, że wymowa może brzmieć jak bait lub bit, w zależności od akcentu.

Gdy jest to możliwe, słowa kończą się na spółgłoskę dentalną lub alweolarną bezdźwięczną.

Analiza współczesna

Oryginalne zestawy zbiorów leksykalnych zdefiniowane przez Wellsa w 1982 są dość użyteczne i przydatne w analizie fonologicznej, nie mniej jednak posiadają parę wad:

  • nie uwzględniają niektórych konserwatywnych szkockich i irlandzkich akcentów, w których wyrazy fern, fir i fur wymawiane są z różnymi samogłoskami; w modelu Wellsa, wszystkie te wyrazy należą do zbioru NURSE; stąd też niektórzy lingwiści zajmujący się tymi dialektami dzielą NURSE odpowiednio na zbiory EARTH (fern z /ɛr/), BIRD (fir z /ɪr/) oraz BURN (fur z /ʌr/),
  • nie uwzględniają zmian, które zaszły zarówno w RP jak i w GenAm: wyrazy horse i hoarse są homonimami (horse-hoarse (NORTHFORCE) merger), w odmianie amerykańskiej wyrazy cot i caught również stają się homonimami (cot-caught (LOTTHOUGHT) merger),
  • nie uwzględniają tego, że niektórzy autorzy stosują odmienną terminologię dla poszczególnych zbiorów leksykalnych:
    • by podkreślić, że w angielszczyźnie amerykańskiej wyrazy z PALM i LOT wymawiane są tak samo, najczęściej mówi się o father-bother merger (rzadziej: PALMLOT),
    • by podkreślić, że w angielszczyźnie amerykańskiej wyrazy z LOT i THOUGHT wymawiane są coraz częściej tak samo, najczęściej mówi się o cot-caught merger (rzadziej: LOTTHOUGHT).

Poniżej zamieszczono tabelę uwzględniającą współczesną dominującą wymowę w akcentach RP i GenAm, wraz z innymi nazwami dla przeróżnych zbiorów leksykalnych, które są równie powszechnie spotykane w literaturze. Jednocześnie nie uwzględniono rozróżnień obecnych w innych dialektach spoza RP i GenAm, jak chociażby horse-hoarse (NORTHFORCE) czy wspomniane wcześniej fern-fir-fur (EARTHBIRDBURN).

Słowo kluczowe RP GenAm Uwagi
TRAP a æ w GenAm /æ/ podniesione do [ɛə] przed niektórymi spółgłoskami,
np. dance [dɛəns], zjawisko zwane /æ/ tensing lub /æ/ raising
BATH ɑː
PALM/FATHER ɑ w GenAm również [ä] w przypadku braku cot-caught merger
LOT/COT/BOTHER ɒ~ɔ
CLOTH/SOFT ɑ~ɒ~ɔ w GenAm warianty [ɒ~ɔ] występują w przypadku braku cot-caught merger
THOUGHT/CAUGHT ɔː~oː
DRESS ɛ ɛ
commA ə ə
KIT ɪ ɪ
happY/citY i i zarówno w RP jak i GenAm powszechna wymowa dyftongiczna [ɪi]
FLEECE i
STRUT ɐ~ʌ̞ ʌ~ɐ
FOOT ʊ~ɵ ʊ
GOOSE uː~ʉː u zarówno w RP jak i GenAm powszechna wymowa dyftongiczna [ʊu~ʊ̈ʉ]
PRICE ɑɪ äɪ w GenAm /aɪ/ podniesione do [ʌɪ~ɐɪ] przed spółgłoskami bezdźwięcznymi,
np. price [pɹʌɪs] (por. prize [pɹäɪz]), zjawisko zwane Canadian raising
MOUTH æʊ
FACE ɛɪ
CHOICE/BOY ɔɪ~oɪ
GOAT əʊ~əʉ o~oʊ w RP [ɔʊ] przed /l/, np. goal [ɡɔʊɫ]
START ɑː ɑr
NEAR ɪː~ɪə ɪr~ir
SQUARE ɛː~ɛə ɛr
NURSE əː ɚ
lettER ə
NORTH/HORSE ɔr~or
CURE/TOUR ʊr~ɔr

Użycie

Zbiory leksykalne są także używane w analizie wymowy pozostałych języków, takich jak język francuski, irlandzki czy scots.