Měření blízkosti slov v sémantickém prostoru

Metoda

Vektorové reprezentace synonymických dvojic a dvojic variantních forem budou vytvořené v prostoru COALS vybudovaném na bázi Národního korpusu polského jazyka. Sémantické okolí každého elementu dvojice bude prozkoumáno, popsáno a porovnáno se sémantickým okolím druhého elementu dvojice. Závěry týkající se rozdílů mezi elementy dvojic budou srovnány s výsledky získanými v jazykovědných a psycholingvistických studiích.

Následně budou vypočítány vzdálenosti mezi elementy synonymických dvojic a mezi variantami. U modelu COALS sémantické vzdálenosti odpovídají korelacím mezi vektory. Tato nezávislá míra vzdálenosti bude porovnána s velikostí rozdílů v konotacích získaných v jazykovědných a psycholingvistických studiích využívajících Osgoodův sémantický diferenciál.

Pokud to čas a prostředky umožní, vytvoříme korpusy pro různá období, abychom prozkoumali průběh trajektorie jednotlivých slov v sémantickém prostředí v čase. Taková analýza může být zdrojem hypotéz týkajících se jiného rozvoje přejatých slov, která si zachovala originální pravopis, než těch, která byla asimilována, a hypotéz týkajících se sémantického vzdalování termínů zpočátku považovaných za synonymické.