Pomiar bliskości słów w przestrzeni semantycznej

Metoda

Reprezentacje wektorowe par synonimów i par form wariantowych zostaną utworzone w przestrzeni COALS zbudowanej na bazie Narodowego Korpusu Języka Polskiego. Otoczenie semantyczne każdego elementu pary zostanie zbadane, opisane i porównane z otoczeniem semantycznym drugiego elementu pary. Wnioski dotyczące różnic między elementami par zestawimy z wynikami uzyskanymi w badaniach językoznawczych i psycholingwistycznych.

Następnie zostaną obliczone odległości między elementami par synonimicznych i między wariantami. W modelu COALS odległości semantyczne odpowiadają korelacjom między wektorami. Ta niezależna miara odległości zostanie porównana z wielkością różnic w konotacjach uzyskanych w badaniach językoznawczych i badaniach psycholingwistycznych wykorzystujących dyferencjał semantyczny Osgooda.

Jeśli czas i środki pozwolą, skonstruujemy korpusy dla różnych okresów, by zbadać przebieg trajektorii poszczególnych słów w przestrzeni semantycznej w czasie. Taka analiza może być źródłem hipotez dotyczących innego rozwoju zapożyczeń, które zachowały oryginalna pisownię, niż tych, które zostały zasymilowane, oraz hipotez dotyczących semantycznego oddalania się terminów początkowo uznawanych za synonimiczne.