Badania

Katedra Lingwistyki Komputerowej prowadzi badania nad automatyczną analizą tekstu polskiego, kładąc główny nacisk na analizę słownictwa i budowę słowników komputerowych. Badania zespołowe skupiają się na trzech obszarach.

Słownik fleksyjny języka polskiego (SFJP). Podstawowym narzędziem przetwarzania tekstu jest słownik fleksyjny , tj. program sprowadzający formę tekstową wyrazu, np. psa do postaci hasłowej pies i przypisujący wyrazowi charakterystykę gramatyczną, czyli rzeczownik męski żywotny.

Słownik semantyczny języka polskiego (SSJP). Zidentyfikowany za pomocą słownika fleksyjnego wyraz może uzyskać interpretację semantyczną, gdy odwołamy się do przechowywanego w słowniku semantycznym relacyjnego opisu znaczenia, gdzie relacje określają łączliwość definiowanego znaczenia z innym znaczeniami, np. paradygmatyczne ‘podrzędnik – nadrzędnik’ pies – zwierzę i syntagmatyczne, np ‘działanie’ pies – szczekać, merdać.

Eksperymentalna sieć leksyklana języka polskiego (SLJP). Algorytm przetwarzający strukturę semantyczną tekstu może takkże użyć wiedzy o naturalnych powiązaniach pomiędzy wyrazami, że np. krzesło jest jest w ludzkiej pamięci silnie powiązane ze stołem, co pozwala wnioskować, że krzesło obecne w strukturze semantycznej zdania także wtedy, gdy nie ma reprezentacji leksykalnej, np. goście siedzieli przy stole. Wiedza o naturalnych powiązaniach jest przechowywana w eksperymentalnej sieci leksykalnej.

Zakład Lingwistyki Komputerowej

Zakład Lingwistyki Komputerowej

Widok zawartości stron Widok zawartości stron

Zakład Lingwistyki Komputerowej

Nawigacja Nawigacja

Zakład

Widok zawartości stron Widok zawartości stron

Badania