Przejdź do głównej treści

Widok zawartości stron Widok zawartości stron

Zakład Lingwistyki Komputerowej

Nawigacja okruszkowa Nawigacja okruszkowa

Widok zawartości stron Widok zawartości stron

Badania

Katedra Lingwistyki Komputerowej prowadzi badania nad automatyczną analizą tekstu polskiego, kładąc główny nacisk na analizę słownictwa i budowę słowników komputerowych. Badania zespołowe skupiają się na trzech obszarach.

Słownik fleksyjny języka polskiego (SFJP). Podstawowym narzędziem przetwarzania tekstu jest słownik fleksyjny , tj. program sprowadzający formę tekstową wyrazu, np. psa do postaci hasłowej pies i przypisujący wyrazowi charakterystykę gramatyczną, czyli rzeczownik męski żywotny.

Słownik semantyczny języka polskiego (SSJP). Zidentyfikowany za pomocą słownika fleksyjnego wyraz może uzyskać interpretację semantyczną, gdy odwołamy się do przechowywanego w słowniku semantycznym relacyjnego opisu znaczenia, gdzie relacje określają łączliwość definiowanego znaczenia z innym znaczeniami, np. paradygmatyczne  ‘podrzędnik – nadrzędnik’  pies – zwierzę i syntagmatyczne, np ‘działanie’   pies – szczekać, merdać.

Eksperymentalna sieć leksyklana języka polskiego (SLJP). Algorytm przetwarzający strukturę semantyczną tekstu może takkże użyć wiedzy o naturalnych powiązaniach pomiędzy wyrazami, że np. krzesło jest jest w ludzkiej pamięci silnie powiązane ze stołem, co pozwala wnioskować, że krzesło  obecne w strukturze semantycznej zdania także wtedy, gdy nie ma reprezentacji leksykalnej, np. goście siedzieli przy stole. Wiedza o naturalnych powiązaniach jest przechowywana w eksperymentalnej sieci leksykalnej.