Katedra Lingwistyki Komputerowej prowadzi badania nad automatyczną analizą tekstu polskiego, kładąc główny nacisk na analizę słownictwa i budowę słowników komputerowych. Badania zespołowe skupiają się na trzech obszarach.
Słownik fleksyjny języka polskiego (SFJP). Podstawowym narzędziem przetwarzania tekstu jest słownik fleksyjny , tj. program sprowadzający formę tekstową wyrazu, np. psa do postaci hasłowej pies i przypisujący wyrazowi charakterystykę gramatyczną, czyli rzeczownik męski żywotny.
Słownik semantyczny języka polskiego (SSJP). Zidentyfikowany za pomocą słownika fleksyjnego wyraz może uzyskać interpretację semantyczną, gdy odwołamy się do przechowywanego w słowniku semantycznym relacyjnego opisu znaczenia, gdzie relacje określają łączliwość definiowanego znaczenia z innym znaczeniami, np. paradygmatyczne ‘podrzędnik – nadrzędnik’ pies – zwierzę i syntagmatyczne, np ‘działanie’ pies – szczekać, merdać.
Eksperymentalna sieć leksyklana języka polskiego (SLJP). Algorytm przetwarzający strukturę semantyczną tekstu może takkże użyć wiedzy o naturalnych powiązaniach pomiędzy wyrazami, że np. krzesło jest jest w ludzkiej pamięci silnie powiązane ze stołem, co pozwala wnioskować, że krzesło obecne w strukturze semantycznej zdania także wtedy, gdy nie ma reprezentacji leksykalnej, np. goście siedzieli przy stole. Wiedza o naturalnych powiązaniach jest przechowywana w eksperymentalnej sieci leksykalnej.