Autor: Robert Wołosz
ISBN: 83-60434-02-6
Ilość stron: 152
Data wydania: 2005
Niniejsza książka jest adresowana do informatyków i lingwistów. Jej autor, pracownik uniwersytetu w Peczu na Węgrzech, jest lingwistą współpracującym od lat z informatyczną firmą Morphologic.
Rola analizy i syntezy morfologicznej w systemach przetwarzania tekstów polskich jest trudna do przecenienia. Choć wyniki analizy często nie są wykorzystywane bezpośrednio, stanowi ona nieodzowny etap wstępny dla dalszych operacji na tekście. Podobnie w przypadku syntezy - jest ona pożyteczna co najmniej jako weryfikacja opisu morfologicznego. Analiza i synteza leżą również u podstaw skutecznych korektorów ortograficznych (spelling checkers).
Złożoność polskiej morfologii i będący jej skutkiem brak analizatorów morfologicznych przez długi czas istotnie utrudniał prace w zakresie inżynierii lingwistycznej języka polskiego. Przełom nastąpił dopiero około 10 lat temu, kiedy niemal równocześnie anonsowano kilka takich analizatorów. O niektórych z nich do dzisiaj niewiele wiadomo.
O ile jest oczywiste, że budowa produktów komercyjnych została uznana za tajemnicę firmową, to trzeba z żalem stwierdzić, że do ujawnienia zastosowanych metod nie kwapiły się również niektóre ośrodki akademickie. Pomimo więc upływu czasu wiedza na temat metodologii tworzenia tego typu programów jest w środowiskach naukowych nadal bardzo skąpa i trudno dostępna.
W tej sytuacji zawarta w książce szczegółowa analiza przypadku (case study) projektowania komercyjnego systemu łączącego funkcje analizatora, syntetyzatora i korektora ma bardzo dużą wartość teoretyczną i praktyczną.
Rozdziały:
1. Wprowadzenie 1.1. Cel pracy 1.2. Pojęcie analizy i syntezy morfologicznej. Podstawy notacji 1.3. Materiał empiryczny
2. Przedmiot i metoda badań 2.1. Przedmiot badań 2.2. Metoda i podstawowe pojęcia 2.3. Sposób prezentacji materiału
3. Wypadki szczególne 3.1. Wyrazy nieodmienne 3.2. Wyrazy złożone i formacje prefiksalne 3.3. Formy postfiksalne i aglutynacyjne
4. Czasowniki 4.1. Granice czasownika 4.2. Zasób form leksemów czasownikowych 4.3. Prezentacja termów czasownikowych 4.4. Matryca czasownikowa łączliwości (fragment)
5. Rzeczowniki 5.1. Zasób form leksemów rzeczownikowych 5.2. Podział rzeczowników 5.3. Przykładowy opis rzeczowników - rzeczowniki męskie 5.4. Matryca nieczasownikowa łączliwości (fragment)
6. Przymiotniki 6.1. Rygorystyczny opis polskiej deklinacji przymiotnikowej 6.2. Zasób form leksemów przymiotnikowych 6.3. Wzory odmiany przymiotników (z uwzględnieniem alternacji)
7. Uwagi o pracy nad zakresem słownika (na przykładzie wyrazów dawnych) 7.1. Cel badań 7.2. Zasady badania 7.3. Analiza zebranego materiału 7.4. Wnioski
8. Synteza morfologiczna
9. Automatyczny podział wyrazów
10. Podsumowanie
11. Skróty i bibliografia 11.1. Skróty gramatyczne 11.2. Źródła słownikowe 11.3. Bibliografia (oprócz słowników)
Dodatek A. Przykładowa analiza morfologiczna słów tekstowych A.1. Tekst analizowany A.2. Lista frekwencyjna wyrazów nierozpoznanych A.3. Analiza morfologiczna wyrazów, które pojawiły się w analizowanym tekście A.4. Lista wyrazów wraz z zaznaczonymi miejscami podziału
Efektywna metoda analizy i syntezy morfologicznej w języku polskim --- Pozycja niedostępna.---
|