W pracy doktorskiej pt. Metoda pogłębianej analizy semantycznej w zadaniu wykrywania relacji semantycznych między fragmentami tekstu w języku polskim opisana została autorska metodA PAS oraz jej zastosowanie do problemu wykrywania relacji CST, jako problemu klasyfikacji n-arnej. Krótko spojlerując:
- klasyfikacja n-arna oznacza, że dla danej, uporządkowanej pary zdań (S1, S2), dla której rozpoznawana jest relacja, klasyfikator stwierdza jaka relacja zachodzi między S1, a S2. Dodatkowo w celu wykrycia braku relacji, wprowadzona została dodatkowa klasa Brak_relacji, której wykrycie oznacza, że między S1,a S2 nie zachodzi żadna relacja z modelu CST;
- wykorzystanie istniejącej metody uczenia maszynowego, np. LMT (ang. Logistic Model Tree), SVM (ang. Supported Vector Machines), J48 (implementacja drzewa decyzyjnego uczonego metodą C4.5 w wece) i aplikacja do niej wektorów PAS;
- zbiorem uczącym były cechy powstałe w wyniku porównywania ze sobą grafów reprezentujących zdania, między którymi zachodziła (lub nie) dana relacja semantyczna – na takich cechach uczone były klasyfikatory (wektory PAS);
Zapraszamy do zapoznania się z tekstem, jednak przed zanurzeniem w lekturę, na początku kącik podziękowań 🙂
W tym miejscu chcielibyśmy podziękować:
- Pani dr hab. inż. Urszuli Markowskiej-Kaczmar, prof. nadzw, bez której ten tekst byłby nieposkładaną plątaniną myśli, którą dzięki Pani Urszuli udało się uporządkować do postaci niniejszej pracy doktorskiej;
- Panu dr hab. inż. Maciejowi Piaseckiemu, prof. PWr, bez którego również podłoże praktyczne pracy nie mogłoby powstać, u którego w grupie G4.19 na przełomie wielu projektów naukowych powstawały poszczególne elementy pracy;