Wstęp

W artykule opisałem koncepcję podejścia do modelowania fragmentu tekstu za pomocą grafów. Metoda wykorzystuje wiele mniejszych aspektów, które są zależne od języka. Proponowana metoda jest niezależna od języka, jednak jej implementacja została dostosowana do narzędzi dla języka polskiego. Opisana metoda jest autorską metodą modelowania tekstu, wraz z przykładowym wykorzystaniem jej do zadania rozpoznawania relacji semantycznych między fragmentami tekstów w języku polskim (spokojnie, wszystko się wyjaśni…)

Początki, praca doktorska

W swojej pracy doktorskiej pt. Metoda pogłębianej analizy semantycznej w zadaniu wykrywania relacji semantycznych między fragmentami tekstu w języku polskim opisałem autorską metodę PAS oraz jej zastosowaniem do problemu wykrywania relacji CST, jako problemu klasyfikacji n-arnej. Krótko spojlerując:

  • w moim przypadku klasyfikacja n-arna oznacza, że dla danej, uporządkowanej pary zdań (S1, S2), dla której rozpoznawana jest relacja, klasyfikator stwierdza jaka relacja zachodzi między S1, a S2. Dodatkowo w celu wykrycia braku relacji, wprowadzona została dodatkowa klasa Brak_relacji, której wykrycie oznacza, że między S1,a S2 nie zachodzi żadna relacja z modelu CST.
  • wykorzystałem istniejące metody uczenia maszynowego, np. LMT (ang. Logistic Model Tree), SVM (ang. Supported Vector Machines), J48 (implementacja drzewa decyzyjnego uczonego metodą C4.5 w wece),
  • zbiorem uczącym były cechy powstałe w wyniku porównywania ze sobą grafów reprezentujących zdania, między którymi zachodziła (lub nie) dana relacja semantyczna
  • Zapraszam do zapoznania się z tekstem. przed zanurzeniem w lekturę, w tym miejscu chciałbym podziękować mojej promotorce, Pani dr hab. inż. Urszula Markowska-Kaczmar, prof. nadzw, bez której ten tekst byłby nieposkładaną plątaniną myśli, którą dzięki Pani Urszuli udało się uporządkować do postaci pracy doktorskiej.

Idea metody PAS

Na rysunkach poniżej, przedstawiłem ogólny oraz szczegółowy schemat działania metody (przesuwaj suwakiem lewo-prawo, aby zobaczyć ogólna oraz szczegółową wizję metody).

Rys.1 Ogólny oraz szczegółowy potok przetwarzania w metodzie PAS.