Fasttext
Informacje wstępne
Do pobrania z: https://fasttext.cc/
Samouczek (reprezentacja słów): https://fasttext.cc/docs/en/unsupervised-tutorial.html
Format wejściowy
Wejściem jest plik tekstowy, w którym kolejne wiersze reprezentują kolejne teksty, zdania, frazy. Przykładowo:
awokado przekrawać na pół usuwać pestka i wydrążać miąższ dziś niemiecki i musieć zaliczyć gra rozpoczynać jeden z gracz ciągnąć karta z stos karta zakryć lub z stos odkryty
Przykładowe wywołanie
./fasttext skipgram -minCount 5 \ -lr 0.05 -ws 5 -epoch 10 \ -input input-corpora-file.txt \ -output output-corpora-file-model