Dzisiaj udostępniliśmy dwa modele gpt2 trenowane od podstaw. Jeden w architekturze small, drugi w medium. Modele oczywiście dostępne są publicznie na naszym huggingface 😉
- model w architekturze small: radlab/polish-gpt2-small-v2
- model w architekturze medium: radlab/polish-gpt2-medium-v2
Poniżej po dwa zrzuty ekranu z procesu uczenia (miara accuracy) upublicznionych modeli.
Accuracy modelu w architekturze small:
Accuracy modelu w architekturze medium: