Nowe modele gpt2!

Opublikowano 2023-11-30 przez radlab

Dzisiaj udostępniliśmy dwa modele gpt2 trenowane od podstaw. Jeden w architekturze small, drugi w medium. Modele oczywiście dostępne są publicznie na naszym huggingface 😉

model w architekturze small: radlab/polish-gpt2-small-v2
model w architekturze medium: radlab/polish-gpt2-medium-v2

Poniżej po dwa zrzuty ekranu z procesu uczenia (miara accuracy) upublicznionych modeli.

Accuracy modelu w architekturze small:

Accuracy modelu w architekturze medium:

Dodaj komentarz Anuluj pisanie odpowiedzi