Nowe modele gpt2!

Dzisiaj udostępniliśmy dwa modele gpt2 trenowane od podstaw. Jeden w architekturze small, drugi w medium. Modele oczywiście dostępne są publicznie na naszym huggingface 😉

Poniżej po dwa zrzuty ekranu z procesu uczenia (miara accuracy) upublicznionych modeli.

Accuracy modelu w architekturze small:

Accuracy modelu w architekturze medium:

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *