Метрики

#3
by Tikhonum - opened

А че сравнение то будет с нормальными моделями современными? А то выглядит смешно. Или стыдно выкладывать?

это дипсик файнтюненый, так что бенчи будут нормальные

Модель вроде как обучалась с нуля, просто на архитектуре дипсика. Взять архитектуру и взять архитектуру и веса (как у яндекса например) это сильно разные вещи.

Хотя вряд ли с таким размером она дообучена нормально. Хочется почитать статью на Хабре, которой пока нет.

ai-sage org

Статья на хабре уже есть!
Учили с нуля

https://habr.com/en/companies/sberdevices/articles/968904/

Модель пока что не закончила свое обучение, поэтому и называется Preview

Sign up or log in to comment