Модель для классификации вакансий была создана на основе предобученной архитектуры BERT путем дообучения (fine-tuning) на специально размеченном датасете.
Датасет для обучения содержал 1000 текстов вакансий, сбалансированных по двум классам:
500 примеров — релевантные вакансии для IT-сферы.
500 примеров — нерелевантные вакансии, не относящиеся к сфере информационных технологий.
В результате модель научилась эффективно различать и категоризировать тексты вакансий на соответствующие IT и все прочие.
Model Trained Using AutoTrain
- Problem type: Text Classification
Validation Metrics
loss: 0.3812274634838104
f1: 0.8502415458937198
precision: 0.822429906542056
recall: 0.88
auc: 0.9464999999999999
accuracy: 0.845
- Downloads last month
- 26
Model tree for MrAlexGov/is-it-job-ru-q1a8e-lkjvk
Base model
google-bert/bert-base-uncased