Commit
·
0371387
1
Parent(s):
6b8b15a
Fixed an erroneous Kazakh section
Browse files
README.md
CHANGED
|
@@ -132,7 +132,7 @@ KazParC деректер жинағын жүктеп алу үшін сізге
|
|
| 132 |
|
| 133 |
- **DalaT5 v4**: 23 сәуірде нақтыланған, 23 сәуірде қолжетімді болды. Жаттығу үшін ~1,9 миллион жазба (Wikipedia dump + CC100 + KazParC) пайдаланылды. Семантикалық түсініктің жоғарылауын көрсететін төртінші итерация / Fine-tuned on April 23, made available on April 23. Used ~1.9 million records (Wikipedia dump + CC100 + KazParC) for training. Fourth iteration that showed increased semantic understanding
|
| 134 |
|
| 135 |
-
- **DalaT5 v5**:
|
| 136 |
|
| 137 |
---
|
| 138 |
|
|
|
|
| 132 |
|
| 133 |
- **DalaT5 v4**: 23 сәуірде нақтыланған, 23 сәуірде қолжетімді болды. Жаттығу үшін ~1,9 миллион жазба (Wikipedia dump + CC100 + KazParC) пайдаланылды. Семантикалық түсініктің жоғарылауын көрсететін төртінші итерация / Fine-tuned on April 23, made available on April 23. Used ~1.9 million records (Wikipedia dump + CC100 + KazParC) for training. Fourth iteration that showed increased semantic understanding
|
| 134 |
|
| 135 |
+
- **DalaT5 v5**: Нақты баптау 25 сәуірде өтеді және сол күні шығады. ~1,9 миллион жазбаны (v4 сияқты) пайдалануға және қазақ кириллица және латын графикасын жақсырақ өңдеу үшін жеке таңбалауышқа ие болуға орнату / Fine-tuning will take place on April 25 and will be released on the same day. Set to use ~1.9 million records (like v4) and have its own tokeniser to better handle the Kazakh Cyrillic and Latin scripts
|
| 136 |
|
| 137 |
---
|
| 138 |
|