Commit
·
32a6080
1
Parent(s):
58f95f6
Updated the readme
Browse files
README.md
CHANGED
|
@@ -108,8 +108,8 @@ DalaT5 екі өте маңызды деректер жиынын пайдала
|
|
| 108 |
Деректер жиынының жалпы өлшемін ескере отырып, олар осы үлгінің репозиторийіне қосылмаған. Дегенмен, DalaT5-ті өзіңіз дәл баптағыңыз келсе, келесі әрекеттерді орындаңыз / Given the total size of the datasets, they haven't been included in this model's repository. However, should you wish to fine-tune DalaT5 yourself, please do the following:
|
| 109 |
|
| 110 |
1. `get_data.sh` қабық сценарий файлын «src/data» қалтасында іске қосыңыз / Run the `get_data.sh` shell script file in the "src/data" folder
|
| 111 |
-
2. Сол қалтадағы
|
| 112 |
-
3. Қазақ корпус файлын тазалау үшін
|
| 113 |
|
| 114 |
---
|
| 115 |
|
|
|
|
| 108 |
Деректер жиынының жалпы өлшемін ескере отырып, олар осы үлгінің репозиторийіне қосылмаған. Дегенмен, DalaT5-ті өзіңіз дәл баптағыңыз келсе, келесі әрекеттерді орындаңыз / Given the total size of the datasets, they haven't been included in this model's repository. However, should you wish to fine-tune DalaT5 yourself, please do the following:
|
| 109 |
|
| 110 |
1. `get_data.sh` қабық сценарий файлын «src/data» қалтасында іске қосыңыз / Run the `get_data.sh` shell script file in the "src/data" folder
|
| 111 |
+
2. Сол қалтадағы `generate_cyr_lat_pairs.py` файлын іске қосыңыз / Run the `generate_cyr_lat_pairs.py` file in the same folder
|
| 112 |
+
3. Қазақ корпус файлын тазалау үшін `generate_clean_corpus.sh` іске қосыңыз / Run `generate_clean_corpus.sh` to clean the Kazakh corpus file
|
| 113 |
|
| 114 |
---
|
| 115 |
|