Training in progress, epoch 1

Browse files

Files changed (5) hide show

model-00001-of-00004.safetensors +1 -1
model-00002-of-00004.safetensors +1 -1
model-00003-of-00004.safetensors +1 -1
model-00004-of-00004.safetensors +1 -1
trainer_log.jsonl +45 -0

model-00001-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f815f1b37c9df64ddb15ca678fa6daa9fbafecf980d429a1c7606af5ed0434be
 size 4903351912

 version https://git-lfs.github.com/spec/v1
+oid sha256:b921ae986d40c57377351ab0759cd728f44691d226e2beffd2ea996055ff3af0
 size 4903351912

model-00002-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8937331a2e86d20eeb33352c3f7a5e6ba1d317f649ff008160e673e8041bd3e8
 size 4947570872

 version https://git-lfs.github.com/spec/v1
+oid sha256:e25ac706ebd7934760853351d456ed3f9ba96ff18515c244e7daff06204d40e5
 size 4947570872

model-00003-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bf882095df62c0e0d93a08bd6116bb5533f7159f419616012ded3411d51b82ac
 size 4962221464

 version https://git-lfs.github.com/spec/v1
+oid sha256:e2f83ee63677e5e544bd1c60faba7df6c87eaea3bab6f9e93daebfe1c0d68dfb
 size 4962221464

model-00004-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78e06ca3e36c7fe1e2c47a55cd9899ec9e0d2d618f20c9391582c1393109e490
 size 3670322200

 version https://git-lfs.github.com/spec/v1
+oid sha256:443e48154fadd0f4740f7db341cb8993d9835db9f6c54a8fde3f9ac271c2abc2
 size 3670322200

trainer_log.jsonl CHANGED Viewed

@@ -43,3 +43,48 @@
 {"current_steps": 430, "total_steps": 1329, "loss": 0.5886, "learning_rate": 5e-06, "epoch": 0.9703808180535967, "percentage": 32.36, "elapsed_time": "10:36:25", "remaining_time": "22:10:34"}
 {"current_steps": 440, "total_steps": 1329, "loss": 0.5934, "learning_rate": 5e-06, "epoch": 0.9929478138222849, "percentage": 33.11, "elapsed_time": "10:51:13", "remaining_time": "21:55:45"}
 {"current_steps": 443, "total_steps": 1329, "eval_loss": 0.5912777781486511, "epoch": 0.9997179125528914, "percentage": 33.33, "elapsed_time": "11:07:19", "remaining_time": "22:14:38"}

 {"current_steps": 430, "total_steps": 1329, "loss": 0.5886, "learning_rate": 5e-06, "epoch": 0.9703808180535967, "percentage": 32.36, "elapsed_time": "10:36:25", "remaining_time": "22:10:34"}
 {"current_steps": 440, "total_steps": 1329, "loss": 0.5934, "learning_rate": 5e-06, "epoch": 0.9929478138222849, "percentage": 33.11, "elapsed_time": "10:51:13", "remaining_time": "21:55:45"}
 {"current_steps": 443, "total_steps": 1329, "eval_loss": 0.5912777781486511, "epoch": 0.9997179125528914, "percentage": 33.33, "elapsed_time": "11:07:19", "remaining_time": "22:14:38"}
+{"current_steps": 450, "total_steps": 1329, "loss": 0.6008, "learning_rate": 5e-06, "epoch": 1.0155148095909732, "percentage": 33.86, "elapsed_time": "11:18:47", "remaining_time": "22:05:54"}
+{"current_steps": 460, "total_steps": 1329, "loss": 0.528, "learning_rate": 5e-06, "epoch": 1.0380818053596614, "percentage": 34.61, "elapsed_time": "11:33:35", "remaining_time": "21:50:16"}
+{"current_steps": 470, "total_steps": 1329, "loss": 0.5429, "learning_rate": 5e-06, "epoch": 1.0606488011283497, "percentage": 35.36, "elapsed_time": "11:48:23", "remaining_time": "21:34:41"}
+{"current_steps": 480, "total_steps": 1329, "loss": 0.5308, "learning_rate": 5e-06, "epoch": 1.0832157968970382, "percentage": 36.12, "elapsed_time": "12:03:11", "remaining_time": "21:19:09"}
+{"current_steps": 490, "total_steps": 1329, "loss": 0.5408, "learning_rate": 5e-06, "epoch": 1.1057827926657264, "percentage": 36.87, "elapsed_time": "12:17:59", "remaining_time": "21:03:38"}
+{"current_steps": 500, "total_steps": 1329, "loss": 0.5396, "learning_rate": 5e-06, "epoch": 1.1283497884344147, "percentage": 37.62, "elapsed_time": "12:32:48", "remaining_time": "20:48:08"}
+{"current_steps": 510, "total_steps": 1329, "loss": 0.5407, "learning_rate": 5e-06, "epoch": 1.150916784203103, "percentage": 38.37, "elapsed_time": "12:47:36", "remaining_time": "20:32:41"}
+{"current_steps": 520, "total_steps": 1329, "loss": 0.5333, "learning_rate": 5e-06, "epoch": 1.1734837799717912, "percentage": 39.13, "elapsed_time": "13:02:24", "remaining_time": "20:17:15"}
+{"current_steps": 530, "total_steps": 1329, "loss": 0.5395, "learning_rate": 5e-06, "epoch": 1.1960507757404795, "percentage": 39.88, "elapsed_time": "13:17:14", "remaining_time": "20:01:52"}
+{"current_steps": 540, "total_steps": 1329, "loss": 0.5371, "learning_rate": 5e-06, "epoch": 1.2186177715091677, "percentage": 40.63, "elapsed_time": "13:32:02", "remaining_time": "19:46:29"}
+{"current_steps": 550, "total_steps": 1329, "loss": 0.5419, "learning_rate": 5e-06, "epoch": 1.2411847672778562, "percentage": 41.38, "elapsed_time": "13:46:51", "remaining_time": "19:31:07"}
+{"current_steps": 560, "total_steps": 1329, "loss": 0.5438, "learning_rate": 5e-06, "epoch": 1.2637517630465445, "percentage": 42.14, "elapsed_time": "14:01:39", "remaining_time": "19:15:46"}
+{"current_steps": 570, "total_steps": 1329, "loss": 0.541, "learning_rate": 5e-06, "epoch": 1.2863187588152327, "percentage": 42.89, "elapsed_time": "14:16:27", "remaining_time": "19:00:26"}
+{"current_steps": 580, "total_steps": 1329, "loss": 0.5409, "learning_rate": 5e-06, "epoch": 1.308885754583921, "percentage": 43.64, "elapsed_time": "14:31:14", "remaining_time": "18:45:06"}
+{"current_steps": 590, "total_steps": 1329, "loss": 0.5411, "learning_rate": 5e-06, "epoch": 1.3314527503526092, "percentage": 44.39, "elapsed_time": "14:46:02", "remaining_time": "18:29:47"}
+{"current_steps": 600, "total_steps": 1329, "loss": 0.5463, "learning_rate": 5e-06, "epoch": 1.3540197461212977, "percentage": 45.15, "elapsed_time": "15:00:49", "remaining_time": "18:14:30"}
+{"current_steps": 610, "total_steps": 1329, "loss": 0.5391, "learning_rate": 5e-06, "epoch": 1.376586741889986, "percentage": 45.9, "elapsed_time": "15:15:37", "remaining_time": "17:59:13"}
+{"current_steps": 620, "total_steps": 1329, "loss": 0.5433, "learning_rate": 5e-06, "epoch": 1.3991537376586742, "percentage": 46.65, "elapsed_time": "15:30:24", "remaining_time": "17:43:58"}
+{"current_steps": 630, "total_steps": 1329, "loss": 0.5413, "learning_rate": 5e-06, "epoch": 1.4217207334273625, "percentage": 47.4, "elapsed_time": "15:45:12", "remaining_time": "17:28:43"}
+{"current_steps": 640, "total_steps": 1329, "loss": 0.5409, "learning_rate": 5e-06, "epoch": 1.4442877291960508, "percentage": 48.16, "elapsed_time": "16:00:00", "remaining_time": "17:13:30"}
+{"current_steps": 650, "total_steps": 1329, "loss": 0.5418, "learning_rate": 5e-06, "epoch": 1.466854724964739, "percentage": 48.91, "elapsed_time": "16:14:47", "remaining_time": "16:58:16"}
+{"current_steps": 660, "total_steps": 1329, "loss": 0.5456, "learning_rate": 5e-06, "epoch": 1.4894217207334273, "percentage": 49.66, "elapsed_time": "16:29:34", "remaining_time": "16:43:04"}
+{"current_steps": 670, "total_steps": 1329, "loss": 0.5403, "learning_rate": 5e-06, "epoch": 1.5119887165021155, "percentage": 50.41, "elapsed_time": "16:44:22", "remaining_time": "16:27:53"}
+{"current_steps": 680, "total_steps": 1329, "loss": 0.5344, "learning_rate": 5e-06, "epoch": 1.5345557122708038, "percentage": 51.17, "elapsed_time": "16:59:10", "remaining_time": "16:12:43"}
+{"current_steps": 690, "total_steps": 1329, "loss": 0.5366, "learning_rate": 5e-06, "epoch": 1.5571227080394923, "percentage": 51.92, "elapsed_time": "17:13:58", "remaining_time": "15:57:33"}
+{"current_steps": 700, "total_steps": 1329, "loss": 0.5408, "learning_rate": 5e-06, "epoch": 1.5796897038081805, "percentage": 52.67, "elapsed_time": "17:28:46", "remaining_time": "15:42:24"}
+{"current_steps": 710, "total_steps": 1329, "loss": 0.5435, "learning_rate": 5e-06, "epoch": 1.6022566995768688, "percentage": 53.42, "elapsed_time": "17:43:34", "remaining_time": "15:27:15"}
+{"current_steps": 720, "total_steps": 1329, "loss": 0.5518, "learning_rate": 5e-06, "epoch": 1.6248236953455573, "percentage": 54.18, "elapsed_time": "17:58:21", "remaining_time": "15:12:06"}
+{"current_steps": 730, "total_steps": 1329, "loss": 0.535, "learning_rate": 5e-06, "epoch": 1.6473906911142455, "percentage": 54.93, "elapsed_time": "18:13:09", "remaining_time": "14:56:59"}
+{"current_steps": 740, "total_steps": 1329, "loss": 0.5508, "learning_rate": 5e-06, "epoch": 1.6699576868829338, "percentage": 55.68, "elapsed_time": "18:27:57", "remaining_time": "14:41:52"}
+{"current_steps": 750, "total_steps": 1329, "loss": 0.5422, "learning_rate": 5e-06, "epoch": 1.692524682651622, "percentage": 56.43, "elapsed_time": "18:42:44", "remaining_time": "14:26:45"}
+{"current_steps": 760, "total_steps": 1329, "loss": 0.541, "learning_rate": 5e-06, "epoch": 1.7150916784203103, "percentage": 57.19, "elapsed_time": "18:57:32", "remaining_time": "14:11:39"}
+{"current_steps": 770, "total_steps": 1329, "loss": 0.5417, "learning_rate": 5e-06, "epoch": 1.7376586741889986, "percentage": 57.94, "elapsed_time": "19:12:19", "remaining_time": "13:56:33"}
+{"current_steps": 780, "total_steps": 1329, "loss": 0.5375, "learning_rate": 5e-06, "epoch": 1.7602256699576868, "percentage": 58.69, "elapsed_time": "19:27:07", "remaining_time": "13:41:28"}
+{"current_steps": 790, "total_steps": 1329, "loss": 0.541, "learning_rate": 5e-06, "epoch": 1.782792665726375, "percentage": 59.44, "elapsed_time": "19:41:54", "remaining_time": "13:26:23"}
+{"current_steps": 800, "total_steps": 1329, "loss": 0.536, "learning_rate": 5e-06, "epoch": 1.8053596614950633, "percentage": 60.2, "elapsed_time": "19:56:42", "remaining_time": "13:11:19"}
+{"current_steps": 810, "total_steps": 1329, "loss": 0.5468, "learning_rate": 5e-06, "epoch": 1.8279266572637518, "percentage": 60.95, "elapsed_time": "20:11:30", "remaining_time": "12:56:15"}
+{"current_steps": 820, "total_steps": 1329, "loss": 0.5341, "learning_rate": 5e-06, "epoch": 1.85049365303244, "percentage": 61.7, "elapsed_time": "20:26:18", "remaining_time": "12:41:12"}
+{"current_steps": 830, "total_steps": 1329, "loss": 0.5462, "learning_rate": 5e-06, "epoch": 1.8730606488011283, "percentage": 62.45, "elapsed_time": "20:41:06", "remaining_time": "12:26:09"}
+{"current_steps": 840, "total_steps": 1329, "loss": 0.5461, "learning_rate": 5e-06, "epoch": 1.8956276445698168, "percentage": 63.21, "elapsed_time": "20:55:54", "remaining_time": "12:11:07"}
+{"current_steps": 850, "total_steps": 1329, "loss": 0.534, "learning_rate": 5e-06, "epoch": 1.918194640338505, "percentage": 63.96, "elapsed_time": "21:10:42", "remaining_time": "11:56:04"}
+{"current_steps": 860, "total_steps": 1329, "loss": 0.539, "learning_rate": 5e-06, "epoch": 1.9407616361071933, "percentage": 64.71, "elapsed_time": "21:25:30", "remaining_time": "11:41:02"}
+{"current_steps": 870, "total_steps": 1329, "loss": 0.5456, "learning_rate": 5e-06, "epoch": 1.9633286318758816, "percentage": 65.46, "elapsed_time": "21:40:18", "remaining_time": "11:26:01"}
+{"current_steps": 880, "total_steps": 1329, "loss": 0.5439, "learning_rate": 5e-06, "epoch": 1.9858956276445698, "percentage": 66.22, "elapsed_time": "21:55:06", "remaining_time": "11:11:00"}
+{"current_steps": 886, "total_steps": 1329, "eval_loss": 0.5872690677642822, "epoch": 1.9994358251057829, "percentage": 66.67, "elapsed_time": "22:15:46", "remaining_time": "11:07:53"}