recoilme commited on 12 days ago

Commit

7e448d9

1 Parent(s): f7150d1

2512

Browse files

Files changed (30) hide show

media/result_grid2.jpg +3 -0
samples/sdxs_1b_384x768_0.jpg +2 -2
samples/sdxs_1b_416x768_0.jpg +2 -2
samples/sdxs_1b_448x768_0.jpg +2 -2
samples/sdxs_1b_480x768_0.jpg +2 -2
samples/sdxs_1b_512x768_0.jpg +2 -2
samples/sdxs_1b_544x768_0.jpg +2 -2
samples/sdxs_1b_576x768_0.jpg +2 -2
samples/sdxs_1b_608x768_0.jpg +2 -2
samples/sdxs_1b_640x768_0.jpg +2 -2
samples/sdxs_1b_672x768_0.jpg +2 -2
samples/sdxs_1b_704x768_0.jpg +2 -2
samples/sdxs_1b_736x768_0.jpg +2 -2
samples/sdxs_1b_768x384_0.jpg +2 -2
samples/sdxs_1b_768x416_0.jpg +2 -2
samples/sdxs_1b_768x448_0.jpg +2 -2
samples/sdxs_1b_768x480_0.jpg +2 -2
samples/sdxs_1b_768x512_0.jpg +2 -2
samples/sdxs_1b_768x544_0.jpg +2 -2
samples/sdxs_1b_768x576_0.jpg +2 -2
samples/sdxs_1b_768x608_0.jpg +2 -2
samples/sdxs_1b_768x640_0.jpg +2 -2
samples/sdxs_1b_768x672_0.jpg +2 -2
samples/sdxs_1b_768x704_0.jpg +2 -2
samples/sdxs_1b_768x736_0.jpg +2 -2
samples/sdxs_1b_768x768_0.jpg +2 -2
sdxs_1b/diffusion_pytorch_model.safetensors +1 -1
sdxs_flux/diffusion_pytorch_model.safetensors +1 -1
test.ipynb +2 -2
train_flux.py +12 -16

media/result_grid2.jpg ADDED Viewed

Git LFS Details

SHA256: 11ef6a11a7ef4325e9b5497255714eb7d0a04849cdb46b11e9323b7a92dbddd1
Pointer size: 132 Bytes
Size of remote file: 4.62 MB

samples/sdxs_1b_384x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 4d4a6c84b707a2b71d28dd6cde56c89737fb96c12ad2873033445309a8578cf1
Pointer size: 130 Bytes
Size of remote file: 72.6 kB

Git LFS Details

SHA256: 37470aae447544a5a103a70afd9b280042c682d840cdbbad5aee2a4bb6cbc6c1
Pointer size: 130 Bytes
Size of remote file: 79.1 kB

samples/sdxs_1b_416x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 2732a598b73cc0cd816a08b31cb0c5ca984f5bd67be439c6761917f6dcbded11
Pointer size: 130 Bytes
Size of remote file: 65.7 kB

Git LFS Details

SHA256: f3c6f3638ce3fa5305fbffdd0dc9ac799825b385bca6c8bcbde8f6f9704e9dac
Pointer size: 131 Bytes
Size of remote file: 131 kB

samples/sdxs_1b_448x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 34f8fada96c7be0ad2f3369a23f01352afbf4612c3ee1d8306d79a26c3035520
Pointer size: 131 Bytes
Size of remote file: 147 kB

Git LFS Details

SHA256: aecfd3390f6513449741f999b87ebf37e1b32498c45efc8e066b2aacabda38b2
Pointer size: 131 Bytes
Size of remote file: 111 kB

samples/sdxs_1b_480x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 0090838f7e862ebec5dde85bb5e02a749b18beadb86f77d20876b00c6cfc5d0f
Pointer size: 131 Bytes
Size of remote file: 143 kB

Git LFS Details

SHA256: 2dcf34b9f6a0876974c3be2b140a7d0512ff756de243f7803d103fcc76d61065
Pointer size: 130 Bytes
Size of remote file: 40.4 kB

samples/sdxs_1b_512x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: b28abae45ac8f86bb8a766b4fa0fe5d707509139379f1b6a8c601811d9aaadc3
Pointer size: 130 Bytes
Size of remote file: 97.1 kB

Git LFS Details

SHA256: 98fa02792c80e7538fe0b2639b0054489af0dd5b306685f349ac4b181c76edb0
Pointer size: 131 Bytes
Size of remote file: 203 kB

samples/sdxs_1b_544x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: e668cd9934ea4c429e756980e118293fa15e4455b7ca0a7668805e80e39f6fce
Pointer size: 131 Bytes
Size of remote file: 133 kB

Git LFS Details

SHA256: be635e6ccd030436ccc0095d99cc94949c5141b40449955be57740ce2aca68c1
Pointer size: 131 Bytes
Size of remote file: 136 kB

samples/sdxs_1b_576x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: a54eb20ec3fd979bb68c3b6528bc9113f027852f69a05f85ca23bb072c97e571
Pointer size: 131 Bytes
Size of remote file: 138 kB

Git LFS Details

SHA256: 5c7d16247c5a78aac3e703698c872edb093e9d881001ec78a27659e325984628
Pointer size: 131 Bytes
Size of remote file: 201 kB

samples/sdxs_1b_608x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 01a70540c4fb8496527bd4703a561abc4f7c48908ee0e3fcb826917ffe7e670e
Pointer size: 131 Bytes
Size of remote file: 239 kB

Git LFS Details

SHA256: c9b91d05a652bd2b043c22bac9f5c6a722fbc05707eb55836a7f614e03f4b723
Pointer size: 131 Bytes
Size of remote file: 136 kB

samples/sdxs_1b_640x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 26a486fb877e042c27b76b5ee8f8a368fb70cd3a2e9e972f05fd328653c4f462
Pointer size: 131 Bytes
Size of remote file: 231 kB

Git LFS Details

SHA256: 4a9268aa73c15872ed03487ef340d5a4075212e714ced9a99c54003b7bbce337
Pointer size: 131 Bytes
Size of remote file: 108 kB

samples/sdxs_1b_672x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: bd5ccb34eb5fe326da19f3297f99541fc0fda94dcfa2396362a438e743a2e507
Pointer size: 131 Bytes
Size of remote file: 102 kB

Git LFS Details

SHA256: 536d231dc7af86a86b3233462a1dca7edbc11d6f50efc6ecde869a5229bff237
Pointer size: 130 Bytes
Size of remote file: 92.4 kB

samples/sdxs_1b_704x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: a03eb642879aa394d38726cd4d3c1fe77bef0c2a8aff7b0b028d8d65c6baf889
Pointer size: 130 Bytes
Size of remote file: 89.5 kB

Git LFS Details

SHA256: 704ed0fd082e55929983bc87a006a60e10931de94dd54647c44deb0a874da3cb
Pointer size: 130 Bytes
Size of remote file: 88.5 kB

samples/sdxs_1b_736x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 55b2262cf5c2ca93aee6bdb11cf3f52c05e58823e2d93649dbe87c42f2ca3c0d
Pointer size: 131 Bytes
Size of remote file: 276 kB

Git LFS Details

SHA256: c032d0232a20f116cc4157ec221692b861edf7b50cc0addf3319b374faba6405
Pointer size: 131 Bytes
Size of remote file: 193 kB

samples/sdxs_1b_768x384_0.jpg CHANGED Viewed

Git LFS Details

SHA256: d72f2969879e2e86d57115a5aadd1e14f877641a9d600a30189a21d71790fae8
Pointer size: 130 Bytes
Size of remote file: 76.7 kB

Git LFS Details

SHA256: a77f7292d7311053663bc99025a78a789c15a59c69760734e05f27394b9a853b
Pointer size: 131 Bytes
Size of remote file: 195 kB

samples/sdxs_1b_768x416_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 1f8ebdbd02c645d3793ca8aeead317e450fa0a98e3c5bb5cbc7b60fa13980bf7
Pointer size: 131 Bytes
Size of remote file: 172 kB

Git LFS Details

SHA256: 89cbcc8966239f1394cdc37339750744d9d44a702dd0997840b896983406bdcb
Pointer size: 131 Bytes
Size of remote file: 102 kB

samples/sdxs_1b_768x448_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 14913038596f6f126b1380d9df5a8b5c2f2c64ed5894553bac46f4f83f3a0e1e
Pointer size: 130 Bytes
Size of remote file: 88.7 kB

Git LFS Details

SHA256: fa7f4e325d79257d8a83c6491b1f7ca1fa673cc83b61bd91283963fde60315eb
Pointer size: 131 Bytes
Size of remote file: 144 kB

samples/sdxs_1b_768x480_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 9f76a0c4cd682c7e06b969d3299804b279533ad33d6b8bd57011005a08aa828a
Pointer size: 130 Bytes
Size of remote file: 95.8 kB

Git LFS Details

SHA256: 00984630a4440ad854384942aafe7ba7f93935abf2d64d59188afe600990e4e8
Pointer size: 131 Bytes
Size of remote file: 181 kB

samples/sdxs_1b_768x512_0.jpg CHANGED Viewed

Git LFS Details

SHA256: dec45499962026109f348f7eed3b0d0895faa523aafa456b508972ef84f839b2
Pointer size: 131 Bytes
Size of remote file: 221 kB

Git LFS Details

SHA256: c68661f51e133ea5214c291e1fa770355d69e551329559200855668e599de440
Pointer size: 131 Bytes
Size of remote file: 266 kB

samples/sdxs_1b_768x544_0.jpg CHANGED Viewed

Git LFS Details

SHA256: ffeda26ff6e489f382d4c8be56183cd58a32bc115d52a85bd63b9b1b3cbeadf9
Pointer size: 131 Bytes
Size of remote file: 146 kB

Git LFS Details

SHA256: 3139682a4722d25fc02b8c8abe6927fb4dc030ecbf83d523d274360b8591ac4f
Pointer size: 131 Bytes
Size of remote file: 112 kB

samples/sdxs_1b_768x576_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 3f03be230aa478ebf756f0e3e91e8e64df6725f315fee2a0063be28f770925b3
Pointer size: 130 Bytes
Size of remote file: 99.4 kB

Git LFS Details

SHA256: 4dfe0574ddf389da0a85b8f06f63cf40b6e0a9eb1748077d3738602f70aae47c
Pointer size: 131 Bytes
Size of remote file: 116 kB

samples/sdxs_1b_768x608_0.jpg CHANGED Viewed

Git LFS Details

SHA256: f28e4e4971e4ae2f091b61d888b3a35117913f8d1895f0a056a9478f585063e9
Pointer size: 131 Bytes
Size of remote file: 160 kB

Git LFS Details

SHA256: 123e471bb2eb60ef49505d2e47d203c710bc6a4058febea8619b203cc83e3c5e
Pointer size: 131 Bytes
Size of remote file: 240 kB

samples/sdxs_1b_768x640_0.jpg CHANGED Viewed

Git LFS Details

SHA256: cd262f9dd75542c3910310696ed8085547a3ec0c6609ae65ae1e2adc0db59300
Pointer size: 131 Bytes
Size of remote file: 133 kB

Git LFS Details

SHA256: e3a2129ebda880de15b66835a668d316515481ec52a3e582480c2fc48afe2036
Pointer size: 131 Bytes
Size of remote file: 197 kB

samples/sdxs_1b_768x672_0.jpg CHANGED Viewed

Git LFS Details

SHA256: e7ff172b1c6b5ab8c864367c6a06ab752822a64c405b80b55eaf4b29ec2c59e9
Pointer size: 131 Bytes
Size of remote file: 161 kB

Git LFS Details

SHA256: 14408ed6fb88ef948a26011285d3fad40a33a041f54e5b3e57b4cf8110bb7cbe
Pointer size: 131 Bytes
Size of remote file: 185 kB

samples/sdxs_1b_768x704_0.jpg CHANGED Viewed

Git LFS Details

SHA256: bbcc65534512af7fa116dada3305006a9cc5eaa1d6d4b1caa664858151ca50fd
Pointer size: 131 Bytes
Size of remote file: 205 kB

Git LFS Details

SHA256: 0f566ee97416c295c33ea12b6a287aa8023fde031c3128e23ab72a838e8b8f9a
Pointer size: 131 Bytes
Size of remote file: 224 kB

samples/sdxs_1b_768x736_0.jpg CHANGED Viewed

Git LFS Details

SHA256: a22feb64669d2755499ab4215b31be27122d4fd3734b265e9a69de7984037432
Pointer size: 131 Bytes
Size of remote file: 318 kB

Git LFS Details

SHA256: 026c65560aded802925df531e6b6fa08c72e3dab875b541dffda68433e0014bc
Pointer size: 131 Bytes
Size of remote file: 220 kB

samples/sdxs_1b_768x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: a4ecab6d6e95bcb5e60c90660f06395c552ebb97f02eb78510904e684cf9a598
Pointer size: 131 Bytes
Size of remote file: 150 kB

Git LFS Details

SHA256: d04efe0359cf7eea87708dcae036809442be0006a338dc0832323fca9970f2fe
Pointer size: 131 Bytes
Size of remote file: 251 kB

sdxs_1b/diffusion_pytorch_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3773b931314cc4356c69abfae833a9e948b3092b58d436a73d1cff8a36a74376
 size 4463672488

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ecfc626ccacdf76e9c77d0ec0da480b9cc542a70f969d5acb25697725c1249c
 size 4463672488

sdxs_flux/diffusion_pytorch_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:41dfe79753fadad9ba8e148ac73e1b61f23c7a1146cece5147c0041d613298bd
 size 3195253456

 version https://git-lfs.github.com/spec/v1
+oid sha256:5604baf577450654b1d025e8c31e476e42ebcb7d535eeb100917de6a31bf02fe
 size 3195253456

test.ipynb CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7ee6048c4a59ddefaf190e5398f0dd7586746b0959db16971a118ca0a8e6e269
-size 8882423

 version https://git-lfs.github.com/spec/v1
+oid sha256:897429f78ba29492ec501a0b5b6224884068de6fc90a3976bc7b64f965b2b8e5
+size 9241758

train_flux.py CHANGED Viewed

@@ -29,12 +29,12 @@ from transformers import AutoTokenizer, AutoModel
 # --------------------------- Параметры ---------------------------
 ds_path = "/workspace/sdxs/datasets/mjnj"
 project = "sdxs_flux"
-batch_size = 32
 base_learning_rate = 4e-5 #2.7e-5
 min_learning_rate = 9e-6 #2.7e-5
-num_epochs = 10
-sample_interval_share = 10
-cfg_dropout = 0.9
 max_length = 192
 use_wandb = True
 use_comet_ml = False
@@ -96,8 +96,8 @@ lora_alpha = 64
 print("init")
 loss_ratios = {
-    "mse":   1.5,
-    "mae":   0.5,
 }
 median_coeff_steps = 256
@@ -107,8 +107,6 @@ class MedianLossNormalizer:
         # нормируем доли на случай, если сумма != 1
         #s = sum(desired_ratios.values())
         #self.ratios = {k: (v / s) for k, v in desired_ratios.items()}
-        #self.buffers = {k: deque(maxlen=window_steps) for k in self.ratios.keys()}
-        #self.window = window_steps
         self.ratios = {k: float(v) for k, v in desired_ratios.items()}
         self.buffers = {k: deque(maxlen=window_steps) for k in self.ratios.keys()}
         self.window = window_steps
@@ -571,6 +569,8 @@ def generate_and_save_samples(fixed_samples_cpu, uncond_data, step):
                 latents = scheduler.step(flow, t, latents).prev_sample
             current_latents = latents
             latent_for_vae = current_latents.detach() / scaling_factor + shift_factor
             decoded = vae.decode(latent_for_vae.to(torch.float32)).sample
@@ -671,9 +671,9 @@ for epoch in range(start_epoch, start_epoch + num_epochs):
             # шум
             noise = torch.randn_like(latents, dtype=latents.dtype)
             # берём t из [0, 1]
-            #t = torch.rand(latents.shape[0], device=latents.device, dtype=latents.dtype)
-            u = torch.rand(latents.shape[0], device=latents.device, dtype=latents.dtype)
-            t = torch.sigmoid(torch.randn_like(u))
             # интерполяция между x0 и шумом
             noisy_latents = (1.0 - t.view(-1, 1, 1, 1)) * latents + t.view(-1, 1, 1, 1) * noise
@@ -718,11 +718,7 @@ for epoch in range(start_epoch, start_epoch + num_epochs):
                 if accelerator.sync_gradients:
                     #with torch.amp.autocast('cuda', enabled=False):
                     grad_val = accelerator.clip_grad_norm_(unet.parameters(), clip_grad_norm)
-                    if grad_val is not None:
-                        grad = float(grad_val)
-                        print("grad_val is None")
-                    else:
-                        grad = 0.0
                     optimizer.step()
                     lr_scheduler.step()
                     optimizer.zero_grad(set_to_none=True)

 # --------------------------- Параметры ---------------------------
 ds_path = "/workspace/sdxs/datasets/mjnj"
 project = "sdxs_flux"
+batch_size = 256
 base_learning_rate = 4e-5 #2.7e-5
 min_learning_rate = 9e-6 #2.7e-5
+num_epochs = 20
+sample_interval_share = 3
+cfg_dropout = 0.5
 max_length = 192
 use_wandb = True
 use_comet_ml = False
 print("init")
 loss_ratios = {
+    "mse":   1.8,
+    "mae":   0.2,
 }
 median_coeff_steps = 256
         # нормируем доли на случай, если сумма != 1
         #s = sum(desired_ratios.values())
         #self.ratios = {k: (v / s) for k, v in desired_ratios.items()}
         self.ratios = {k: float(v) for k, v in desired_ratios.items()}
         self.buffers = {k: deque(maxlen=window_steps) for k in self.ratios.keys()}
         self.window = window_steps
                 latents = scheduler.step(flow, t, latents).prev_sample
             current_latents = latents
+            if step==0:
+                current_latents = sample_latents
             latent_for_vae = current_latents.detach() / scaling_factor + shift_factor
             decoded = vae.decode(latent_for_vae.to(torch.float32)).sample
             # шум
             noise = torch.randn_like(latents, dtype=latents.dtype)
             # берём t из [0, 1]
+            t = torch.rand(latents.shape[0], device=latents.device, dtype=latents.dtype)
+            #u = torch.rand(latents.shape[0], device=latents.device, dtype=latents.dtype)
+            #t = torch.sigmoid(torch.randn_like(u))
             # интерполяция между x0 и шумом
             noisy_latents = (1.0 - t.view(-1, 1, 1, 1)) * latents + t.view(-1, 1, 1, 1) * noise
                 if accelerator.sync_gradients:
                     #with torch.amp.autocast('cuda', enabled=False):
                     grad_val = accelerator.clip_grad_norm_(unet.parameters(), clip_grad_norm)
+                    grad = float(grad_val)
                     optimizer.step()
                     lr_scheduler.step()
                     optimizer.zero_grad(set_to_none=True)