Experimento FINETUNE F5TTS 3
Foram feitos 3 treinos distintos (cada um em uma pasta):
brPB01_g2aF01
brpb22_g1bf01
all
Resultado geral: os treinos não deram bons resultados (qualidade ainda insatisfatória), mas ficam documentados para histórico e comparação.
Treino 1 — brPB01_g2aF01
- Arquivos relevantes: checkpoints
step_*_gen.wav / step_*_ref.wav e inferências em inferencia/.
Inferência (Texto | Áudio)
| Texto |
Áudio |
| Eu estava pensando em passar ali na feira antes de ir pra casa. |
|
| Visse, esse menino não para quieto nem um segundo. |
|
| Bota mais agua nesse café que ficou forte demais. |
|
Checkpoints (Ref | Gen)
| Step |
Ref |
Gen |
| 300 |
|
|
| 600 |
|
|
| 900 |
|
|
| 1200 |
|
|
| 1500 |
|
|
| 1800 |
|
|
| 2100 |
|
|
| 2400 |
|
|
| 2700 |
|
|
| 3000 |
|
|
| 3300 |
|
|
| 3600 |
|
|
| 3900 |
|
|
| 4200 |
|
|
| 4500 |
|
|
| 4800 |
|
|
| 5100 |
|
|
Treino 2 — brpb22_g1bf01
- Arquivos relevantes: checkpoints
step_*_gen.wav / step_*_ref.wav, loss.png, e inferências em inferencia/.
Figura: Curva de loss do treino brpb22_g1bf01.
Inferência (Texto | Áudio)
| Texto |
Áudio |
| Eu estava pensando em passar ali na feira antes de ir pra casa. |
|
| Visse, esse menino não para quieto nem um segundo. |
|
| Bota mais agua nesse café que ficou forte demais. |
|
Checkpoints (Ref | Gen)
| Step |
Ref |
Gen |
| 250 |
|
|
| 500 |
|
|
| 750 |
|
|
| 1000 |
|
|
| 1250 |
|
|
Treino 3 — all
- Arquivos relevantes: checkpoints
step_*_gen.wav / step_*_ref.wav, loss.png, e inferências em inferencia/.
Figura: Curva de loss do treino all.
Inferência (Texto | Áudio)
| Texto |
Áudio |
| Eu estava pensando em passar ali na feira antes de ir pra casa. |
|
| Visse, esse menino não para quieto nem um segundo. |
|
| Bota mais agua nesse café que ficou forte demais. |
|
Checkpoints (Ref | Gen)
| Step |
Ref |
Gen |
| 221705 |
|
|
| 443410 |
|
|
Fonte: arquivos docs/audios/Experimento FINETUNE F5TTS 3/*/inferencia/txt.txt
Links relevantes