chatterbox

by 1MB4R0SS4 - opened Jun 4, 2025

Jun 4, 2025

szia! elöször is nagyon szépen köszönöm, hogy ilyen szorgalmasan fejlesztgeted a modellt, én gyakran használom. a kérdésem az lenne, hogy szerinted a chatterbox új cuccával is megvalósítható lenne-e ilyen magyarosítás?
https://github.com/resemble-ai/chatterbox

sarpba

Owner Jun 4, 2025

•

edited Jun 4, 2025

Sajnos nem, ha megnézed a hibajegyeket láthatod, hogy a feltett kérdésre válaszul írják, hogy a munkájuk fentarthatósága végett fentartják a finomhangolás anyagi ellenszolgáltatás ellenében való elvégzését maguknak. Nem adnak ki finomhangoló kódot. Összegről nem beszéltek, de gondolom jelentős, ha a szerverparkjuk fentartásáról beszélünk.

https://github.com/resemble-ai/chatterbox/issues/32#issuecomment-2923048972

Szóval röviden, sajnos nem. Azaz pontosabban ilyen formán nem. A fizetős API-jukon keresztül lesz rá lehetőség...

Viszont az F5-TTS-nek van egy új ága, ami igéretes fejlesztéseket hoz a leírás szerint, majd megnézem, hogy azt meg tudom-e valósítani. F5R-TTS. Megerősítéses tréningen alapuló 2. finomhangolást eresztenek a modellre. "Állítólag" sokat javít.
https://github.com/SWivid/F5-TTS/issues/957

Mykee

Oct 20, 2025

•

edited Oct 20, 2025

Az F5R-TTS-ből végül lett valami? Még ComfyUI node-ot sem találtam hozzá, miközben a projekt elvileg él:
https://github.com/FrontierLabs/F5R-TTS
Az sem tiszta, hogy ezen lehet használni a régi F5-TTS modelleket vagy sem. Abszolút homály nekem.

sarpba

Owner Oct 20, 2025

Egyelőre nem foglalkoztam vele, nem rég készültem el az újragondolt moduláris szinkron progival, bár még vissza van a futtatókörnyezetek telepítésére vonatkozó leírás: https://github.com/sarpba/AI_Dubbing Részemről innen van értelme a további TTS modellek fejlesztésének. Egyébként időközben a chatterbox-nak is lett comunity által írt finomhangoló kódja...

Szóval úgy gondolom az ünnepek alatt lesz kicsit több időm, akkortályt biztos lesz előrelépés mindkét fronton... (F5R és Chatter TTS)

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment