Aplikacija za samodejno prirezovanje začetnih in končnih premorov govornih posnetkov v datotekah WAV.
Koda je spisana v programskem jeziku Python 3. Zahtevane knjižnice se namesti z pip install -r requirements.txt
.
Prirez večih posnetkov naenkrat je mogoč s klicem python speech_trim.py -i izvorni/posnetki/ -o prirezani/posnetki/
, kjer v vhodnih argumentih podamo mapo s posnetki, ki jih želimo prirezati in mapo, kamor se bodo prirezani posnetki shranili. Prirez posameznega posnetka izvedemo s klicem python speech_trim.py -i izvorni_posnetek.wav -o prirezani_posnetek.wav
.
-v
Vkjučitev izrisa grafa glasnosti obravnavanega govornega posnetka.-a <int>
Stopnja filtriranje negovornih odsekov (celoštevilska vrendnosti med 0 in 3, prednastavljeno 3).-d <float>
Minimalna dolžina govornega signala v sekundah (prednastavljeno 1,0 s).-p <float>
Želena dolžina začetnega/končnega premora, pri čemer je<float>
decimalna vrednost v sekundah (prednastavljena vrednost je0.75
)-t <int>
Pragu tišine v dBFS (prednastavljena vrednost-35
).-c <int>
Dolžina odseka v ms znotraj katerega postopek po korakih išče začetek/konec govora (prednastavljena vrednost75
).-z
Zapolni prekratke premore s šumom ozadja.