Prirezovalnik govornih posnetkov

Aplikacija za samodejno prirezovanje začetnih in končnih premorov govornih posnetkov v datotekah WAV.

Namestitev

Koda je spisana v programskem jeziku Python 3. Zahtevane knjižnice se namesti z pip install -r requirements.txt.

Uporaba

Prirez večih posnetkov naenkrat je mogoč s klicem python speech_trim.py -i izvorni/posnetki/ -o prirezani/posnetki/, kjer v vhodnih argumentih podamo mapo s posnetki, ki jih želimo prirezati in mapo, kamor se bodo prirezani posnetki shranili. Prirez posameznega posnetka izvedemo s klicem python speech_trim.py -i izvorni_posnetek.wav -o prirezani_posnetek.wav.

Opcijski vhodni argumenti

-v Vkjučitev izrisa grafa glasnosti obravnavanega govornega posnetka.
-a <int> Stopnja filtriranje negovornih odsekov (celoštevilska vrendnosti med 0 in 3, prednastavljeno 3).
-d <float> Minimalna dolžina govornega signala v sekundah (prednastavljeno 1,0 s).
-p <float> Želena dolžina začetnega/končnega premora, pri čemer je <float> decimalna vrednost v sekundah (prednastavljena vrednost je 0.75)
-t <int> Pragu tišine v dBFS (prednastavljena vrednost -35).
-c <int> Dolžina odseka v ms znotraj katerega postopek po korakih išče začetek/konec govora (prednastavljena vrednost 75).
-z Zapolni prekratke premore s šumom ozadja.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Prirezovalnik govornih posnetkov

Namestitev

Uporaba

Opcijski vhodni argumenti

Files

README.md

Latest commit

History

README.md

File metadata and controls

Prirezovalnik govornih posnetkov

Namestitev

Uporaba

Opcijski vhodni argumenti