Skip to content

Latest commit

 

History

History
23 lines (17 loc) · 2.22 KB

README.md

File metadata and controls

23 lines (17 loc) · 2.22 KB

Prirezovalnik govornih posnetkov

Aplikacija za samodejno prirezovanje začetnih in končnih premorov govornih posnetkov v datotekah WAV.

Namestitev

Koda je spisana v programskem jeziku Python 3. Zahtevane knjižnice se namesti z pip install -r requirements.txt.

Uporaba

Prirez večih posnetkov naenkrat je mogoč s klicem python speech_trim.py -i izvorni/posnetki/ -o prirezani/posnetki/, kjer v vhodnih argumentih podamo mapo s posnetki, ki jih želimo prirezati in mapo, kamor se bodo prirezani posnetki shranili. Prirez posameznega posnetka izvedemo s klicem python speech_trim.py -i izvorni_posnetek.wav -o prirezani_posnetek.wav.

Opcijski vhodni argumenti

  • -v Vkjučitev izrisa grafa glasnosti obravnavanega govornega posnetka.
  • -a <int> Stopnja filtriranje negovornih odsekov (celoštevilska vrendnosti med 0 in 3, prednastavljeno 3).
  • -d <float> Minimalna dolžina govornega signala v sekundah (prednastavljeno 1,0 s).
  • -p <float> Želena dolžina začetnega/končnega premora, pri čemer je <float> decimalna vrednost v sekundah (prednastavljena vrednost je 0.75)
  • -t <int> Pragu tišine v dBFS (prednastavljena vrednost -35).
  • -c <int> Dolžina odseka v ms znotraj katerega postopek po korakih išče začetek/konec govora (prednastavljena vrednost 75).
  • -z Zapolni prekratke premore s šumom ozadja.