Skip to content

jan3zk/speech_trim

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

52 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Prirezovalnik govornih posnetkov

Aplikacija za samodejno prirezovanje začetnih in končnih premorov govornih posnetkov v datotekah WAV.

Namestitev

Koda je spisana v programskem jeziku Python 3. Zahtevane knjižnice se namesti z pip install -r requirements.txt.

Uporaba

Prirez večih posnetkov naenkrat je mogoč s klicem python speech_trim.py -i izvorni/posnetki/ -o prirezani/posnetki/, kjer v vhodnih argumentih podamo mapo s posnetki, ki jih želimo prirezati in mapo, kamor se bodo prirezani posnetki shranili. Prirez posameznega posnetka izvedemo s klicem python speech_trim.py -i izvorni_posnetek.wav -o prirezani_posnetek.wav.

Opcijski vhodni argumenti

  • -v Vkjučitev izrisa grafa glasnosti obravnavanega govornega posnetka.
  • -a <int> Stopnja filtriranje negovornih odsekov (celoštevilska vrendnosti med 0 in 3, prednastavljeno 3).
  • -d <float> Minimalna dolžina govornega signala v sekundah (prednastavljeno 1,0 s).
  • -p <float> Želena dolžina začetnega/končnega premora, pri čemer je <float> decimalna vrednost v sekundah (prednastavljena vrednost je 0.75)
  • -t <int> Pragu tišine v dBFS (prednastavljena vrednost -35).
  • -c <int> Dolžina odseka v ms znotraj katerega postopek po korakih išče začetek/konec govora (prednastavljena vrednost 75).
  • -z Zapolni prekratke premore s šumom ozadja.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published