Skip to content

Latest commit

 

History

History
17 lines (11 loc) · 1.06 KB

Kaldi.md

File metadata and controls

17 lines (11 loc) · 1.06 KB

AsrRequest

Представляет запрос для распознавания речи.

  • audio_base64: Звуковой файл в формате base64, представляющий аудио, которое требуется распознать.

VoskAsrResponse

Представляет ответ после распознавания речи с

альтернативными вариантами и уверенностью в каждом из них.

  • alternatives: Список альтернативных вариантов распознанного текста.

AsrResponse

Представляет один из вариантов распознанного текста с его уверенностью.

  • text: Распознанный текст.
  • confidence: Уверенность (вероятность) в правильности распознавания текста. Значение находится в диапазоне от 0 до 1, где 1 обозначает максимальную уверенность.