Bold Transcripts

A simple Elixir library for working with Bold Video transcripts. Convert transcripts from various providers (AssemblyAI, Deepgram) to Bold's unified transcript format, and generate WebVTT subtitles.

Installation

Add bold_transcripts_ex to your list of dependencies in mix.exs:

def deps do
  [
    {:bold_transcripts_ex, "~> 0.6.0"}
  ]
end

Usage

Converting Transcripts

Convert transcripts from supported providers to Bold format:

# Convert from AssemblyAI
{:ok, bold_transcript} = BoldTranscriptsEx.convert(:assemblyai, assemblyai_json)

# Convert from Deepgram
{:ok, bold_transcript} = BoldTranscriptsEx.convert(:deepgram, deepgram_json, language: "en")

Generating Subtitles

Create WebVTT subtitles from a Bold transcript:

webvtt = BoldTranscriptsEx.generate_subtitles(bold_transcript)

Working with Chapters

Convert chapters to WebVTT format:

# From AssemblyAI transcript
{:ok, chapters_vtt} = BoldTranscriptsEx.chapters_to_webvtt(:assemblyai, transcript)

# From a list of chapters
chapters_vtt = BoldTranscriptsEx.chapters_to_webvtt([
  %{start: "0:00", end: "1:30", title: "Introduction"},
  %{start: "1:30", end: "5:45", title: "Main Content"}
])

Bold Transcript Format

The Bold transcript format is a unified JSON structure that combines metadata and utterances as segments of speech:

{
  "metadata": {
    "version": "2.0",
    "duration": 34.789,
    "language": "en",
    "source_url": "",
    "source_vendor": "assemblyai",
    "source_version": "1.2.3",
    "transcription_date": "2024-12-19T12:00:00Z",
    "speakers": ["A", "B", "C"]
  },
  "text": "Hey, how are you?",
  "utterances": [
    {
      "text": "Hey, how are you?",
      "start": 0.64,
      "end": 1.84,
      "speaker": "A",
      "confidence": 0.98789,
      "words": [
        {
          "word": "Hey",
          "start": 0.64,
          "end": 0.84,
          "confidence": 0.951
        },
        {
          "word": "how",
          "start": 0.85,
          "end": 1.04,
          "confidence": 0.962
        },
        {
          "word": "are",
          "start": 1.05,
          "end": 1.24,
          "confidence": 0.981
        },
        {
          "word": "you?",
          "start": 1.25,
          "end": 1.84,
          "confidence": 0.99
        }
      ]
    }
  ]
}

License

This project is licensed under the MIT License. See the LICENSE file for details.

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
lib		lib
test		test
.formatter.exs		.formatter.exs
.gitignore		.gitignore
README.md		README.md
mix.exs		mix.exs
mix.lock		mix.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Bold Transcripts

Installation

Usage

Converting Transcripts

Generating Subtitles

Working with Chapters

Bold Transcript Format

License

Links

About

Releases

Packages

Contributors 2

Languages

boldvideo/transcripts_ex

Folders and files

Latest commit

History

Repository files navigation

Bold Transcripts

Installation

Usage

Converting Transcripts

Generating Subtitles

Working with Chapters

Bold Transcript Format

License

Links

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages