Language Model Fine-tuning Project

Setup Instructions

Create a virtual environment:

python -m venv venv
source venv/bin/activate  # On Windows use: venv\Scripts\activate

Install dependencies:

pip install -r requirements.txt

Run the training script:

python train.py

Configuration

Edit config.py to modify:

Model selection (default: "gpt2")
Training parameters
Dataset selection

Available Datasets

Some recommended datasets from Hugging Face:

"wikitext" (wikipedia text)
"bookcorpus"
"squad" (question-answering)
"glue"

Example Configuration

To use a different dataset, modify config.py:

@dataclass
class DataConfig:
    dataset_name: str = "wikitext"
    dataset_config_name: str = "wikitext-2-raw-v1"
    max_length: int = 128
    train_test_split: float = 0.1

@dataclass
class TrainingConfig:
    model_name: str = "gpt2"
    batch_size: int = 4
    num_train_epochs: int = 3
    learning_rate: float = 5e-5
    weight_decay: float = 0.0
    logging_steps: int = 100
    save_steps: int = 1000
    output_dir: str = "output"

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
evaluation_data		evaluation_data
src		src
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
config.py		config.py
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Language Model Fine-tuning Project

Setup Instructions

Configuration

Available Datasets

Example Configuration

About

Releases

Packages

Languages

ashioyajotham/lm_finetuning

Folders and files

Latest commit

History

Repository files navigation

Language Model Fine-tuning Project

Setup Instructions

Configuration

Available Datasets

Example Configuration

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages