# intel CPU : Intel(R) Core(TM) i5-10600KF CPU @ 4.10GHz 4.10 GHz
# λ©λͺ¨λ¦¬ : DDR4 32G
# λ©μΈ HDD : M.2 SSD
# GPU : nVidia A2000 (λ©λͺ¨λ¦¬ 6G)
# OS : Windows 11 Pro, 23H2, OS Build 22631.4169
wsl
: μλμ° νμμμ€ν
리λ
μ€, Windows Subsystem for Linux, μλμ° 10, 11 νκ²½μμ 리λ
μ€λ₯Ό μ€μΉν μ μλ νκ²½
Windows 10 λ²μ 2004 μ΄μ(λΉλ 19041 μ΄μ)
λλ Windows 11
μμ μ 곡νλ κ°λ°νκ²½
μλμ°λ₯Ό μ²μ μ€μΉνλ©΄ wsl μ΄ κΈ°λ³Έμ μΌλ‘ νμ±ν λμ΄ μμ§ μλ€
μλμ° power shell
μ κ΄λ¦¬μ λͺ¨λλ‘ μ€ννμ¬ λͺ
λ Ήμ μννμ¬ wsl μ μ€μΉνλ€
wsl --install
곡μλ¬Έμμλ μ΄ λͺ
λ ΉμΌλ‘ wsl
μ΄ μ€μΉλκ³ ubuntu
linux κ° μ€μΉλλ€κ³ λμ΄ μμΌλ windows 11
νκ²½μμ μ€νν κ²°κ³Ό ubuntu
λ κΈ°λ³Έμ μΌλ‘ μ€μΉλμ§ μκ³ , λ³λλ‘ μ€μΉν΄ μ£Όμ΄μΌ νλ€.
wsl
μ€μΉκ° μλ£λ ν ubuntu
λ₯Ό μ€μΉνλ€
wsl
νκ²½μ μ€μΉν μ μλ linux
λ°°ν¬νμ μ°Ύμ보μ
wsl --list --online
μ΄ νλ‘μ νΈμμλ ubuntu 24.04.lte
λ²μ μ μ€μΉνμλ€.
wsl --install Ubuntu-24.04
sudo apt update
sudo apt install curl -y
curl --output anaconda.sh https://repo.anaconda.com/archive/Anaconda3-2024.06-1-Linux-x86_64.sh
곡μμ¬μ΄νΈλ₯Ό ν΅νμ¬ μ΅μ μ νμΈνμ : https://docs.anaconda.com/anaconda/install/linux/
μλμ½λ€ Archive : https://repo.anaconda.com/archive/
sudo apt update
sudp apt upgrade
https://pytorch.org/get-started/locally/ μ¬κΈ°μ μ μνμ¬ μμ μ GPU μ λ§λ CUDA
μ© torch
λ₯Ό μ°Ύμμ μ¬ μ€μΉνλ€
Run this command
νλͺ©μ μ€ν¬λ¦½νΈλ₯Ό 볡μ¬νμ¬ shell
μμ μ€ννλ€. μ΄λ λλΆλΆμ λ°λμ --upgrade
λ₯Ό λΆμΈλ€
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124 --upgrade
νλ‘μ νΈ κ³΅μλ¬Έμμλ μλ΅λ λΆλΆμΌλ‘ μ΄ κ³Όμ μ μλ΅νλ©΄, λͺ¨λΈ μ»΄νμΌκ³Ό λͺ¨λΈ νλ ¨κ³Όμ μ μ€ν ν μ μλ€
conda install cuda -c nvidia/label/cuda-12.4
cd
pwd
# /home/user
git clone https://github.com/callor/Callor-sakana.ai-2024.git
conda create -n ai_scientist python=3.11
conda activate ai_scientist
μ΄ λꡬλ μ΅μ’ μ μΌλ‘ PDF νμΌννλ‘ λ λ Όλ¬Έμ μμ±ν λ νμνλ€
# Install pdflatex
sudo apt-get install texlive-full
# Install pypi requirements
pip3 install -r requirements.txt
requirements.txt μ torch μ€μΉμ½λκ° μμΌλ, CUDA λ²μ κ³Ό νΈνμ΄ λμ§ μλ κ²μΌλ‘ 보μΈλ€ λ€μ λͺ
λ ΉμΌλ‘ μμ μ νλμ¨μ΄, μ΄μ체μ μ λ§λ torch λ₯Ό λ€μ μ€μΉνλ€. μ΄λλ λ°λμ --upgrade μ΅μ
μ λμ λΆμ¬μΌ νλ€
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124 --upgrade
conda install cuda -c nvidia/label/cuda-12.4
νμ¬ ν΄λμ env.sh
νμΌμ μμ±ν ν openAI API Key μ Semantic Scholar API Key λ₯Ό μ μ₯νλ€
export OPENAI_API_KEY="USER OPEN AI KEY"
export S2_API_KEY="USER Sementic Schola API KEY"
source env.sh
echo $OPENAI_API_KEY
# sk-proj-******
$ echo $S2_API_KEY
# Ep9******
# Prepare NanoGPT data
python data/enwik8/prepare.py
python data/shakespeare_char/prepare.py
python data/text8/prepare.py
κΈ°μ€μ μμ±μ μ¬μ νμ΅λ¨κ³λ‘ source μ μ 곡λ 3κ°μ§ dateset μ μ°Έμ‘°νμ¬ νμ΅νλ€.
cd templates/nanoGPT && python experiment.py --out_dir run_0 && python plot.py
entwik8
, shakespeare_char_input
, text8
λ°μ΄ν°λ₯Ό μ¬μ©νμ¬ κ΅¬μ²΄μ λͺ¨λΈ μμ±μ μν κΈ°μ€μ λͺ¨λΈμ μμ±νλ€
μ΄ κ³Όμ μμ 1λ² μ€νν λ μ½ 3-4μκ° κ°λ μμκ° λλ€. GPU, λ©λͺ¨λ¦¬ λ± μμ€ν μ±λ₯μ λ°λΌ μκ°μ°¨μ΄κ° λ§μ΄ λλ€.
μ΄ κ³Όμ μμλ openAI μ API λ₯Ό νμ©νμ§ μλλ€. GPU μ μ¬μ©λμ΄ 100%μμ μ§νλλ κ²μ λ³Ό μ μλ€
μμ±λ κΈ°μ€μ νμ΅λͺ¨λΈκ³Ό openAI μ Semantic schola API λ₯Ό μ¬μ©νμ¬ λ³Έκ²©μ μΈ νμ΅μ μ€ννλ€.
λ³Έ νμ΅μ μ½λμ 5ν μ€νλλ©°, λ³Έ νμ΅μ΄ μλ£λλλ°λ μ½ 35μκ° μ λκ° μμλλ€
python launch_scientist.py --model "gpt-4o-2024-05-13" --experiment nanoGPT --num-ideas 3