E-Call Assistant / Imagine Cup 2018 project
- κΈ΄κΈμ κ³ κ° λ€μ΄μ€λ©΄ νλ‘κ·Έλ¨μ ν΅ν΄μ μ΅μ΄ μν©μ μ μνκ² λ©λλ€.
- μ΅μ΄ μ μ μκ°λΆν° μΆλ μ§μ μκ°, μ μ μ νλ₯Ό λμ μκ°κΉμ§ κΈ°λ‘μ΄ λ©λλ€.
- μ κ³ μκ° λΉν©νμ§ μκ³ μΉ¨μ°©νκ² μ€λͺ μ ν μ μλλ‘ κ·Όλ¬΄μκ° νμμ μΈ μ§λ¬ΈμΌλ‘ μ§μ μ μ λν©λλ€.
- κΈ΄κΈμ κ³ μ νλ₯Ό μ μνλ μκ°λΆν° μ€μκ°μΌλ‘ μ κ³ μμ μ§μ λ΄μ©μ΄ κΈ°λ‘μ΄ λ©λλ€.
- μ΄νμ Azure Cognitive Services κ°μ²΄λͺ λΆμμ ν΅ν΄μ μΆλμ νκΈ°μν΄ νμμ μΈ μ 보λ€μ λΆμν΄λ΄κ³ ν΄λΉνλ νλͺ©λμ μ±μμ€λλ€.
- μΆλμ μ§μν μ μλ νμμ μΈ νλͺ©λ€μ λ€ μ±μ°κ² λλ©΄ μ΄μλ°λΌ μΆλ μ§μλ₯Ό λ΄λ¦΄ μ μμ΅λλ€.
- κ·Έλ μ§ μμ κ²½μ°μ μλ¦Όμ ν΅ν΄μ 근무μκ° λμΉκ³ μλ μ μ μλ €μ€λλ€.
- 근무μλ μ€μκ°μΌλ‘ κΈ°λ‘λλ λ΄μ©μ μΆκ°μ μΈ λ΄μ©μ λ§λΆμΌ μ μμ΅λλ€.
- μΆλμ μ§μνλ κ³Όμ μμ, ν΅μ¬μ μΈ μ κ³ λ΄μ©μ μΆμΆν΄μ λ₯λ¬λμ νμ©ν΄ λ¬΄μ¨ λ΄μ©μΈμ§ λΆμμ ν©λλ€.
- λΆμν κ²°κ³Όμ λ°λΌ μ κ³ λ΄μ©μ΄ μΈλΆμ μΈ μΉ΄ν κ³ λ¦¬λ‘ λλμ΄μ§κ³ μ κ³ λ΄μ©μ μ μ ν λμ 맀λ΄μΌμ΄ νλ©΄μ μ μλ©λλ€.
- λΆλ₯λ μ κ³ λ΄μ©μ λ°λΌ ν΄λΉνλ λμ λ°©μμ μ μνμ¬ μ£Όκ³ λ§€λ΄μΌμ λ°λΌ μΈλΆμ μΈ μν© λ΄μ©μ μ§λ¬Έν©λλ€.
- μ΄λ κ² μ»μ΄μ§ μ 보λ λ°μ΄ν°λ² μ΄μ€μ μ μ₯μ΄ λμ΄ μΆλκΈ°κ΄μΌλ‘ μ μ‘λ©λλ€.
- μ¬λ¬ μν©μ λ§κ² μ μ ν λμ λ°©μμ μ 곡ν©λλ€.
- λν, λΆμμκ° μλ κ²½μ° κ΅¬μ‘°λ λμ°© μ λμ²λ²κΉμ§ μλ €μ£Όμ΄ μν©μ€ 근무μλ λΉν©νμ§ μκ³ μ λ¬Έμ μΌλ‘ μ κ³ μλ₯Ό μμ¬μν€κ³ μ κ³ λ₯Ό μ²λ¦¬ν μ μμ΅λλ€.
- μ κ³ μμ μ§μ λ΄μ©κ³Ό λΆμλ μ κ³ λ΄μ©μ Azure Databaseμ μ μ₯λκ³ κ΄λ¦¬λ©λλ€.
- λν, μ€μκ° μν©μ€μ μ λ°μ μΈ μ κ³ μ μ νν©μ κ·Έλνλ‘ λνλ΄μ£Όμ΄ μν©μ€ 근무μκ° μΈμ§λ₯Ό ν μ μκ² ν©λλ€.
- μ νκ° μ€λ©΄ μ΄ νλ©΄μ΄ λμ€κ³ ν΄λ¦νλ©΄ ν΅νλ₯Ό λ°κ² λ©λλ€.
- μ κ³ μ μ λ° μ κ³ μ’ λ£ μκ°κ³Ό μΈλΆμ μΈ μ κ³ μ μλ΄μ©μ Azure SQL λ°μ΄ν°λ² μ΄μ€ μλ²μ μ μ‘μμΌ κ΄λ¦¬ ν©λλ€.
- 근무μκ° μν©μ μ μνλ©΄μ μ΄κΈ° μν© μ μλΆν° μΈλΆμ μΈ μν©μ 리, μκΈμ²μΉκΉμ§ ν¬κ² μΈ λ¨κ³λ‘ μ ν©μ μ 리ν΄λκ°λλ°, κ° λ¨κ³λ₯Ό λμ΄κ° λλ§λ€ μ 리λ μν© λ΄μ©μ΄ λ°μ΄ν°λ² μ΄μ€μ μ μ₯μ΄ λ©λλ€.
- μ μ₯λ μ ν© λ΄μ©μ Azure μλ²λ₯Ό ν΅ν΄ μν© κ³΅μ κ° νμν λ΄λΉκΈ°κ΄μΌλ‘ μ μνκ² μ λ¬λ©λλ€.
- λν, λ°μ΄ν°λ₯Ό κ·Έλν λ‘ λνλ΄μ΄ μν©μ€ 근무μκ° κΈ΄κΈ μ κ³ μν©μ λν΄ μκ°μ μΌλ‘ νμ ν μ μκ² κ΅¬μ±νμ΅λλ€.
- μ κ³ μμ μ ν μμ±μ΄ μλ²½νκ² ν μ€νΈλ‘ λ³νλμ§ μμμ μΉ΄ν κ³ λ¦¬ κ΅¬λΆ μ νλκ° λ¨μ΄μ§λ λ¬Έμ κ° μμμ΅λλ€. κ·Έλμ μ체 ꡬνν λ¬Έμ₯ κ΅μ μκ³ λ¦¬μ¦μ ν΅ν΄ ν μ€νΈλ‘ λ³νλ μ κ³ λ΄μ©μ 보μνλ μ μ²λ¦¬ κ³Όμ μ κ±°μ³€μ΅λλ€.
- Skip-Gram μκ³ λ¦¬μ¦μ μ¬μ©νμ¬ Word2Vec λͺ¨λΈμ μμ±ν ν, λͺ¨λΈμμ λ¨μ΄ κ° μ½μ¬μΈ μ μ¬λλ₯Ό κ³μ°νμ¬ λ¬Έλ§₯μ λ§μ§ μλ λ¨μ΄λ₯Ό μΆμΆνμ΅λλ€.
- μ μ νμ§ μμ λ¨μ΄κ° μΆμΆλλ©΄, ν΄λΉ λ¨μ΄μ νΈμ§κ±°λ¦¬κ° μμ λ¨μ΄λ€μ 리μ€νΈλ‘ λ§λ€μ΄ λΉκ΅ ν κ°μ₯ μ μ ν λ¨μ΄λ‘ κ΅μ²΄νμ¬ λ¬Έμ₯μ κ΅μ νμ΅λλ€.
- μ§λ 10λ λμμ μκ΅ βκ°λμΈβ λ΄μ€ κΈ°μ¬λ₯Ό μ¬λ, νμ¬, κ΅ν΅μ¬κ³ λ± μ΄ 6κ°μ μΉ΄ν κ³ λ¦¬λ‘ κ΅¬λΆνμ¬ νμ΅ λ°μ΄ν°λ‘ λ§λ€μμ΅λλ€.
- λ΄μ€ κΈ°μ¬κ° μν©μ λ¬μ¬νλ λ°©μμ΄ μ€μ μ κ³ λ΄μ©κ³Ό λΉμ·νλ€λ μ μμ λ΄μ€ κΈ°μ¬λ₯Ό νμ΅ λ°μ΄ν°λ‘ μ ννμ΅λλ€.
- μ°Έκ³ λΈλ‘κ·Έ / Text classification using CNN written in tensorflow
- μ λ§ν¬μμ κ°λμΈ λ΄μ€ κΈ°μ¬λ₯Ό ν¬λ‘€λ§ν΄μμ ν΄λΉνλ μΉ΄ν κ³ λ¦¬μ κΈ°μ¬λ‘ νμ΅
- μ¬κ±΄ λ° μ¬κ³ μ λν΄ μ κ³ μκ° μ§μ μ νκ³ μν©μ μ€λͺ νλ κ²μ΄, λ΄μ€ κΈ°μ¬μμ μ¬κ±΄ λ° μ¬κ³ μ λν΄μ μ€λͺ μ νλ κ²κ³Ό μ μ¬μ±μ λ§μ΄ μ°Ύμ μ μμ κ²μ΄λΌ νλ¨νμ¬ λ΄μ€ κΈ°μ¬λ‘ νμ΅
- Gooseμ BeautifulSoup4λ₯Ό μ¬μ©ν΄μ κΈ°μ¬ λ΄μ©μ κ°μ Έμ΄
- Google κ²μμμ
(category) site:www.guardian.com
μ΄λΌκ³ κ²μνλ©΄ ν΄λΉ μ¬μ΄νΈμ κ²μ κ²°κ³Όλ§μ λ°ν
- μ κ³ μ μ§μ μ Multi class CNN Text Classification λͺ¨λΈμ μ¬μ©νμ¬ μμ ꡬλΉν΄λμ μΉ΄ν κ³ λ¦¬λ‘ λΆλ₯νμ΅λλ€.
- κ° λ¨μ΄μ λ¬Έμ₯μ μλ―Έλ₯Ό λΆμνλ λμ , μ μνκ² μΉ΄ν κ³ λ¦¬ ꡬλΆνμ¬ λμ 맀λ΄μΌμ μ 곡νλ κ²μ μ΄μ μ λ§μΆμμ΅λλ€. μΉ΄ν κ³ λ¦¬λ₯Ό λΆλ₯ν μ μλ νΉμ§μ μΆμΆνμ¬ λΉ λ₯Έ μλλ‘ μΉ΄ν κ³ λ¦¬λ₯Ό λΆλ₯νκΈ° μν΄ CNN λͺ¨λΈμ μ¬μ©νμ΅λλ€.
- λ©μΈ λͺ¨λΈμ λ΄μ λν κΉμ€ λ°μ¬μ Convolutional Neural Networks for Sentence Classificationμ λͺ¨λΈμ μ°¨μ©νμ΅λλ€.
- μ΄μ κ°μ CNN λͺ¨λΈλ‘ λ΄μ€ λ°μ΄ν°λ₯Ό νμ΅ μμΌ μ κ³ μμ μ§μ λ΄μ©μ νΉμ μΉ΄ν κ³ λ¦¬λ‘ μμΈ‘ν©λλ€. μ΄νμ μμΈ‘λ κ²°κ³Όκ° νλ©΄μ μΆλ ₯μ΄ λκ³ , κ²°κ³Όμ λ°λΌ ν΄λΉνλ μ¬κ±΄, μ¬κ³ μ λμ 맀λ΄μΌμ νλ©΄μ λμμ€λλ€.
- μ°Έκ³ λ¬Έν / Implementing a cnn for text classification in tensorflow
- νμ¬ 75% μ νλ / μμ§ νμ΅ν΄μΌν μΉ΄ν κ³ λ¦¬κ° λ μμ / μ νλ λ μ¬λ¦΄ μμ
- Training Command Example :
python train.py ./data/train.csv ./parameters.json
- URL request :
python predict.py ./trained_model_1516629873/
μλ² μ€ν ν νλ‘κ·Έλ¨ μ€ν - Console Predict Command Example :
python predict.py ./trained_model_1516629873/
- JSON file Predict Command Example :
python predict.py ./trained_model_1516629873/ ./data/sample.json
- C# νλ‘μ νΈ bin-Debug-(Environment.CurrentDirectory)μ "data_helper.py", "predict.py", "text_cnn.py", "train.py", trained model μμΉ μμΌμ μ€ννκΈ°
- μμΈ‘ κ°
- μ νλ
- μ°Έκ³ λ¬Έν / Implementing a cnn for text classification in tensorflow
- νμ¬ 97% μ νλ
- Training Command Example :
python train_posneg.py
- Console Predict Command Example :
python eval_posneg.py --eval_train --checkpoint_dir="./runs/1516169064/checkpoints/"
- C# νλ‘μ νΈ bin-Debug-(Environment.CurrentDirectory)μ "data_helpers_posneg.py", "eval_posneg.py", "text_cnn_posneg.py", "train_posneg.py", trained model μμΉ μμΌμ μ€ννκΈ°
- μλμ°μμ Data νμΌ λΆλ¬μ¬ λ, "UnicodeDecodeError: 'cp949' codec can't decode byte 0xe2 in position ---: illegal multibyte sequence" μ€λ₯ μ,
open('νμΌκ²½λ‘.txt', 'rt', encoding='UTF8')
μ΄λ κ² νμΌ Openν κ² - μ νλ