Skip to content

Projekt z przedmiotu WEDT - Wprowadzenie do eksploracji danych tekstowych w sieci WWW - Odpowiadanie na pytania (Question Answering)

License

Notifications You must be signed in to change notification settings

kubasikora/WEDT-Projekt

Repository files navigation

WEDT-Projekt

Projekt z przedmiotu WEDT - Wprowadzenie do eksploracji danych tekstowych w sieci WWW

Odpowiadanie na pytania (Question Answering). 2-3 os.

  • jezyk implementacji: dowolny

Zadania:

  1. Studia literaturowe.
  2. Wybor rozwiazania.
  3. Zgromadzenie i przygotowanie danych do uczenia.
  4. Wytrenowanie modelu.

Program summary_search.py

Program zajmuje się odpytywaniem popularnych wyszukiwarek internetowych, celem zdobycia podsumowań (snippetów), z których wyciągane będą odpowiedzi na zadane pytania. Wykorzystuje on przeglądarkę headless, bez renderowania okna. Do jej uruchomienia, oprócz należy zainstalować odpowiedni driver do Firefoxa. Aby to zrobić, po zainstalowaniu środowiska i otworzeniu shella, należy wykonać polecenie webdrivermanager firefox. Pobierze to odpowiedni sterownik, zainstaluje w wirtualnym środowisku i pozwoli na uruchamianie przeglądarki w trybie headless.

Program kps.py

Program który odpowiada na zadane pytania. Komunikuje się z innymi serwisami aby uzyskać potrzebną bazę wiedzy, wyniki analizy morfologicznej, rozkłady zdania oraz inne informacje potrzebne do ekstrakcji odpowiedzi.

Program tester.py

Moduł do półautomatycznego testowania dokładności naszego rozwiązania. Pobiera pytania z arkusza kalkulacyjnego pytania.xlsx a zebrane odpowiedzi zapisuje w pliku wyniki.xlsx. W celu przetestowania rozwiązania, oba serwery kps i zapytajka należy uruchomić w trybie produkcyjnym. Aby to zrobić należy uruchomić komendę gunicorn -w 4 -b 127.0.0.1:5000 --timeout 10000 summary_search:app oraz gunicorn -w 4 -b 127.0.0.1:5010 --timeout 10000 kps:app. Po uruchomieniu obu usług, należy uruchomić program testujący jako zwykły skrypt python tester.py.

About

Projekt z przedmiotu WEDT - Wprowadzenie do eksploracji danych tekstowych w sieci WWW - Odpowiadanie na pytania (Question Answering)

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •