Skip to content

Парсер предназначен для сбора информации о нововведениях Python и количестве статусов документов PEP. Собирает все (Номера, Названия, Статусы) с https://peps.python.org/ и формирует два файла csv и записи в БД (sqlite) через SQLAlchemy. (Примеры есть в директории results/)

License

Notifications You must be signed in to change notification settings

stelmakhdigital/scrapy_parse_pep

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Асинхронный парсинг на Scrapy + Alchemy

Парсер предназначен для сбора информации о нововведениях Python и количестве статусов документов PEP.

Собирает все (Номера, Названия, Статусы) с https://peps.python.org/ и формирует два файла csv и записи в БД (sqlite) через SQLAlchemy. (Примеры есть в директории results/)

Подготовка к запуску проекта

Для начала, клонируйте репозиторий:

git clone https://github.com/budaevdigital/scrapy_parse_pep.git

Перейдите в скаченную директорию проекта:

cd scrapy_parse_pep

Создайте и активируйте виртуальное окружение:

python -m venv venv && source env/bin/activate

Установите все необходимые зависимости для работы проекта:

pip install -r requirements.txt

Запуск парсера

Для запуска, выполните команду в корневой директории проекта:

scrapy crawl pep

По окончанию работы парсера, будет созданно 3 файла в директории results/:

  • Список всех PEP с их статусами (в csv файле);
  • Сумарное количество статусов и общее количество PEP (в csv файле);
  • База данных sqlite со списком всех PEP и статусов.

Авторство

Асинхронный парсинг сайта документации PEP с помощью Scrapy и Alchemy написан мной (Будаевым Дмитрием).

Тесты написаны командой Яндекс.Практикума - за что им огромная благодарность!

Тестирование пройдено!

About

Парсер предназначен для сбора информации о нововведениях Python и количестве статусов документов PEP. Собирает все (Номера, Названия, Статусы) с https://peps.python.org/ и формирует два файла csv и записи в БД (sqlite) через SQLAlchemy. (Примеры есть в директории results/)

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages