Асинхронный парсинг на Scrapy + Alchemy

Парсер предназначен для сбора информации о нововведениях Python и количестве статусов документов PEP.

Собирает все (Номера, Названия, Статусы) с https://peps.python.org/ и формирует два файла csv и записи в БД (sqlite) через SQLAlchemy. (Примеры есть в директории results/)

Подготовка к запуску проекта

Для начала, клонируйте репозиторий:

git clone https://github.com/budaevdigital/scrapy_parse_pep.git

Перейдите в скаченную директорию проекта:

cd scrapy_parse_pep

Создайте и активируйте виртуальное окружение:

python -m venv venv && source env/bin/activate

Установите все необходимые зависимости для работы проекта:

pip install -r requirements.txt

Запуск парсера

Для запуска, выполните команду в корневой директории проекта:

scrapy crawl pep

По окончанию работы парсера, будет созданно 3 файла в директории results/:

Список всех PEP с их статусами (в csv файле);
Сумарное количество статусов и общее количество PEP (в csv файле);
База данных sqlite со списком всех PEP и статусов.

Авторство

Асинхронный парсинг сайта документации PEP с помощью Scrapy и Alchemy написан мной (Будаевым Дмитрием).

Тесты написаны командой Яндекс.Практикума - за что им огромная благодарность!

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
_assert		_assert
pep_parse		pep_parse
results		results
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
pytest.ini		pytest.ini
readme.md		readme.md
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Асинхронный парсинг на Scrapy + Alchemy

Подготовка к запуску проекта

Запуск парсера

Авторство

About

Releases

Packages

Languages

License

stelmakhdigital/scrapy_parse_pep

Folders and files

Latest commit

History

Repository files navigation

Асинхронный парсинг на Scrapy + Alchemy

Подготовка к запуску проекта

Запуск парсера

Авторство

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages