GitHub Trendingのページをスクレイピングして、RSSリーダー(Inoreader等)で読み込めるATOMを提供する.
- GitHub Trending: https://github.com/trending
- GitHub Pages: https://aazw.github.io/github-trending-feeds/
このプロジェクトは2024/12/24にスタートした。
GitHub Actionsで各言語のTrendingの最新情報を取得する.
-
Daily
- 毎日 15:00 UTC
- 24:00 JST
- 毎日 15:00 UTC
-
Weekly
- 毎週月曜日 16:00 UTC
- 25:00 JST
- 16:00 UTCなのは、Dailyの分と処理が重ならないようにするため
- 毎週月曜日 16:00 UTC
-
Monthly
- 毎月1日 17:00 UTC
- 26:00 JST
- 17:00 UTCなのは、Dailyの分と、時にWeeklyの分とも処理が重ならないようにするため
- 毎月1日 17:00 UTC
pip install -r requirements.txt
python apps/scrape.py
--language go \
--period daily \
--output ./daily.atom
$ python apps/scrape.py --help
2024-12-26 14:20:01,055 - /workspaces/github-trending-feeds/apps/scrape.py:176 - INFO - start app
Usage: scrape.py [OPTIONS]
Options:
--language TEXT [required]
--period [daily|weekly|monthly]
[required]
--output TEXT
--atom_updated_date TEXT
--verbose
--help Show this message and exit.
2024-12-26 14:20:01,056 - /workspaces/github-trending-feeds/apps/scrape.py:194 - INFO - app finished
$ python apps/scrape.py --language go --period "daily" --atom-updated-date "$(date -I)T00:00:00" --output test.atom
- -1 ... Unknown Error
- 0 ... 正常終了
- 11 ... InvalidURL
- 12 ... ConnectionError
- 13 ... タイムアウト系 (Timeout, ConnectTimeout, ReadTimeout)
- 14 ... TooManyRedirects
- 15 ... ステータスコード 400系
- 16 ... ステータスコード 500系
- 17 ... ステータスコード 400系、500系以外
- 18 ... そのほかrequests系のエラー
- 31 ... FileNotFoundError
- 32 ... IsADirectoryError
- 33 ... PermissionError
- 34 ... OSError