Skip to content

Latest commit

 

History

History
121 lines (92 loc) · 6.93 KB

README.md

File metadata and controls

121 lines (92 loc) · 6.93 KB

Favorite Anime Scraping(V2.5.2)

O que há de novo?

  • Suporte ao BetterAnime e Anihub
  • Corrigida falha de download das thumbs
  • Gera arquivos vazios agora exigem confirmação do usuário
  • CLI mais limpa
  • Agora cada arquivo gerado possui um nome exclusivo
  • Confirmação de resposta padrão
  • O texto da quantidade de favoritos se ajusta a quantidade de animes

Descrição

Favorite Anime Scraping, surgiu de um desejo meu de recuperar minha lista de animes, que está em um site onde costumava assisti-los. Por acreditar que outras pessoas poderiam ter o mesmo desejo, decidi compartilhar, criando um arquivo executável(.exe) para facilitar seu uso. O programa consegue obter o nome do anime, a URL de sua capa e até mesmo baixar a capa caso o usuário deseje. Com o tempo fui adicionando funcionalidades, corrigindo bugs, acrescentando novos sites suportados.

Tecnologias

Todo o projeto foi desenvolvido em Python, o Venv foi usado para criar um ambiente isolado de desenvolvimento e reduzir complexidade na geração do executável. A obtenção dos dados a partir do código do html foi feita usando o Beautiful Soup. Uma das opções oferecidas é o download das capas dos animes, nessa tarefa é usada o Requests. O programa foi construído usando o padrão de projeto Strategy, para facilitar a implicação de raspagem de novos sites.

Utilização

Executável(.exe)(Recomendado)
  1. Baixe o executável do arquivo executável (Download)
  • ⚠️: O Windows pode identificar o arquivo como malware, não se preocupe, o executável foi gerando com Pyinstaller a partir do código-fonte. Caso não se sinta confortável, é possível usar diretamente no código-fonte, veja aqui.
  1. Faça login no site(Better Anime ou Anihub), e navegue ate a pagina de favoritos

  2. Clique com o botão direito o mouse e depois em Inspecionar ou pressione F12 em seu teclado

  3. Uma tecla semelhante a esta surgira, clique em body e nos 3(três) pontos que surgirão a esquerda, conforme a imagem a baixo image

  4. Clique em Cópia e em seguida Copiar elemento image

  5. Abra o editor de texto que sua preferência, cole o código e salve o arquivo com a extensão .html

  • Dica: Recomendo que o executável e o HTML figuem na mesma pasta, esse é o local padrão onde um programa buscara o arquivo do site
  • Dica: O arquivo pode ser salvo com qualquer nome, mas recomendo que salve como favorites-list-page.html, esse é o nome padrão que o programa utiliza
  1. Abra o programa

  2. Caso tenha seguido as dicas dadas anteriormente, basta clicar Enter; do contrário sera necessário informar a rota até o html

  3. O programa lhe dará 4(quatro) opções, escolha uma delas, digite o número e pressione Enter. Você pode usar o programa quantas vezes quiser e testar cada opção

Via código-fonte Este método é uma alternativa para usuários de Linux ou Mac
Este procedimento não é recomendado
Para usar esse método é preciso possuir o **python** instalado e recomendado o uso do venv
  1. Clone o repositório
git clone git@github.com:JeffersonSimplicio/scraping-favorite-anime.git
  1. Entre no diretório gerado
cd scraping-favorite-anime
  1. Inicialize o ambiente virtual de desenvolvimento(Este passo não é obrigatório, mas é recomendado)
python3 -m venv .venv && source .venv/bin/activate
  1. Instale as dependências
pip install -r requirements.txt  
  1. Faça login no site(Better Anime ou Anihub), e navegue ate a pagina de favoritos

  2. Clique com o botão direito o mouse e depois em Inspecionar ou pressione F12 em seu teclado

  3. Uma tecla semelhante a esta surgira, clique em body e nos 3(três) pontos que surgirão a esquerda, conforme a imagem a baixo image

  4. Clique em Cópia e em seguida Copiar elemento image

  5. Abra o editor de texto que sua preferência, cole o código e salve o arquivo com a extensão .html

  • Dica: Recomendo que o executável e o HTML figuem na mesma pasta, esse é o local padrão onde um programa buscara o arquivo do site
  • Dica: O arquivo pode ser salvo com qualquer nome, mas recomendo que salve como favorites-list-page.html, esse é o nome padrão que o programa utiliza
  1. Inicie o programa
python3 main.py
  1. Caso tenha seguido as dicas dadas anteriormente, basta clicar Enter; do contrário sera necessário informar a rota até o html

  2. O programa lhe dará 4(quatro) opções, escolha uma delas, digite o número e pressione Enter. Você pode usar o programa quantas vezes quiser e testar cada opção

O que cada opção faz

  • 1 - Lista de nomes(txt): Gera um arquivo txt, com o nome de todos os animes favoritados no site
  • 2 - Lista com nome e URL da thumb(txt): Gera um arquivo txt, com o nome de todos os animes favoritados no site e ao lado a URL para sua capa
  • 3 - Lista com nome e URL da thumb(json): Gera um arquivo json, com uma lista de objetos contendo nome e URL da capa
  • 4 - Lista com nome e path da thumb(download da thumb)(json): Gera um arquivo json e também uma pasta thumbs, na pasta esta todas as capas dos animes favoritados, no json está uma lista de objetos contendo nome e o path para capa na pasta thumbs

Respondendo algumas duvidas

Em quais sites é possível usado o programa? A partir da versão 2.0, da suporte ao Better Anime e ao Anihub
Por que programa não faz a raspagem direto na web? O site usa reCaptcha dificultando tal tarefa, além disso, muitos usuários não se sentiriam confortáveis colocando suas credenciais.
É possível utilizar o programa também no Linux? Sim. Por enquanto um modo simples de usar se limita ao Windows, para usar o programa no Linux, é necessário usá-lo a partir do código-fonte diretamente. Tutorial para Linux