Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[DOI] Possibilitar de registrar DOI para arquivos HTML #173

Closed
robertatakenaka opened this issue May 29, 2019 · 10 comments
Closed

[DOI] Possibilitar de registrar DOI para arquivos HTML #173

robertatakenaka opened this issue May 29, 2019 · 10 comments
Assignees

Comments

@robertatakenaka
Copy link
Member

robertatakenaka commented May 29, 2019

Possibilitar registrar DOI para artigo (HTML) que não possui DOI

Eu, como [tipo de cargo/ usuário / papel em sistema], gostaria que o DOI Manager pudesse gerar a partir do PID os DOI de artigos registrados em HTML que não possuem indicação de DOI, então os artigos da BAR - v8n4 teriam seus DOI registrados no CrossRef.

Histórico

Os registros da base ISIS, de documentos HTML, não contém o DOI, cadastrado. O DOI era formado pelo prefixo fornecido pelo CrossRef + PID (se o artigo foi registrado quando ahead o DOI tem que ser mantido com o PID do ahead).

O sistema de registro do CrossRef não dá um feedback instantâneo. Os pedidos de registro ficam numa fila. O único jeito que sabemos se um DOI realmente foi registrado é acessando o link do DOI.

Os problemas são:

  • Não sabemos qual é o DOI de documentos HTML porque não fica registrado na base (ele pode ter sido formado pelo PID do ahead ou não)
  • Não sabemos se o DOI já foi ou não registrado

Critérios de aceitação

Conseguir sistematicamente registrar DOI de documentos HTML

Anexos

N/A

Referências

N/A

@joffilyfe joffilyfe self-assigned this Mar 3, 2020
@robertatakenaka robertatakenaka changed the title [DOI] Possibilitar de gerar doi para arquivos HTML [DOI] Possibilitar de registrar DOI para arquivos HTML Mar 6, 2020
@joffilyfe
Copy link
Contributor

@robertatakenaka, iniciei esta atividade realizando uma análise prévia sobre quais problemas nós possuímos na base de dados do Articlemeta que são relacionados diretamente com o DOI dos artigos. O resultado preliminar pode ser visto em https://github.com/joffilyfe/scielo-experiments/blob/master/notebook-analise-checagem-de-doi-scl.ipynb.

Agora é preciso definir o que de fato faremos com os problemas encontrados, uma vez que ficou relativamente fácil encontrar problemas e sistematizar essa varredura.

@robertatakenaka
Copy link
Member Author

@joffilyfe
Em 3 - Resolução de DOI, o DOI pode ter sido gerado com o PID do ahead ou não. No caso do documento ter os 2 PIDs, sugiro testar com os 2 PIDs.
Acrescente esta informação no "pontos foram elencados"

No mais, sugiro, abrir issues ou cards para tratar do que foi concluído.

@gustavofonseca
Copy link
Contributor

@robertatakenaka, iniciei esta atividade realizando uma análise prévia sobre quais problemas nós possuímos na base de dados do Articlemeta que são relacionados diretamente com o DOI dos artigos. O resultado preliminar pode ser visto em https://github.com/joffilyfe/scielo-experiments/blob/master/notebook-analise-checagem-de-doi-scl.ipynb.

Agora é preciso definir o que de fato faremos com os problemas encontrados, uma vez que ficou relativamente fácil encontrar problemas e sistematizar essa varredura.

Excelente análise, parabéns =]

A @robertatakenaka colocou um ponto importante sobre o possível uso do PID do ahead.

Aqueles 1.338 documentos com prefixo SciELO, armazenados na base de dados mas que não foram depositados no Crossref, nós podemos depositar todos tão logo a gente tenha uma lista dos PIDs v2 separados por quebra de linha.

@joffilyfe
Copy link
Contributor

@joffilyfe
Em 3 - Resolução de DOI, o DOI pode ter sido gerado com o PID do ahead ou não. No caso do documento ter os 2 PIDs, sugiro testar com os 2 PIDs.
Acrescente esta informação no "pontos foram elencados"

No mais, sugiro, abrir issues ou cards para tratar do que foi concluído.

Obrigado @robertatakenaka, já estou iniciando o reprocessamento dos nossos dados.

Excelente análise, parabéns =]

A @robertatakenaka colocou um ponto importante sobre o possível uso do PID do ahead.

Aqueles 1.338 documentos com prefixo SciELO, armazenados na base de dados mas que não foram depositados no Crossref, nós podemos depositar todos tão logo a gente tenha uma lista dos PIDs v2 separados por quebra de linha.

@gustavofonseca está na mão https://drive.google.com/open?id=1bVFCOueY0MtlMTwYHZmbQlQLCcwaSdvc. Esta lista foi gerada a partir do comando cat resultados/doi.csv | grep ";0;0" | grep "10.1590" | cut -d ";" -f1, também poderíamos salvar a tabela que está exposta no notebook.

@gustavofonseca
Copy link
Contributor

Boa, valeu ;)

@gustavofonseca
Copy link
Contributor

Aqui está um relatório, em csv, sobre o resultado do depósito dos 1338 documentos no Crossref. Spoiler: apenas 75 foram depositados com sucesso.

@joffilyfe
Copy link
Contributor

Aqui está um relatório, em csv, sobre o resultado do depósito dos 1338 documentos no Crossref. Spoiler: apenas 75 foram depositados com sucesso.

No caso destes outros 1263, nós devemos encaminhar para que o setor de produção analise cada caso?

@gustavofonseca
Copy link
Contributor

Sim, aparentemente todos os outros dependerão de análise e ação junto aos editores. Estou agrupando os problemas no documento https://docs.google.com/document/d/1zhZBePSnDcu99IUQThOcDNpEyi-vgthcpGTPJIdpLCs/edit?usp=sharing (privado para @scielo.org).

@joffilyfe
Copy link
Contributor

@ednilson com base nas dicas que você me deu eu consegui chegar nos casos de DOI repetidos. Atualizei o notebook e adicionei a lista de casos no documento produzido pelo @gustavofonseca.

@gustavofonseca e @robertatakenaka eu acredito que já fizemos o que poderia ser feito de forma automatizada. Agora dependemos que a produção resolva os casos que precisam de intervenção manual. O que vocês acham de fecharmos a issue e abrir uma nova (em qual repo?) para que possamos auxiliar a produção nas resoluções dos problemas?

@joffilyfe joffilyfe added the help wanted Extra attention is needed label Mar 31, 2020
@robertatakenaka
Copy link
Member Author

O que vocês acham de fecharmos a issue e abrir uma nova (em qual repo?)

Acho que será resolvido em scieloorg/Web#713

@joffilyfe joffilyfe removed the help wanted Extra attention is needed label Apr 24, 2020
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants