🧵 `silk`: Unsupervised Domain Adaptation for Keyphrase Generation using Citation Contexts

This repository contains the code for 🧵 silk, a method that relies on extracting silver-standard keyphrases from citation contexts to generate synthetic labeled data for domain adaptation. We applied our method on distinct scientific domains —namely, Natural Language Processing, Astrophysics and Paleontology— thereby creating new adaptation data for each domain. We also provide three human-labeled test sets to assess the performance of keyphrase generation models across these domains.

The 🧵 silk dataset is available from https://huggingface.co/datasets/taln-ls2n/silk

Citation

If you use the silk dataset or this code, please cite the following items:

@misc{boudin2024unsuperviseddomainadaptationkeyphrase,
      title={Unsupervised Domain Adaptation for Keyphrase Generation using Citation Contexts}, 
      author={Florian Boudin and Akiko Aizawa},
      year={2024},
      eprint={2409.13266},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2409.13266}, 
}

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
assets		assets
baselines		baselines
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
_baselines.sh		_baselines.sh
_evaluate.sh		_evaluate.sh
_fine-tune.sh		_fine-tune.sh
_inference.sh		_inference.sh
evaluate2.py		evaluate2.py
fine-tuning.py		fine-tuning.py
inference-keybart.py		inference-keybart.py
inference2.py		inference2.py
self-supervised.py		self-supervised.py
test-datasets.ipynb		test-datasets.ipynb
test-sign.ipynb		test-sign.ipynb
test_bias.ipynb		test_bias.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🧵 `silk`: Unsupervised Domain Adaptation for Keyphrase Generation using Citation Contexts

Citation

About

Releases

Packages

Languages

License

boudinfl/silk

Folders and files

Latest commit

History

Repository files navigation

🧵 silk: Unsupervised Domain Adaptation for Keyphrase Generation using Citation Contexts

Citation

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

🧵 `silk`: Unsupervised Domain Adaptation for Keyphrase Generation using Citation Contexts

Packages