BERTPlagarismDetectionCNN

Al crear el dataset fue nesesario agregar pading para convertir los documentos a tamaños similares sin empbargo aplicamos una mascara para que el modelo no aprenda de este ruido

Cosas a corregir:

Al tokenizar los archivos, asegurarnos de estar ommitiendo los comentarios

Name		Name	Last commit message	Last commit date
Latest commit History 52 Commits
__pycache__		__pycache__
fire14-source-code-training-dataset		fire14-source-code-training-dataset
Model.py		Model.py
README.md		README.md
RNN.h5		RNN.h5
RNN.keras		RNN.keras
Siamese.keras		Siamese.keras
createDatasets.py		createDatasets.py
embedding.py		embedding.py
evaluation.py		evaluation.py
main.py		main.py
output2.txt		output2.txt
plag_samples.txt		plag_samples.txt
preprocessData.py		preprocessData.py
relationsMatrix.py		relationsMatrix.py
test.py		test.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

BERTPlagarismDetectionCNN

About

Releases

Packages

Contributors 3

Languages

JR-espacial/BERTPlagarismDetectionCNN

Folders and files

Latest commit

History

Repository files navigation

BERTPlagarismDetectionCNN

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages