Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
augmentation_generation		augmentation_generation
chatgpt_predictions		chatgpt_predictions
embeddings_generation		embeddings_generation
mlm		mlm
prompt_generation		prompt_generation
.gitignore		.gitignore
AblationFinetunedAugmentationBert128CasedExperimentRelevantIrelevant.ipynb		AblationFinetunedAugmentationBert128CasedExperimentRelevantIrelevant.ipynb
AblationFinetunedAugmentationBert512CasedExperimentRelevantIrelevant.ipynb		AblationFinetunedAugmentationBert512CasedExperimentRelevantIrelevant.ipynb
AblationFinetunedAugmentationRobertaCasedExperimentRelevantIrelevant.ipynb		AblationFinetunedAugmentationRobertaCasedExperimentRelevantIrelevant.ipynb
AblationFinetunedBert128CasedExperimentRelevantIrelevant.ipynb		AblationFinetunedBert128CasedExperimentRelevantIrelevant.ipynb
AblationFinetunedBert512CasedExperimentRelevantIrelevant.ipynb		AblationFinetunedBert512CasedExperimentRelevantIrelevant.ipynb
AblationFinetunedRoBertaCasedExperimentRelevantIrelevant.ipynb		AblationFinetunedRoBertaCasedExperimentRelevantIrelevant.ipynb
AblationSimpleAugmentationBertCasedExperimentRelevantIrelevant.ipynb		AblationSimpleAugmentationBertCasedExperimentRelevantIrelevant.ipynb
AblationSimpleAugmentationRobertaExperimentRelevantIrelevant.ipynb		AblationSimpleAugmentationRobertaExperimentRelevantIrelevant.ipynb
AblationSimpleAugmentationSciBertCasedExperimentRelevantIrelevant.ipynb		AblationSimpleAugmentationSciBertCasedExperimentRelevantIrelevant.ipynb
AblationSimpleBertCasedExperimentRelevantIrelevant.ipynb		AblationSimpleBertCasedExperimentRelevantIrelevant.ipynb
AblationSimpleRoBertaCasedExperimentRelevantIrelevant.ipynb		AblationSimpleRoBertaCasedExperimentRelevantIrelevant.ipynb
AblationSimpleSciBertCasedExperimentRelevantIrelevant.ipynb		AblationSimpleSciBertCasedExperimentRelevantIrelevant.ipynb
Baseline.ipynb		Baseline.ipynb
Dataset_div2_final.json		Dataset_div2_final.json
Dataset_educ_1.1.json		Dataset_educ_1.1.json
Dataset_unlabelled.json		Dataset_unlabelled.json
EvaluateChatGptPrompt.ipynb		EvaluateChatGptPrompt.ipynb
FinetunedAugmentationBert128CasedExperimentRelevantIrelevant.ipynb		FinetunedAugmentationBert128CasedExperimentRelevantIrelevant.ipynb
FinetunedAugmentationBert512CasedExperimentRelevantIrelevant.ipynb		FinetunedAugmentationBert512CasedExperimentRelevantIrelevant.ipynb
FinetunedAugmentationRobertaCasedExperimentRelevantIrelevant.ipynb		FinetunedAugmentationRobertaCasedExperimentRelevantIrelevant.ipynb
FinetunedBert128CasedExperimentRelevantIrelevant.ipynb		FinetunedBert128CasedExperimentRelevantIrelevant.ipynb
FinetunedBert512CasedExperimentRelevantIrelevant.ipynb		FinetunedBert512CasedExperimentRelevantIrelevant.ipynb
FinetunedRoBertaCasedExperimentRelevantIrelevant.ipynb		FinetunedRoBertaCasedExperimentRelevantIrelevant.ipynb
GenerateChatGptPrompt.ipynb		GenerateChatGptPrompt.ipynb
LICENSE		LICENSE
README.md		README.md
SimpleAugmentationBertCasedExperimentRelevantIrelevant.ipynb		SimpleAugmentationBertCasedExperimentRelevantIrelevant.ipynb
SimpleAugmentationRobertaExperimentRelevantIrelevant.ipynb		SimpleAugmentationRobertaExperimentRelevantIrelevant.ipynb
SimpleAugmentationSciBertCasedExperimentRelevantIrelevant.ipynb		SimpleAugmentationSciBertCasedExperimentRelevantIrelevant.ipynb
SimpleBertCasedExperimentRelevantIrelevant.ipynb		SimpleBertCasedExperimentRelevantIrelevant.ipynb
SimpleRoBertaCasedExperimentRelevantIrelevant.ipynb		SimpleRoBertaCasedExperimentRelevantIrelevant.ipynb
SimpleSciBertCasedExperimentRelevantIrelevant.ipynb		SimpleSciBertCasedExperimentRelevantIrelevant.ipynb
SimpleSemiSupervisedBertCasedExperimentRelevantIrelevant.ipynb		SimpleSemiSupervisedBertCasedExperimentRelevantIrelevant.ipynb
Statistics.ipynb		Statistics.ipynb
chatgpt_api_with_tree.py		chatgpt_api_with_tree.py
chatgpt_api_without_tree.py		chatgpt_api_without_tree.py
requirements.txt		requirements.txt

Repository files navigation

CFComments

This repository contains the code as well the datasets associated with the task of predicting relevant and irrelevant comments to a blog post on Codeforces. The dataset contains 19 labelled comment threads(Dataset_educ_1.1.json contains 16 Educational Rounds, Dataset_div2_final contains 3 Div Rounds) and 1131 unlabelled comment threads(Dataset_unlabelled.json).

In the mlm folder, you can find the experiments associated with finetuning the models. In prompt generation folder you can find the input and output to be used by ChatGPT API(chatgpt_api_with_tree.py / chatgpt_api_without_tree.py) while in chatgpt_predictions you can find the results.

In order to run the experiments you need to pip install requirements.txt and pytorch. The finetuned models can be downloaded from https://drive.google.com/drive/folders/1X8PtijZw9y9FEhpPtlJUjQyjr-QyIj_d?usp=share_link.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CFComments

About

Releases

Packages

Languages

License

Arkin1/CodeforcesComments

Folders and files

Latest commit

History

Repository files navigation

CFComments

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages