CommonsenseQA

The codebase for project commonsenseqa.

Dataset Statistics

Train	Dev	Test
9741	1221	1140

Data Sample

{
    "answerKey": "B",
    "id": "70701f5d1d62e58d5c74e2e303bb4065",
    "question": {
        "choices": [
            {
                "label": "A",
                "text": "bunk"
            },
            {
                "label": "B",
                "text": "reading"
            },
            {
                "label": "C",
                "text": "think"
            },
            {
                "label": "D",
                "text": "fall asleep"
            },
            {
                "label": "E",
                "text": "meditate"
            }
        ],
        "stem": "What is someone doing if he or she is sitting quietly and his or her eyes are moving?"
    }
}

Data Prepare

|--data
    |
    |--csqa
    |    |
    |    |---QTokenSplit
    |    |        |
    |    |        |--train_qtoken_split.jsonl
    |    |        |--train_qtoken_split_EASY.jsonl
    |    |        |--dev_qtoken_split.jsonl
    |    |        |--dev_qtoken_split_EASY.jsonl
    |    |        |--test_qtoken_split_no_answers.jsonl
    |    |
    |    |---RandSplit
    |             |
    |             |--train_rand_split.jsonl
    |             |--train_rand_split_EASY.jsonl
    |             |--dev_rand_split.jsonl
    |             |--dev_rand_split_EASY.jsonl
    |             |--test_rand_split_no_answers.jsonl
    |--bert
         |--bert-base-uncased-vocab.txt
         |--bert-base-uncased.tar.gz
         |--bert-large-uncased-vocab.txt
         |--bert-large-uncased.tar.gz

Train

on docker

# pull docker
docker pull shuailongliang/csqa:latest
# start training 
nvidia-docker run --rm -v "/home/long/csqa:/mnt/csqa"  shuailongliang/csqa:latest train -s /mnt/csqa/models/20190415-base /mnt/csqa/experiments/bert.jsonnet --include-package csqa

on local GPU machine

allennlp train experiments/bert.jsonnet -s models/20190415-base  --include-package csqa

Predict

on docker

nvidia-docker run --rm -v "/home/long/csqa:/mnt/csqa"  shuailongliang/csqa:latest predict /mnt/csqa/models/20190415-base/model.tar.gz  /mnt/csqa/data/csqa/RandSplit/test_rand_split_no_answers.jsonl --output-file /mnt/csqa/models/20190415-base/test_rand_split_prediction_logits.jsonl --cuda-device 0 --predictor csqa --include-package csqa

on local GPU machine

allennlp predict models/20190415-base/model.tar.gz data/csqa/RandSplit/test_rand_split_no_answers.jsonl --output-file models/20190415-base/test_rand_split_prediction_logits.jsonl --cuda-device 0 --predictor csqa --include-package csqa

Evaluate

# transform logits to answer label
python scripts/get_prediction.py  models/20190415-base/test_rand_split_prediction_logits.jsonl models/20190415-base/test_rand_split_predictions.csv
# use gold label to calculate the metrics
python evaluator/evaluator.py -qa data/csqa/RandSplit/test_rand_split_answers.jsonl -p models/20190415-base/test_rand_split_predictions.csv -o dev_rand_split_score.json

Baseline Result

Model	train acc	dev acc	test acc
bert-base	0.8000205318	0.5757575758	0.53
bert-large	0.8878965199	0.6216216216	0.567
CoS-E	-	-	0.582
italic numbers are from leaderboard.

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
.vscode		.vscode
csqa		csqa
evaluator		evaluator
experiments		experiments
scripts		scripts
.dockerignore		.dockerignore
.gitignore		.gitignore
.pylintrc		.pylintrc
Dockerfile		Dockerfile
README.md		README.md
pytest.ini		pytest.ini
requirements.txt		requirements.txt
setup.py		setup.py

Shuailong/csqa

Folders and files

Latest commit

History

Repository files navigation

CommonsenseQA

Dataset Statistics

Data Sample

Data Prepare

Train

on docker

on local GPU machine

Predict

on docker

on local GPU machine

Evaluate

Baseline Result

About

Resources

Stars

Watchers

Forks

Languages