GitHub

Finetune Bert LM Head

Based on experiment assumption, we are given finetuned Bert models on various tasks. However, these models have classifiers different than a LM Head. To make these models suitable for later data generation, we take off the original model classfier, initialize a LM Head on the model, freeze the encoder weights, and then finetune LM Head on Wikipedia dataset.

Directory of original Bert model: ../Berts/sst_base_l12/
Directory to put the new model with LM Head: Berts_LM/sst_1ep/

Path of operation: /rscratch/bohan/ZQBert/zero-shot-qbert/direct_generate

python train_head.py --model_name_or_path ../Berts/sst_base_l12/ \
--output_dir Berts_LM/sst_4ep/ \
--do_train \
--num_train_epochs 4 \
--max_seq_length 512

Generate Dataset

Second step is to use the above model to generate dataset. The new model with LM Head is used to generate sentences. The original Bert model is used to generate labels. You can adjust batch_num and batch_size to change the size of dataset.

Directory of original Bert model: ../Berts/sst_base_l12/
Directory to put the new model with LM Head: Berts_LM/sst_1ep/
Directory to put generated dataset: gen_data/sst/
Name of new generated data: sst_ep1_8700.tsv

Path of operation: /rscratch/bohan/ZQBert/zero-shot-qbert/direct_generate

python direct_generate.py --LM_model Berts_LM/sst_1ep/ \
--TA_model ../Berts/sst_base_l12/ \
--output_dir gen_data/sst/ \
--file_name sst_ep1_8700 \
--batch_num 87 \
--batch_size 100 \
--random True

Quantize Model

After generating dataset, we quantize the original Bert model.

Directory of original Bert model: Berts/sst_base_l12/
Directory to put generated dataset: direct_generate/gen_data/sst/
Name of train data: sst_ep1_8700.tsv
Name of val data: sst_1000.tsv
Directory to put quantized model: results/sst_ep1_8700/

Path of operation: /rscratch/bohan/ZQBert/zero-shot-qbert

python quant_run_glue.py --task_name SST-2 \
--do_lower_case \
--data_dir direct_generate/gen_data/sst/ \
--train_name sst_ep1_8700 \
--val_name sst_1000_random \
--model Berts/sst_base_l12/ \
--learning_rate 2e-5 \
--weight_bit 4 \
--activation_bit 4 \
--output_dir results/sst_ep1_8700/

Evaluation

After quantization, we can evaluate on the real data to see the performance.

Directory to put the real data: ../GLUE-baselines/glue_data/SST-2/
Directory to put quantized model: results/sst_ep1_8700/
Fake empty directory to get the code running: empty

Path of operation: /rscratch/bohan/ZQBert/zero-shot-qbert

python run_glue_old.py --task_name SST-2 \
--do_eval True \
--do_lower_case \
--data_dir ../GLUE-baselines/glue_data/SST-2/ \
--model results/sst_ep1_8700/ \
--output_dir empty

Quantize Bert with Original Trianing Data

Directory to put the real data: ../GLUE-baselines/glue_data/MNLI/
Directory of original Bert model: Berts/mnli_base_l12/
Directory to put quantized model: results/mnli_w_data/

Path of operation: /rscratch/bohan/ZQBert/zero-shot-qbert

python run_glue_old.py --task_name MNLI \
--do_lower_case \
--data_dir ../GLUE-baselines/glue_data/MNLI/ \
--model Berts/mnli_base_l12/ \
--output_dir results/mnli_w_data

Generate Cross Domain Dataset

python direct_generate.py --LM_model Berts_LM/sst_1ep/ \
--TA_model ../Berts/mnli_base_l12/ \
--output_dir gen_data/mnli/ \
--file_name mnli_model_rte_data \
--batch_num 24 \
--batch_size 100 \
--generate_label True

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
config		config
direct_generate		direct_generate
transformer		transformer
LICENSE		LICENSE
README.md		README.md
THIRD PARTY OPEN SOURCE SOFTWARE NOTICE		THIRD PARTY OPEN SOURCE SOFTWARE NOTICE
parallel_run_glue.py		parallel_run_glue.py
quant_run_glue.py		quant_run_glue.py
requirements.txt		requirements.txt
run_glue.py		run_glue.py
run_glue_old.py		run_glue_old.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

config

config

direct_generate

direct_generate

transformer

transformer

LICENSE

LICENSE

README.md

README.md

THIRD PARTY OPEN SOURCE SOFTWARE NOTICE

THIRD PARTY OPEN SOURCE SOFTWARE NOTICE

parallel_run_glue.py

parallel_run_glue.py

quant_run_glue.py

quant_run_glue.py

requirements.txt

requirements.txt

run_glue.py

run_glue.py

run_glue_old.py

run_glue_old.py

Repository files navigation

Finetune Bert LM Head

Generate Dataset

Quantize Model

Evaluation

Quantize Bert with Original Trianing Data

Generate Cross Domain Dataset

About

Releases 1

Packages

Contributors 2

Languages

License

BohanZhai/zero_shot_quant

Folders and files

Latest commit

History

Repository files navigation

Finetune Bert LM Head

Generate Dataset

Quantize Model

Evaluation

Quantize Bert with Original Trianing Data

Generate Cross Domain Dataset

About

Resources

License

Stars

Watchers

Forks

Languages