GitHub

Leveraging Summary Guidance on Medical Report Summarization

Yunqi Zhu, Xuebing Yang, Yuanyuan Wu, Wensheng Zhang

Download fine-tuned checkpoints through: OneDrive or BaiduPan

generate "ECHO.json", "DISCHARGE.json", "RADIOLOGY.json" to './dataset'

# change line 26 in the file, replace it with the path of your mimic-iii dataset (i.e. csv files).
python dataset_to_json.py

generate "ECHO_indices.json", "ECHO_split.json", etc. to './dataset'

python dataset_split_TrainEvalTest.py

add extoracle for train set for "ECHO_split.json" etc. to './dataset'

python dataset_add_extoracle.py

sampling oracle, reference from train set, to train, eval and test

python dataset_sample_augsum.py

fine-tune BART, T5-large, and BERT2BERT

# (1) set the "sampleprompt" in the config_*.json file as "sampleprom2", if you want to use oracle guidance.
#     as "sampleprom3", if you want to use reference guidance
# (2) if you want to use original bart to fine-tune, set "use_sampleprompt" in the config_*.json file as false
python run_bart.py config_discharge.json
python run_bart.py config_echo.json
python run_bart.py config_radiology.json

# Note that the followings only implemented original fine-tuning on t5-large and bert2bert 
python run_t5.py config_dis_t5.json
python run_t5.py config_echo_t5.json
python run_t5.py config_rad_t5.json
python run_bert2bert.py config_dis_bert2bert.json
python run_bert2bert.py config_echo_bert2bert.json
python run_bert2bert.py config_rad_bert2bert.json

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
dataset		dataset
section_titles		section_titles
.gitignore		.gitignore
case-study-output.py		case-study-output.py
config_dis.json		config_dis.json
config_dis_bert2bert.json		config_dis_bert2bert.json
config_dis_t5.json		config_dis_t5.json
config_echo.json		config_echo.json
config_echo_bert2bert.json		config_echo_bert2bert.json
config_echo_t5.json		config_echo_t5.json
config_rad.json		config_rad.json
config_rad_bert2bert.json		config_rad_bert2bert.json
config_rad_t5.json		config_rad_t5.json
dataset_add_extoracle.py		dataset_add_extoracle.py
dataset_sample_augsum.py		dataset_sample_augsum.py
dataset_split_TrainEvalTest.py		dataset_split_TrainEvalTest.py
dataset_to_json.py		dataset_to_json.py
generation_utils.py		generation_utils.py
modeling_bart.py		modeling_bart.py
modeling_bertabs.py		modeling_bertabs.py
modeling_t5.py		modeling_t5.py
modeling_utils.py		modeling_utils.py
readme.md		readme.md
requirements.txt		requirements.txt
rouge_metric.py		rouge_metric.py
run_bart.py		run_bart.py
run_bert2bert.py		run_bert2bert.py
run_t5.py		run_t5.py
trainer.py		trainer.py
trainer_seq2seq.py		trainer_seq2seq.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Leveraging Summary Guidance on Medical Report Summarization

About

Releases

Packages

Contributors 2

Languages

zhuyunqi96/medreportsum

Folders and files

Latest commit

History

Repository files navigation

Leveraging Summary Guidance on Medical Report Summarization

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages