An Unofficial Implementation for Distilling Task-Specific Knowledge from BERT into Simple Neural Networks

Document Classification

Dataset

dcard + ptt 共 20 萬篇文章
這個 repo 為各種 pretrained model 的分類任務結果

Environement

Python 3.7
pip install -r requirements.txt

training

1. Train gensim word2vec

see word2vec/train.py

2. 更改資料集路徑、欄位等

see dataset.py

3. set config

See config.py

4. train bert model

default RoBERTa
python main.py --model=bert

5. train distilled LSTM

set config in config.py distil_hparams
python main.py --model=bert

結果

Roberta + LSTM 3 layers

Roberta 3 epoch acc. : 90 %
Distill 3 epoch LSTM :

'data': {
    'maxlen': 350
},
'lstm_model': {
    'freeze': False,
    'embed_size': 250,
    'hid_size': 256,
    'num_layers': 2,
    'dropout': 0.3,
    'with_attn': False,
    'num_classes': 16,
},
'bert_model': {
    'num_classes': 16,
    'ckpt': 'logs/roberta/version_6/epoch=1.ckpt'
}

Reference

(Distilling Task-Specific Knowledge from BERT into Simple Neural Networks)[https://arxiv.org/pdf/1903.12136.pdf]

Name	Name	Last commit message	Last commit date
Latest commit aqweteddy performance Sep 15, 2022 be00bc7 · Sep 15, 2022 History 6 Commits
logs	logs	init ok	Jun 16, 2020
model	model	init ok	Jun 16, 2020
word2vec	word2vec	init	Jun 14, 2020
.gitignore	.gitignore	init ok	Jun 16, 2020
README.md	README.md	readme	Jun 16, 2020
config.py	config.py	init ok	Jun 16, 2020
dataset.py	dataset.py	tain_distil	Jun 15, 2020
main.py	main.py	init ok	Jun 16, 2020
performance.PNG	performance.PNG	performance	Sep 15, 2022
requirements.txt	requirements.txt	init ok	Jun 16, 2020
train_bert.py	train_bert.py	init ok	Jun 16, 2020
train_distil.py	train_distil.py	init ok	Jun 16, 2020
train_simple.py	train_simple.py	init	Jun 14, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

An Unofficial Implementation for Distilling Task-Specific Knowledge from BERT into Simple Neural Networks

Dataset

Environement

training

1. Train gensim word2vec

2. 更改資料集路徑、欄位等

3. set config

4. train bert model

5. train distilled LSTM

結果

Roberta + LSTM 3 layers

Reference

About

Releases

Packages

Languages

aqweteddy/BERTDistilForClassification

Folders and files

Latest commit

History

Repository files navigation

An Unofficial Implementation for Distilling Task-Specific Knowledge from BERT into Simple Neural Networks

Dataset

Environement

training

1. Train gensim word2vec

2. 更改資料集路徑、欄位等

3. set config

4. train bert model

5. train distilled LSTM

結果

Roberta + LSTM 3 layers

Reference

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages