BERT预训练tensorflow模型转换为pytorch模型
作者:互联网
在Bert的预训练模型中,主流的模型都是以tensorflow的形势开源的。但是huggingface在Transformers中提供了一份可以转换的接口(convert_bert_original_tf_checkpoint_to_pytorch.py)。
但是如何在windows的IDE中执行呢?
- 首先,需要安装transformers (可以挂国内清华、豆瓣源之类的加速)
pip install transformers
- 其次,下载tf版本的bert预训练模型goole的预训练模型,下载的模型文件解压后如下:
- 写tf2torch.py脚本且放在模型同目录中,脚本内容如下:
import transformers.models.bert.convert_bert_original_tf_checkpoint_to_pytorch as con
con.convert_tf_checkpoint_to_pytorch(
r'.\bert_model.ckpt',
r'.\bert_config.json',
r'.\pytorch_bert.bin'
)
convert_tf_checkpoint_to_pytorch中三个参数分别是:bert模型名称、config文件地址,输出的pytorch文件保存地址
- 然后运行tf2torch.py文件得到如下文件,多了一个pytorch_bert.bin文件
- 最后注意:可以忽略TensorFlow checkpoint(以bert_model.ckpt开头的三个文件),但是一定要保留配置文件(bert_config.json)和词汇表文件(vocab.txt),因为PyTorch模型也需要这些文件。
标签:BERT,bert,模型,checkpoint,pytorch,文件,tf 来源: https://www.cnblogs.com/edkong/p/16032595.html