YAO's: https://github.com/liuyaox/named_entity_recognition (Keras)
【Great】Named entity recognition serie - 2018 (Keras)
包括NER各种模型:CRF, Seq2Seq, LSTM+CRF, LSTM + Char Embedding, Residual LSTM + ELMo, NER with Bert
YAO:
【Great】NLP命名实体识别(NER)开源实战教程 - 2019 (Keras)
介绍模型:BiLSTM + CRF, IDCNN + CRF 实现模型:BiLSTM (无CRF)
YAO:
【Great】https://github.com/qiufengyuyi/sequence_tagging
Article: 中文NER任务实验小结报告——深入模型实现细节
信息抽取:抽取出特定的事件或事实信息,帮助我们将海量内容自动分类、提取和重构
冠亚季军分享:预训练模型彻底改变了NLP,但也不能忽略传统方法带来的提升 - 2019
冠军:GloVe + Pretrained(Flair/ELMo/BERT/XLNet) + LSTM + CNN + CRF
亚军:Bert + BiLSTM + CRF
季军:Transformer + BiLSTM + CRF
【Great】https://github.com/cdjasonj/datagrand (Keras & Tensorflow)
Rank 6
输入:Embedding有2*3+1=7种:(char, bichar) * (Word2Vec, GloVe, FastText) + <char, ELMo>,每种有4种维度dim=(150, 200, 250, 300)
中间:
输出:TimeDistributed(Dense) + CRF
YAO: Detailed Notes
特点1:数据不Padding!也没有使用Masking! 按Batch训练模型,每一Batch内输入具有相同的Seq_length;应用时同样,相同Seq_length的输入一并应用。
特点2:使用ELMo,且融合了Word2Vec, GloVe, FastText三种静态Embedding的特点。
HERE HERE HERE HERE HERE
https://github.com/lonePatient/daguan_2019_rank9 (Pytorch)
Rank 9
模型1:BERT + LSTM + CRF
模型2:BERT + LSTM + MDP + CRF
模型3:BERT + LSTM + SPAN
【Great】https://github.com/renjunxiang/daguan_2019 (PyTorch)
自行训练BERT,而非直接使用训练好的BERT,过程详细值得学习
https://github.com/LG-1/video_music_book_datasets
9632条视频/音乐/书籍标注数据
主要以 BiLSTM + CRF 为主
关于CRF和Loss推导和实现细节,以及解码细节,请参考:04_Probabilistic_Graphical_Model
Neural Architectures for Named Entity Recognition - CMU2016
BiLSTM + CRF
HSCRF: Hybrid semi-Markov CRF for Neural Sequence Labeling - USTC2018
Code: https://github.com/ZhixiuYe/HSCRF-pytorch (PyTorch)
https://github.com/stephen-v/zh-NER-keras (Keras)
Chinese:基于keras的BiLstm与CRF实现命名实体标注 - 2018
YAO: OK
基本信息:中文实体 基于字,采用BIO标注集,实体有Person/Location/Organization,则tags共有3*2+1=7个,模型结构: Embedding -> BiLSTM -> CRF
数据处理:对于X,as normal,向量化编码,补零截断;对于Y,向量化编码(不同tag转化为0-6),随后也要补零截断!注意,Padding的mask_value,X与Y要相同(待研究?)
Library版本:当(tensorflow=1.10.0, keras=2.2.0, keras-contrib=0.0.2)时CRF没问题
https://github.com/UmasouTTT/keras_bert_ner (Keras)
中文实体,模型结构:BERT + BiLSTM + CRF,数据和其他信息同上(zh-NER-keras)
YAO: OK Detailed Notes
使用keras-bert,基于chinese_L-12_H-768_A-12加载BERT模型,直接融入模型并且参与训练(Finetuning)
【Great】https://github.com/AidenHuen/BERT-BiLSTM-CRF (Keras)
BERT-BiLSTM-CRF的Keras版实现 预训练模型为chinese_L-12_H-768_A-12.zip,使用BERT客户端和服务器bert-serving-server和bert-serving-client
YAO: HERE HERE HERE HERE HERE
https://github.com/sgrvinod/a-PyTorch-Tutorial-to-Sequence-Labeling (PyTorch)
模型结构:Language Model + BiLSTM + CRF,使用了Highway Networks
Article: 一文完全搞懂序列标注算法
https://github.com/fangwater/Medical-named-entity-recognition-for-ccks2017 (PyTorch)
A LSTM+CRF model for the seq2seq task for Medical named entity recognition in ccks2017
YAO: PyTorch实现的CRF
https://github.com/sgrvinod/a-PyTorch-Tutorial-to-Sequence-Labeling (PyTorch)
LM + BiLSTM + CRF
Artichle: NLP | 一文完全搞懂序列标注算法
https://github.com/llcing/BiLSTM-CRF-ChineseNER.pytorch (PyTorch)
PyTorch implement of BiLSTM-CRF for Chinese NER
https://github.com/yanwii/ChinsesNER-pytorch (PyTorch)
基于 BiLSTM + CRF 的中文命名实体识别
https://github.com/chenxiaoyouyou/Bert-BiLSTM-CRF-pytorch (PyTorch)
基于BERT做字嵌入的BiLSTM-CRF序列标注模型
Pytorch BiLSTM + CRF做NER - 2019 (PyTorch)
NLP实战-中文命名实体识别 - 2019 (PyTorch)
https://github.com/phychaos/transformer_crf (Tensorflow)
Transformer + CRF
https://github.com/Determined22/zh-NER-TF (Tensorflow)
A very simple BiLSTM-CRF model for Chinese Named Entity Recognition 中文命名实体识别
https://github.com/shiyybua/NER (Tensorflow)
BiRNN + CRF
Article: 基于深度学习的命名实体识别详解 - 2017
https://github.com/pumpkinduo/KnowledgeGraph_NER (Tensorflow)
中文医学知识图谱命名实体识别,模型有:BiLSTM+CRF, Transformer+CRF
【Great】https://github.com/baiyyang/medical-entity-recognition (Tensorflow)
包含传统的基于统计模型(CRF)和基于深度学习(Embedding-Bi-LSTM-CRF)下的医疗数据命名实体识别
https://github.com/Nrgeup/chinese_semantic_role_labeling (Tensorflow)
基于 Bi-LSTM 和 CRF 的中文语义角色标注
https://github.com/dkarunakaran/entity_recoginition_deep_learning (Tensorflow)
Article: Entity extraction using Deep Learning based on Guillaume Genthial work on NER - 2018
【Great】CRF Layer on the Top of BiLSTM 1-8 - 2017 (Chainer)
YAO: 详细介绍Emission Score和Transition Score,以及Path Score, All Path Score和Loss
bi-LSTM + CRF with character embeddings for NER and POS - 2017
Code: https://github.com/guillaumegenthial/tf_ner (Tensorflow)
Chinese: 命名实体识别(biLSTM+crf)
YAO:
接CRF是为了Model label sequence jointly, instead of decoding each label independently.
CRF所需要的各种特征:转移概率矩阵G,直接是模型待学习的参数;发射概率矩阵H,由模型编码部分(如LSTM)完成对X的编码
https://github.com/nlpdz/Medical-Named-Entity-Rec-Based-on-Dilated-CNN
基于膨胀卷积神经网络(Dilated Convolutions)训练好的医疗命名实体识别工具
LAN: 逐层改进的基于标签注意力机制的网络
Code: https://github.com/Nealcly/BiLSTM-LAN (PyTorch)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。