以原始的裁判文书为输入,利用正则表达式、CRF 等构造文本解析模型,从被告人信息、犯罪事实信息、判决结果信息三个维度抽取出 40+相关字段并结构化到数据库中
以原始的裁判文书为输入,利用正则表达式、CRF 等构造文本解析模型,从被告人信息、犯罪事实信息、判决结果信息三个维度抽取出 40+相关字段并结构化到数据库中
以一人多罪,数罪并罚的多罪名预测任务为导向,建立以 Seq2Seq+attention、 Transformer 等为基础的序列生成模型,同时借鉴机器翻译任务的预测机制, 使用生成模型进行多罪名预测并取得良好效果,完成在 RCV1-V2、AAPD、CAIL、CJO 等多标签数据集上的模型训练及使用。
针对关系分类任务提出区分度信息的概念,通过实体向量相减的方法把空间中的实体方向信息转化为向量表示形式,并结合不同特征融合方法,完成在SemiEval 2010 Task8数据集上的模型训练及使用。 结果:负责模型搭建、训练、评估、使用。 对比MVRNN、FCM、SDP-LSTM、CR-CNN等传统关系分类模型,本模型的F1 值 84.8%。
最近一年贡献:0 次
最长连续贡献:0 日
最近连续贡献:0 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。