马宝森 (ma_baosen)

以原始的裁判文书为输入，利用正则表达式、CRF 等构造文本解析模型，从被告人信息、犯罪事实信息、判决结果信息三个维度抽取出 40+相关字段并结构化到数据库中

以一人多罪，数罪并罚的多罪名预测任务为导向，建立以 Seq2Seq+attention、 Transformer 等为基础的序列生成模型，同时借鉴机器翻译任务的预测机制，使用生成模型进行多罪名预测并取得良好效果，完成在 RCV1-V2、AAPD、CAIL、CJO 等多标签数据集上的模型训练及使用。

Python

1 3 0

机器学习算法总结+代码实现

1 2 0

针对关系分类任务提出区分度信息的概念，通过实体向量相减的方法把空间中的实体方向信息转化为向量表示形式，并结合不同特征融合方法，完成在SemiEval 2010 Task8数据集上的模型训练及使用。结果：负责模型搭建、训练、评估、使用。对比MVRNN、FCM、SDP-LSTM、CR-CNN等传统关系分类模型，本模型的F1 值 84.8%。

1 1 0

给定一篇裁判文书，在数据库中检索出若干篇与之相似度最高的裁判文书。

1 0 1

马宝森

热门项目

贡献度

动态（访客只能浏览公开仓库的动态）

马宝森

热门项目

贡献度

动态 （访客只能浏览公开仓库的动态）

搜索帮助

动态（访客只能浏览公开仓库的动态）