代码拉取完成,页面将自动刷新
同步操作将从 gitclebeg/nlp-sentiment 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
##基于自然语言处理的情感分析工具
- pom.xml 文件中 lingpipe-core jar 没办法从中央仓库下载已经集成到 libs 目录里面,而 pom.xml 中只能使用绝对路径,请注意修改
- pom.xml 文件中 hanlp jar 包可能需要手动下载,然后添加到 maven 仓库
专注某一个领域,比如军事、经济、政府等,利用互联网上的数据。
- 首先训练一个专业领域与非专业其它领域的二分类器。
- 然后在对新的样本判断是否是该领域的
- 训练一个情感分类器,判断这个样本是该领域的正面信息还是负面信息。
government,others
####注意:有时候不用中文分词器效果更好,一定要测试。
###1、基于词典和贝叶斯模型的情感分析 主程序:eshore.cn.it.sentiment.Sentiment 此类通过 data/Sentiment_Dictionary中的正负面词语建立模型。
测试: eshore.cn.it.sentiment.SentimentTest 通过这个类就可以测试 data/500trainblogxml中的某个文件夹下面的博客的情感。
###2、直接利用lingpipe的情感分析模块测试情感分析 直接运行程序: eshore.cn.it.sentiment.ChinesePolarityBasic 程序就会通过: data/polarity_corpus/hotel_reviews/train2训练 然后自动测试: data/polarity_corpus/hotel_reviews/test2 最后给出程序测试结果。
# Test Cases=4000
# Correct=3541
% Correct=0.88525
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。