代码拉取完成,页面将自动刷新
@Author: hanhan
Configs文件夹下的文件,Utils下为生成数据文件
文件名 | 功能 |
---|---|
config.py | 包含分析数据的路径,用于配置功能与位置 |
分析文本.txt | 文本内容文件 |
分词.txt | 被分成单词的文本内容 |
词频.txt | 包含单词和单词统计数量的文件 |
自定义词表.txt | 自定义的不想被切开的词语 |
停用词表.txt | 填入词在统计词频时禁用 |
词云背景.png | 词云生成的形状图片 |
生成词云图.png | 词云结果图 |
根目录下的文件
文件名 | 函数名 | 功能 |
---|---|---|
WordCut.py | WordCut | 读取分析文本.txt分词得分词.txt文件 |
WordCount.py | Count | 通过分词文件得词频.txt文件 |
DrawWordCloud.py | ImgDraw | 根据词云背景.png图案绘制生成词云图.png |
pip3 install -r requirements.txt
如果报没有nltk_data的错误请先安装nltk_data,安装好放到运行环境目录下就好,安装可能有问题,可以网上搜或留言要压缩包
Mac用户记得没有文字包先下载msyh.ttc文字包放到本地
样例为养生新闻的词云图
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。