This action will force synchronization from OpenDocCN/ailearning, which will overwrite any changes that you have made since you forked the repository, and can not be recovered!!!
Synchronous operation will process in the background and will refresh the page when finishing processing. Please be patient.
组织构建
第三方站长
地址A: xxx (欢迎留言,我们完善补充)
docker pull apachecn0/ailearning
docker run -tid -p <port>:80 apachecn0/ailearning
# 访问 http://localhost:{port} 查看文档
pip install apachecn-ailearning
apachecn-ailearning <port>
# 访问 http://localhost:{port} 查看文档
npm install -g ailearning
ailearning <port>
# 访问 http://localhost:{port} 查看文档
apachecn@163.com
欢迎任何人参与和完善: 一个人可以走的很快,但是一群人却可以走的更远
补充
模块 | 章节 | 类型 | 负责人(GitHub) | |
---|---|---|---|---|
机器学习实战 | 第 1 章: 机器学习基础 | 介绍 | @毛红动 | 1306014226 |
机器学习实战 | 第 2 章: KNN 近邻算法 | 分类 | @尤永江 | 279393323 |
机器学习实战 | 第 3 章: 决策树 | 分类 | @景涛 | 844300439 |
机器学习实战 | 第 4 章: 朴素贝叶斯 | 分类 |
@wnma3mz @分析 |
1003324213 244970749 |
机器学习实战 | 第 5 章: Logistic回归 | 分类 | @微光同尘 | 529925688 |
机器学习实战 | 第 6 章: SVM 支持向量机 | 分类 | @王德红 | 934969547 |
网上组合内容 | 第 7 章: 集成方法(随机森林和 AdaBoost) | 分类 | @片刻 | 529815144 |
机器学习实战 | 第 8 章: 回归 | 回归 | @微光同尘 | 529925688 |
机器学习实战 | 第 9 章: 树回归 | 回归 | @微光同尘 | 529925688 |
机器学习实战 | 第 10 章: K-Means 聚类 | 聚类 | @徐昭清 | 827106588 |
机器学习实战 | 第 11 章: 利用 Apriori 算法进行关联分析 | 频繁项集 | @刘海飞 | 1049498972 |
机器学习实战 | 第 12 章: FP-growth 高效发现频繁项集 | 频繁项集 | @程威 | 842725815 |
机器学习实战 | 第 13 章: 利用 PCA 来简化数据 | 工具 | @廖立娟 | 835670618 |
机器学习实战 | 第 14 章: 利用 SVD 来简化数据 | 工具 | @张俊皓 | 714974242 |
机器学习实战 | 第 15 章: 大数据与 MapReduce | 工具 | @wnma3mz | 1003324213 |
Ml项目实战 | 第 16 章: 推荐系统(已迁移) | 项目 | 推荐系统(迁移后地址) | |
第一期的总结 | 2017-04-08: 第一期的总结 | 总结 | 总结 | 529815144 |
当然我知道,第一句就会被吐槽,因为科班出身的人,不屑的吐了一口唾沫,说傻X,还评论 Andrew Ng 的视频。。
我还知道还有一部分人,看 Andrew Ng 的视频就是看不懂,那神秘的数学推导,那迷之微笑的英文版的教学,我何尝又不是这样走过来的?? 我的心可能比你们都痛,因为我在网上收藏过上10部《机器学习》相关视频,外加国内本土风格的教程: 7月+小象 等等,我都很难去听懂,直到有一天,被一个百度的高级算法分析师推荐说: 《机器学习实战》还不错,通俗易懂,你去试试??
我试了试,还好我的Python基础和调试能力还不错,基本上代码都调试过一遍,很多高大上的 "理论+推导",在我眼中变成了几个 "加减乘除+循环",我想这不就是像我这样的程序员想要的入门教程么?
很多程序员说机器学习 TM 太难学了,是的,真 TM 难学,我想最难的是: 没有一本像《机器学习实战》那样的作者愿意以程序员 Coding 角度去给大家讲解!!
最近几天,GitHub 涨了 300颗 star,加群的200人, 现在还在不断的增加++,我想大家可能都是感同身受吧!
很多想入门新手就是被忽悠着收藏收藏再收藏,但是最后还是什么都没有学到,也就是"资源收藏家",也许新手要的就是 MachineLearning(机器学习) 学习路线图。没错,我可以给你们的一份,因为我们还通过视频记录下来我们的学习过程。水平当然也有限,不过对于新手入门,绝对没问题,如果你还不会,那算我输!!
视频怎么看?
【免费】数学教学视频 - 可汗学院 入门篇
概率 | 统计 | 线性代数 |
---|---|---|
可汗学院(概率) | 可汗学院(统计学) | 可汗学院(线性代数) |
机器学习视频 - ApacheCN 教学版
AcFun | B站 |
优酷 | 网易云课堂 |
【免费】机器/深度学习视频 - 吴恩达
机器学习 | 深度学习 |
---|---|
吴恩达机器学习 | 神经网络和深度学习 |
-- 待更新
-- 待更新
目录结构:
切分(分词)
词性标注
命名实体识别
句法分析
WordNet可以被看作是一个同义词词典
词干提取(stemming)与词形还原(lemmatization)
TensorFlow 2.0学习网址
学习过程中-内心复杂的变化!!!
自从学习NLP以后,才发现国内与国外的典型区别:
1. 对资源的态度是完全相反的:
1) 国内: 就好像为了名气,举办工作装逼的会议,就是没有干货,全部都是象征性的PPT介绍,不是针对在做的各位
2)国外: 就好像是为了推动nlp进步一样,分享者各种干货资料和具体的实现。(特别是: python自然语言处理)
2. 论文的实现:
1) 各种高大上的论文实现,却还是没看到一个像样的GitHub项目!(可能我的搜索能力差了点,一直没找到)
2)国外就不举例了,我看不懂!
3. 开源的框架
1)国外的开源框架: tensorflow/pytorch 文档+教程+视频(官方提供)
2) 国内的开源框架: 额额,还真举例不出来!但是牛逼吹得不比国外差!(MXNet虽然有众多国人参与开发,但不能算是国内开源框架。基于MXNet的动手学深度学习(http://zh.d2l.ai & https://discuss.gluon.ai/t/topic/753)中文教程,已经由沐神(李沐)以及阿斯顿·张讲授录制,公开发布(文档+第一季教程+视频)。)
每一次深入都要去翻墙,每一次深入都要Google,每一次看着国内的说: 哈工大、讯飞、中科大、百度、阿里多牛逼,但是资料还是得国外去找!
有时候真的挺恨的!真的有点瞧不起自己国内的技术环境!
当然谢谢国内很多博客大佬,特别是一些入门的Demo和基本概念。【深入的水平有限,没看懂】
第一部分 入门介绍
第二部分 机器翻译
第三部分 篇章分析
第四部分 UNIT-语言理解与交互技术
文本分类是指标记句子或文档,例如电子邮件垃圾邮件分类和情感分析。
下面是一些很好的初学者文本分类数据集。
有关更多信息,请参阅帖子: 单标签文本分类的数据集。
情感分析
比赛地址: https://www.kaggle.com/c/word2vec-nlp-tutorial
通过AUC 来评估模型的效果
语言建模涉及开发一种统计模型,用于预测句子中的下一个单词或一个单词中的下一个单词。它是语音识别和机器翻译等任务中的前置任务。
它是语音识别和机器翻译等任务中的前置任务。
下面是一些很好的初学者语言建模数据集。
新词发现
句子相似度识别
文本纠错
mage字幕是为给定图像生成文本描述的任务。
下面是一些很好的初学者图像字幕数据集。
机器翻译是将文本从一种语言翻译成另一种语言的任务。
下面是一些很好的初学者机器翻译数据集。
机器翻译
问答是一项任务,其中提供了一个句子或文本样本,从中提出问题并且必须回答问题。
下面是一些很好的初学者问题回答数据集。
数据集: 我如何获得问答网站的语料库,如Quora或Yahoo Answers或Stack Overflow来分析答案质量?
语音识别是将口语的音频转换为人类可读文本的任务。
下面是一些很好的初学者语音识别数据集。
文档摘要是创建较大文档的简短有意义描述的任务。
下面是一些很好的初学者文档摘要数据集。
文档理解会议(DUC)任务。 在哪里可以找到用于文本摘要的良好数据集?
命名实体识别
文本摘要
如果您希望更深入,本节提供了其他数据集列表。
欢迎贡献者不断的追加
最近无意收到群友推送的链接,发现得到大佬高度的认可,并在热心的推广
在此感谢:
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。