机器学习系统设计 完整版 PDF_人工智能教程百度网盘

资源名称:机器学习系统设计 完整版 PDF

第1章 Python机器学习入门  1
1.1  梦之队:机器学习与Python  1
1.2  这本书将教给你什么(以及不会教什么)  2
1.3  遇到困难的时候怎么办  3
1.4  开始  4
1.4.1  NumPy、SciPy和Matplotlib简介  4
1.4.2  安装Python  5
1.4.3  使用NumPy和SciPy智能高效地处理数据  5
1.4.4  学习NumPy  5
1.4.5  学习SciPy  9
1.5  我们第一个(极小的)机器学习应用  10
1.5.1  读取数据  10
1.5.2  预处理和清洗数据  11
1.5.3  选择正确的模型和学习算法  12
1.6  小结  20
第2章 如何对真实样本分类  22
2.1  Iris数据集  22
2.1.1  第一步是可视化  23
2.1.2  构建第一个分类模型  24
2.2  构建更复杂的分类器  28
2.3  更复杂的数据集和更复杂的分类器  29
2.3.1  从Seeds数据集中学习  29
2.3.2  特征和特征工程  30
2.3.3  最邻近分类  30
2.4  二分类和多分类  33
2.5  小结  34
第3章 聚类:寻找相关的帖子  35
3.1  评估帖子的关联性  35
3.1.1  不应该怎样  36
3.1.2  应该怎样  36
3.2  预处理:用相近的公共词语个数来衡量相似性  37
3.2.1  将原始文本转化为词袋  37
3.2.2  统计词语  38
3.2.3  词语频次向量的归一化  40
3.2.4  删除不重要的词语  41
3.2.5  词干处理  42
3.2.6  停用词兴奋剂  44
3.2.7  我们的成果和目标  45
3.3  聚类  46
3.3.1  K均值  46
3.3.2  让测试数据评估我们的想法  49
3.3.3  对帖子聚类  50
3.4  解决我们最初的难题  51
3.5  调整参数  54
3.6  小结  54
第4章 主题模型  55
4.1  潜在狄利克雷分配(LDA)  55
4.2  在主题空间比较相似度  59
4.3  选择主题个数  64
4.4  小结  65
第5章 分类:检测劣质答案  67
5.1  路线图概述  67
5.2  学习如何区分出优秀的答案  68
5.2.1  调整样本  68
5.2.2  调整分类器  68
5.3  获取数据  68
5.3.1  将数据消减到可处理的程度  69
5.3.2  对属性进行预选择和处理  70
5.3.3  定义什么是优质答案  71
5.4  创建第一个分类器  71
5.4.1  从k邻近(kNN)算法开始  71
5.4.2  特征工程  72
5.4.3  训练分类器  73
5.4.4  评估分类器的性能  74
5.4.5  设计更多的特征  74
5.5  决定怎样提升效果  77
5.5.1  偏差?方差及其折中  77


资源截图:

image.png

本文来自投稿,不代表小白之家立场,如若转载,请注明出处:https://www.u3s7.cn/219.html

免责声明: 如无特殊标注或说明,本站提供的一切软件、源码、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络收集整理,版权争议与本站无关。如果您喜欢该程序和内容,请支持正版,得到更好的正版服务。我们非常重视版权问题,如有侵权请联系邮箱artemblinov.27@list.ru处理。敬请谅解!
(0)
上一篇 2020年10月24日 18:04
下一篇 2020年10月24日 18:04

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注


Warning: error_log(/home/www.u3s7.cn/wp-content/plugins/spider-analyser/#log/log-2216.txt): failed to open stream: Permission denied in /home/www.u3s7.cn/wp-content/plugins/spider-analyser/spider.class.php on line 3014