机器学习-参数选择与模型验证
在很多时候并不能直接将数据以可视化的形式表达出来,这就意味着无法以直观的方式检验模型的分类效果。本节介绍机器学…
在很多时候并不能直接将数据以可视化的形式表达出来,这就意味着无法以直观的方式检验模型的分类效果。本节介绍机器学…
上一节介绍了 pandas 中的索引,本节补充关于索引对齐的更多内容。在 numpy 中对两个数组做运算,如果…
pandas 相比 numpy ,一个很重要的特点就在于它引入了显式的索引机制。显式的索引在方便数据获取的同时…
之前详细介绍了 NumPy 和它的 ndarray 多维数组对象,为 Python 多维数组提供了高效的存储和…
和朴素贝叶斯一样,决策树(decision tree)也是一种简单但有效的分类算法。决策树的原理是将数据的分布…
在逻辑回归模型中介绍了决策边界的概念,一个好的模型决策边界要将两个类别完全区分开,例如以下这些决策边界都是合理…
上一节介绍了线性回归,线性回归是一种经典的回归算法,它可以根据一系列自变量来预测因变量的值。分类(classi…
贝叶斯分类源自概率论上著名的贝叶斯定理(Bayes's theorem)。设某事件的样本空间为 \\( S \…
线性回归(linear regression)应该是最简单的机器学习模型了。例如,以下是 1965~2021 …
聚类就是将样本划分为由具有类似的特征组成的多个类。在实际分析一堆数据时,往往会只给出这些数据的特征变量,但不知…
有时候仅需要通过几行 Python 代码来执行一些简单的功能,或测试某个库的基本使用方式。此时专门再编写一个脚…
前面介绍过,在创建数组时使用 dtype 参数可以指定数组元素的类型: np.zeros(4, …