443浏览
0点赞

机器学习中的特征工程

特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。从本质上来讲,特征工程是一个表示和展现数据的过程。在实际工作中,特征工程旨在去除原始数据中的杂质和冗余,设计更高效的特征以刻画求解的问题与预测模型之间的关系
786浏览
0点赞

没有免费的午餐定理(No Free Lunch Theorem,简称 NFL)

我们经常听人谈论“什么算法更好”或者“A算法比B算法好”这样类似说法,其实这样的说法忽略了一个前提,那就是在解决某一个具体的问题(任务)上。为什么这么说呢,因为如果考虑所有潜在的问题,所有的学习算法都一
538浏览
1点赞

什么是欠拟合与过拟合?

我们希望通过机器学习学得的模型的泛化能力比较强,直白来说就是使得学得的模型不仅仅在在训练样本中工作得很好,更应该在新的样本中工作很好。通常我们把分类错误的样本数占总样本数的比例称为错误率(error rate)
528浏览
2点赞

7个重点的机器学习的方法

机器学习里面究竟有多少经典的算法呢?在这个部分我会简要介绍一下机器学习中的经典代表方法。这部分介绍的重点是这些方法内涵的思想,数学与实践细节不会在这讨论。  1、回归算法  在大部分机器学习课程中,回
446浏览
2点赞

机器学习涉及的7个范围

  其实,机器学习跟模式识别,统计学习,数据挖掘,计算机视觉,语音识别,自然语言处理等领域有着很深的联系。  从范围上来说,机器学习跟模式识别,统计学习,数据挖掘是类似的,同时,机器学习与其他领域的处
514浏览
0点赞

机器学习--SVM算法实现

一. 使用sklearn中的数据集做案例%matplotlibinlineimportnumpyasnpimportmatplotlib.pyplotaspltfromscipyimportstats#使用seaborn绘制默认值importseabornassns;sns.set()#随机来点数据fromsklearn.datasets.sampl
646浏览
2点赞

结构风险最小化 Structural Risk Minimization

结构风险最小化(Structural Risk Minimization)是指把函数集构造为一个函数子集序列,使各个子集按照VC维的大小排列;在每个子集中寻找最小经验风险,在子集间折中考虑经验风险和置信范围,取得实际风险的最小化。即SR
509浏览
3点赞

用Python实现机器学习算法——简单的神经网络

我们将实现一个简单的神经网络架构,将 2 维的输入向量映射成二进制输出值。我们的神经网络有 2 个输入神经元,含 6 个隐藏神经元隐藏层及 1 个输出神经元。
518浏览
0点赞

宽度模型 (wide model)

一种线性模型,通常有很多稀疏输入特征。我们之所以称之为“宽度模型”,是因为这是一种特殊类型的神经网络,其大量输入均直接与输出节点相连。与深度模型相比,宽度模型通常更易于调试和检查。虽然宽度模型无法通过
424浏览
0点赞

权重 (weight)

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。
607浏览
0点赞

验证集 (validation set)

数据集的一个子集,从训练集分离而来,用于调整超参数。与训练集和测试集相对。
488浏览
0点赞

非监督式机器学习 (unsupervised machine learning)

训练模型,以找出数据集(通常是无标签数据集)中的模式。非监督式机器学习最常见的用途是将数据分为不同的聚类,使相似的样本位于同一组中。例如,非监督式机器学习算法可以根据音乐的各种属性将歌曲分为不同的聚类
401浏览
0点赞

无标签样本 (unlabeled example)

包含特征但没有标签的样本。无标签样本是用于进行推断的输入内容。在半监督式和非监督式学习中,无标签样本在训练期间被使用。
1545浏览
0点赞

真正例率(true positive rate, 简称 TP 率)

是召回率的同义词,即:真正例率 = 真正例数 / ( 真正例数 + 假负例数 )真正例率是 ROC 曲线的 y 轴。
426浏览
0点赞
482浏览
0点赞
375浏览
0点赞
332浏览
0点赞
401浏览
0点赞

时间序列分析 (time series analysis)

机器学习和统计学的一个子领域,旨在分析时态数据。很多类型的机器学习问题都需要时间序列分析,其中包括分类、聚类、预测和异常检测。例如,您可以利用时间序列分析根据历史销量数据预测未来每月的冬外套销量。
591浏览
0点赞
相关搜索
今日排行
本周排行
本月排行
免费注册体验
联系我们