Select Language

AI社区

AI技术百科

441浏览
0点赞
378浏览
0点赞
1433浏览
0点赞

真正例率(true positive rate, 简称 TP 率)

是召回率的同义词,即:真正例率 = 真正例数 / ( 真正例数 + 假负例数 )真正例率是 ROC 曲线的 y 轴。
356浏览
0点赞

无标签样本 (unlabeled example)

包含特征但没有标签的样本。无标签样本是用于进行推断的输入内容。在半监督式和非监督式学习中,无标签样本在训练期间被使用。
432浏览
0点赞

非监督式机器学习 (unsupervised machine learning)

训练模型,以找出数据集(通常是无标签数据集)中的模式。非监督式机器学习最常见的用途是将数据分为不同的聚类,使相似的样本位于同一组中。例如,非监督式机器学习算法可以根据音乐的各种属性将歌曲分为不同的聚类
518浏览
0点赞

验证集 (validation set)

数据集的一个子集,从训练集分离而来,用于调整超参数。与训练集和测试集相对。
374浏览
0点赞

权重 (weight)

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。
568浏览
2点赞

结构风险最小化 Structural Risk Minimization

结构风险最小化(Structural Risk Minimization)是指把函数集构造为一个函数子集序列,使各个子集按照VC维的大小排列;在每个子集中寻找最小经验风险,在子集间折中考虑经验风险和置信范围,取得实际风险的最小化。即SR
468浏览
2点赞

7个重点的机器学习的方法

机器学习里面究竟有多少经典的算法呢?在这个部分我会简要介绍一下机器学习中的经典代表方法。这部分介绍的重点是这些方法内涵的思想,数学与实践细节不会在这讨论。  1、回归算法  在大部分机器学习课程中,回
482浏览
1点赞

什么是欠拟合与过拟合?

我们希望通过机器学习学得的模型的泛化能力比较强,直白来说就是使得学得的模型不仅仅在在训练样本中工作得很好,更应该在新的样本中工作很好。通常我们把分类错误的样本数占总样本数的比例称为错误率(error rate)
712浏览
0点赞

没有免费的午餐定理(No Free Lunch Theorem,简称 NFL)

我们经常听人谈论“什么算法更好”或者“A算法比B算法好”这样类似说法,其实这样的说法忽略了一个前提,那就是在解决某一个具体的问题(任务)上。为什么这么说呢,因为如果考虑所有潜在的问题,所有的学习算法都一
我要发帖
机器学习术语表
2021-05-15 22:22:51加入圈子
  • 171

    条内容
机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。