AI技术百科
小小程序员
2021-05-15 22:28:06
分类数据 (categorical data)
一种特征,拥有一组离散的可能值。以某个名为 house style
的分类特征为例,该特征拥有一组离散的可能值(共三个),即 Tudor, ranch, colonial
。通过将 house style
表示成分类数据,相应模型可以学习 Tudor
、ranch
和 colonial
分别对房价的影响。
有时,离散集中的值是互斥的,只能将其中一个值应用于指定样本。例如,car maker
分类特征可能只允许一个样本有一个值 (Toyota
)。在其他情况下,则可以应用多个值。一辆车可能会被喷涂多种不同的颜色,因此,car color
分类特征可能会允许单个样本具有多个值(例如 red
和 white
)。
分类特征有时称为离散特征。
与数值数据相对。