AI百科
one-hot 编码 (one-hot encoding)
回复:0  浏览:432

一种稀疏向量,其中:

  • 一个元素设为 1。

  • 所有其他元素均设为 0。

one-hot 编码常用于表示拥有有限个可能值的字符串或标识符。例如,假设某个指定的植物学数据集记录了 15000 个不同的物种,其中每个物种都用独一无二的字符串标识符来表示。在特征工程过程中,您可能需要将这些字符串标识符编码为 one-hot 向量,向量的大小为 15000。