Data Set Information:
该数据集被用于几个与anuran物种识别挑战相关的分类任务中。它是一个包含三列标签的多标签数据集。这个数据集是通过分割60个音频记录创建的,这些音频记录属于4个不同的科、8个属和10个种。每个音频对应一个样本(单个青蛙),记录ID也包含在一个额外的列中。我们使用谱熵和二元聚类方法来检测属于每个音节的音频帧。在Matlab中进行了图像分割和特征提取。分割后得到7195个音节,作为训练和测试分类器的实例。这些记录是在真实噪声条件下(背景声)就地收集的。有些物种来自马瑙斯亚马逊大学的校园,还有马塔尔的其他大学。¢巴西恩蒂卡,其中一人来自阿根廷科尔多瓦。记录以wav格式存储,采样频率为44.1kHz,分辨率为32位,这使我们能够分析高达22kHz的信号。从每个提取的音节中,使用44个三角形滤波器计算22个MFCC。这些系数在-1 a‰mfcc a‰1之间标准化。每个类的实例数为:
Bufonidae 68
Dendrobatidae 542
Hylidae 2165
Leptodactylidae 4420
Adenomera 4150
Ameerega 542
Dendropsophus 310
Hypsiboas 1593
Leptodactylus 270
Osteocephalus 114
Rhinella 68
Scinax 148
AdenomeraAndre 672
AdenomeraHylaedacta€| 3478
Ameeregatrivittata 542
HylaMinuta 310
HypsiboasCinerascens 472
HypsiboasCordobae 1121
LeptodactylusFuscus 270
OsteocephalusOophaa€| 114
Rhinellagranulosa 68
ScinaxRuber 148
Attribute Information:
Mel-frequency cepstral coefficients (MFCCs) are coefficients that collectively make up an mel-frequency cepstrum (MFC). Due to each syllable has different length, every row (i) was normalized acording to MFCCs_i/(max(abs(MFCCs_i))).
