Select Language

AI社区

公开数据集

相关搜索
您是不是在找?
今日排行
本周排行
本月排行
语法面部表情数据集,A-Z语法面部表情的名称和规格(目标或数据点) Data Set Information:面部表情的自动分析已广泛应用于不同的研究领域,如生物特征识别或情感分析。手语领域特别重视面部表情,...NLP Classification
19.2M 594
OCR图像数据集,可用于OCR系统分类算法的基准测试 Data Set Information:Data Type: GrayScale Image The image dataset can be used to benchmark classification algorithm for...NLP Classification
76.7M 709
Nettalk语料库数据集 包括20008个带重音的对齐字母和语音表示法 该数据集是由Terry Sejnowski,现在在索尔克研究所和加利福尼亚大学圣地亚哥的基准集合。该数据集是与普林斯顿大学的查尔斯·罗...N/A N/A
175K 700
facens nlp语料库分类 用于FACENS DS 课程的第一个 NLP 活动的基础数据集 Passado como dataset para atividade 01 de NLP do curso Ciência de Dados da FACENS.Mantido integralmente no Kaggle, mesm...NLP,Health,Multiclass Classification Classification
0.89M 551
Google News vectors negative Google News vectors negative...Clothing and Accessories Classification
3.64G 434
词袋模型的描述数据 词袋模型模型下,像是句子或是文件这样的文字可以用一个袋子装着这些词的方式表现,这种表现方式不考虑文法以及词的顺序。最近词...NLP,Business Classification
208.03M 435
NLP用于判断用户说脏话的词库数据 NLP用于判断用户说脏话的词库数据...Others Classification
3K 626
预训练的 word2vec 模型,英语维基百科数据 # DatasetThis dataset was created by RabidBear# ContentsIt contains the following files:...Others Classification
3.2G 429
fastText 预训练词向量数据集 fastText Pre-trained word vectors English...Others Classification
8.49G 490
用于命名实体识别的标注语料库,使用BIO和POS标签注释的语料库 Annotated (BIO) Corpus for Named Entity RecognitionThis corpus is made up of texts of news sites and built specifically...Business,Arts and Entertainment,Literature,Languages Classification
2.21M 524
Jester Jokes数据集 一个数据集,包含超过一百万行以及每行的评级 这个数据集包含超过一百万个笑话和用户对每个笑话的评分...NLP,Text Data Classification
44.46M 468
0M 408
伯特大全字掩蔽 Internet,Software,NLP Classification
2559.42M 421
来自Goodreads的2018年最佳图书数据 来自Goodreads的2018年最佳图书数据...NLP,Image Data,Tabular Data,Literature Classification
81.57M 734
文献计量学 # Dataset 这个数据集由 Daniel S. Hain 创建 # 内容包含以下文件:...NLP Classification
9.78M 384
孟加拉手写数字(dot npz格式) 孟加拉语手写体数字(点npz格式)该文件包含NumtaDB:孟加拉语手写数字(点npz格式)。...Image Data Classification
268.7M 562
ATIS数据集清洁重新点燃,ATIS数据集的清理和平衡分割 ATIS DataSetThe ATIS dataset is a standard benchmark dataset widely used as an intent classification and slot filling ta...NLP,Classification,Earth and Nature,Computer Science,Health Classification
1.02M 446
Dmoztools分类数据, 包含艺术、商业、计算机、游戏、健康、科学购物、社会等 # DatasetThis dataset was created by Patanjali ChintalapatiReleased under Other (specified in description)# ContentsIt c...NLP,Text Mining,Websites Classification
279.6M 426
Machado de Assis的116部小说和其他文本数据 este repositório estão contidas 116 obras de ficção e outros textos de Machado de Assis nos formatos pdf e txt nas c...NLP,Business,Literature,Art,Brazil Classification
40.38M 673
命名实体识别(NER)从临床提取感兴趣的实体(例如,疾病名称、药物名称 Problem StatementClinical studies often require detailed patients’ information documented in clinical narratives. Named...NLP,Health,Health Conditions,Model Comparison,Statistical Analysis,Artificial Intelligence Classification
249.01M 370