相关搜索
您是不是在找?
今日排行
本周排行
本月排行
SegTrack v2视频分段数据集
SegTrack v2是视频分段数据集,包含14个视频序列;在每个视频的每个帧的多个对象上具有完整的像素级注释。...Action/Event Detection Classification
200M
741
robot
深度人脸提取数据集(Celeb-DF v2)
Celeb-DF(v2)数据集包含真实和DeepFake合成视频,其视频质量与在线传播的视频质量相似。Celeb-DF(v2)数据集比以前的Celeb-DF...Face Classification
417.84G
3503
robot
DiaRetDB1 V2.1 - 糖尿病视网膜病变数据库
DescriptionThe DiaRetDB1 is a public database for evaluating and benchmarkingdiabetic retinopathy detection algorithms....Medical Classification
137.43M
1053
Lappeenranta University of Technology
上海PM2.5 空气污染历史数据
上海PM2.5历史数据,数据包含测试数据以及训练数据,其中测试数据401条,训练数据52183条。...Environment,News,Environment Text
3M
1458
Team AI
1872至2020年的40000场国际足球比赛结果数据集
1872年至2020年的国际足球成绩超过40,000个国际足球比赛结果的最新数据集。该数据集包括从1972年的第一场正式比赛到2019年的41,5...Sports Classification
534K
1076
NET
人工智能语料库-Ubuntu对话语料库 包含2600万次对话数据
建立对话系统(人类可以与虚拟代理进行自然对话)是自然语言处理中的一项艰巨任务,也是许多正在进行的研究的重点。一些挑战包括...NLP Text
2.7G
3093
Rachael Tatman
Visual Question Answering V2.0 一个针对图像内容进行自然语言问答的数据集
Visual Question Answering (VQA) 是一个针对图像内容进行自然语言问答数据集,其中有关图像的自然语言问题和答案需要对图像内容...NLP Text
30.7G
956
VQA
人工智能语料库-欧洲议会议事平行语料库,包括21种欧洲语言
Europarl平行语料库摘自欧洲议会的议事程序。它包括21种欧洲语言的版本:罗马语(法语,意大利语,西班牙语,葡萄牙语,罗马尼亚...NLP Classification,Text
3.75G
1139
Philipp Koehn
MIT place2 dataset 场景图像数据集
Places2 是一个场景图像数据集,包含 1千万张 图片,400多个不同类型的场景环境,可用于以场景和环境为应用内容的视觉认知任务。...Aesthetics 2D Box
6.54G
2521
MIT
鲜花识别图像数据集 包含4242个鲜花图像
该数据集包含4242个鲜花图像。花卉图像识别数据收集基于数据flicr,谷歌图像,yandex图像。您可以使用此数据集识别照片中的植物...Plants 2D Box
224.86M
1127
Alexander Mamaev
CMU-Oxford Sculpture 2197件艺术作品数据集
CMU-Oxford Sculpture数据集包含143K图像,描绘了242位艺术家的2197件艺术作品。每张图片都为我们的CVPR论文中定义的每个3D形状...Art 2D Box
1.83G
971
牛津大学
LabelMe 12-50k 一个物体识别数据集
LabelMe 12-50k 数据集是一个物体识别数据集,总共包含 50000 张 JPEG 格式的图片,其中 40000 张为训练数据,10000张为测试数据...Action/Event Detection Classification
501.5M
1269
robot
亚马逊网站上的 548552个商品的信息数据
Amazon Product Co-purchasing Network metadata 数据集是一个从亚马逊网站上抓取的 548552 个 商品的信息数据(如:数据、音乐...Smart Retailing Classification
201.04M
1251
Stanford University
175种鸟类的数据集 包含23657个训练图像
175种鸟类的数据集。23657个训练图像,875个测试图像(每个物种5个)和875个验证图像(每个物种5个)。所有图像均为jpg格式的224...Environment,Environment 2D Box
1.88G
1368
Gerry
reddit 250万个帖子数据
美国 reddit 新闻网站最受欢迎的 2500 名发布者每家媒体 1000 个发布内容及评论数据集,来自订阅者的前2,500个子评价,从2013年8...NLP Text
437.79M
1398
reddit
WMT 2011 News Crawl 机器翻译数据
WMT2011NewsCrawldata 是一个自然语言翻译数据,从 Europarlcorpus 语料中提取得到,包括:French-English、Spanish-English、Ge...NLP Text
25.01G
824
Europarl
250万Reddit帖子数据
这是来自订阅者的前2500个子目录中的前1000个帖子的历史数据集,该数据是在2013年8月15日至20日之间从reddit中提取的。这是reddi...NLP Text
452.85M
749
Reddit
25.44M
1214
Rishabh Misra
THUYG-20 维吾尔语语音数据
摘要:免费的维吾尔语言数据库由CSLT @清华大学和新疆大学发布类别:演讲许可证:Apache License v.2.0介绍THUGY20是由语音和语...NLP Audio
6.12G
1461
清华大学
细胞核分割医学图像数据集,包含不同器官的21,000个细胞核
该数据集包含已标注的苏木精和伊红 (H&E) 图像,这是组织病理学中最常用的图像类型之一。这些图像是从癌症基因组图谱 (TCGA) 中...Medical Classification
135.56M
1842
appen