Select Language

AI社区

公开数据集

相关搜索
您是不是在找?
今日排行
本周排行
本月排行
医患对话 任务简介:针对互联网医患在线对话问诊的记录,该任务的目标是同时预测症状的归一化标签和类别标签。症状有共300余种归一化后的...NLP,Medical Classification
5.25M 726
GitHub NLP分析的标题和描述 超过800万个GitHub发布了标题和描述 Over 8 million GitHub issue titles and descriptions from 2017. Prepared from instructions at How To Create Data Products...NLP,Software Classification
2.85G 609
手写验证 XAI-AND数据集是一个公开的笔迹验证数据集,由15518个“AND”图像片段提取自CEDAR Letter Dataset[12],由1567位作家撰写。每个...OCR/Text Detection Image Caption
31.23M 358
苏州科技大学超话情感分析 1000条数据 苏州科技大学超话情感分析内容情感得分分析结果#随手拍#苏农苏农0.436778733消极有话快说0.687524065积极马上第14周了,书本费不...NLP Text
0.09M 400
新闻分类数据集sample(thu) 新闻分类数据集sample(thu)...NLP Text
12M 904
百科类问答json版,含有150万个预先过滤过的、高质量问题和答案 本数据集含有150万个预先过滤过的、高质量的百科类问题和答案。数据集总共有492个类别,其中频率达到或超过10次的类别有434个。...NLP Text
1.5G 1029
Symphony Lake数据集,来自无人驾驶地面车辆的500多万张图像捕捉了非结构化的自然环境 Symphony Lake Dataset consists of 121 visual surveys of a lakeshore over more than three years in Metz, France. Unique f...Computer Science,Programming Classification
6.6G 671
街景房屋编号(SVHN)数据集,可用于对象识别算法的真实图像数据集 SVHN是一个用于开发机器学习和对象识别算法的真实图像数据集,对数据预处理和格式化的要求最低。它可以被视为与MNIST在风格上相...NLP,OCR/Text Detection,Business,Image Search 2D Box
3.91G 1744
NEOCR:自然环境OCR数据集,包含659幅真实世界的图像 NEOCR数据集包含659幅真实世界的图像,带有5238个带注释的边界框(文本字段)。这些图像是由多人独立于数据集拍摄的,因此数据集...NLP,Arts and Entertainment 2D Box,Classification
1.31G 750
街景文本(SVT)数据集,来自谷歌街景的图像数据 The Street View Text (SVT) dataset was harvested from Google Street View. Image text in this data exhibits high variabil...NLP,Energy 2D Box,Classification
112.7M 1270
KAIST场景文本数据库 KAIST场景文本数据集包含3000张在不同环境下拍摄的图像,包括不同照明条件下(晴朗的白天、夜晚、强人工灯光等)的室外和室内场...NLP Classification
355M 757
MSRA文本检测500数据库(MSRA-TD500) MSRA文本检测500数据库(MSRA-TD500),作为评估文本检测算法的基准,目的是跟踪自然图像中文本检测领域的最新进展,尤其是检测...NLP 2D Box
96.05M 1240
自然场景图像的合成文本,包含80万张图像和大约800万个合成单词实例 这是一个综合生成的数据集,其中word实例被放置在自然场景图像中,同时考虑场景布局。该数据集由80万张图像和大约800万个合成单...NLP,Animal 2D Box
37.9G 556
IIIT 5K word数据集,包含广告牌、招牌、门牌号、门牌、电影海报等查询词 The IIIT 5K-word dataset is harvested from Google image search. Query words like billboards, signboard, house numbers, h...NLP Classification
101M 577
国产剧豆瓣评论数据 国产剧豆瓣评论数据...NLP 2D Box
3.66M 413
企业重大合同数据 企业重大合同数据...NLP N/A
53.36M 461
阿拉伯自然音频数据集 这是第一个用于识别3种离散情感的阿拉伯自然音频数据集(ANAD):快乐,愤怒和惊讶。从在线阿拉伯脱口秀节目中下载了演播室外一...Music Analysis Audio
1.4G 557
XBD自然灾害图像数据集 用于建筑物损坏评估的带注释的高分辨率卫星图像 xBD 数据集是迄今为止第一个建筑破坏评估数据集,是带注释的高分辨率卫星图像的规模最大、质量最高的公共数据集之一。该数据集包...Environment,Environment 2D Box
30.31G 811
文字袋数据集 可用于了解路透社的哪些文章是关于“企业收购”的 Data Set Information:The original data were formatted by Thorsten Joachims in the “bag-of-words” representation. There...NLP Classification
1.21M 733
僧伽罗语数字词汇(1.0版),字母A到M 数据集 僧伽罗语数字词汇表(1.0版),字母A至M,链接至www.siddham.net...NLP Classification
9.83M 559