Select Language

AI社区

公开数据集

相关搜索
您是不是在找?
今日排行
本周排行
本月排行
WikiText 英语词库 包含1亿个词汇的英文词库数据 WikiText英语词库数据(TheWikiTextLongTermDependencyLanguageModelingDataset)WikiText长期依赖语言建模数据集是一个包含1亿...NLP Text
373.28M 1005
JRC Names 实体专有名词库 JRC-Names是一个高度多语言的命名实体资源,用于个人和组织名称(称为“实体”)。它包含大量名称列表及其多种拼写变体(单个人...NLP Text
762.56M 1278
Twitter-dataset 数据集 ICWSM 2010论文中的数据可从以下链接获得。我们的数据集已匿名化,以保护用户自己的隐私。我们只发布有关Twitter链接结构的信息...NLP Text
311.27M 1339
reddit 250万个帖子数据 美国 reddit 新闻网站最受欢迎的 2500 名发布者每家媒体 1000 个发布内容及评论数据集,来自订阅者的前2,500个子评价,从2013年8...NLP Text
437.79M 1248
Multi-Domain Sentiment Dataset--多域情感数据集 多域情感数据集包含从Amazon.com获取的许多产品类型(域)的产品评论。一些域名(书籍和DVD)有成千上万的评论。其他(乐器)只...NLP Text
1.53M 1010
WMT 2011 News Crawl 机器翻译数据 WMT2011NewsCrawldata 是一个自然语言翻译数据,从 Europarlcorpus 语料中提取得到,包括:French-English、Spanish-English、Ge...NLP Text
25.01G 731
人民日报词性标注语料数据(199801) 人民日报语料,分词和词性标注POS的语料(Chinese corpus for Word segmentation and par of speech)资源为1998年人民日报1-6月份...NLP Text
2.81M 956
250万Reddit帖子数据 这是来自订阅者的前2500个子目录中的前1000个帖子的历史数据集,该数据是在2013年8月15日至20日之间从reddit中提取的。这是reddi...NLP Text
452.85M 658
新闻类别数据集,包含20万条新闻标题 该数据集包含从HuffPost获得的2012年至2018年的大约20万条新闻标题。在该数据集上训练的模型可用于识别未跟踪新闻文章的标签或识...NLP Text
25.44M 1028
爱尔兰时报新闻数据集 该新闻数据集由爱尔兰境内的《爱尔兰时报》发布的148万个头条新闻组成。创建于160年前;该机构可以长期观察欧洲发生的事情。内容...NLP Text
48.93M 707
PubMed医学数据集: 包含提取的 3984 个医学句子 该数据集包含从 PubMed 摘要中提取的 3984 个医学句子,并标注了不同医学术语之间的关系。该数据集主要关注“治疗”和“病因”关...NLP Classification
9.4M 954
Berkeley的大规模动驾驶视频数据集-BDD100K 发布机构:加州大学伯克利分校 AI 实验室包含数量:10 万个高清视频序列,10 万张图片数据格式:标签:.json;图片:.png图片尺...Autonomous Driving Classification
1.8T 924
奥迪动驾驶数据集 A2D2 奥迪公司的研究人员在发布的论文 A2D2: Audi Autonomous Driving Dataset 中,公布了其大型自动驾驶数据集:A2D2,同时还配备了...Autonomous Driving Classification
2.3T 1043
Argoverse Dataset 动驾驶数据集 Argoverse数据集是由Argo AI、卡内基梅隆大学、佐治亚理工学院发布的用于支持自动驾驶汽车3D Tracking和Motion Forecasting研究...Autonomous Driving 3D Model
275G 1738
THUCTC 中文文本分类数据集 THUCTC(THU Chinese Text Classification)是由清华大学自然语言处理实验室推出的中文文本分类工具包,能够自动高效地实现用户自...OCR/Text Detection Classification
1.1G 2536
VOC06 行车检测识别数据集 在VOC06训练/验证数据集上训练了自行车检测器。提供检测示例以及对VOC06测试仪的性能评估。在其他VOC06报告的方法中,分类器实现...Industry 2D Box
1.8M 712
BDD100K:一个大规模、多样化的驾驶视频数据集 Video Data Explore 100,000 HD video sequences of over 1,100-hour driving experience across many differenttimes in the da...Autonomous Driving 2D Box
57.45G 1006
Lyft Level 5 动驾驶数据集 L Lyft L5 自动驾驶数据集是由 Lyft 公司提供的 L5 级别自动驾驶数据集,目前仅提供训练集的下载。该数据集包含高质量语义地图,...Autonomous Driving 3D Model
41.59G 1057
KITTI 计算机视觉算法评测数据集 KITTI 是一套 计算机视觉 算法 评测数据集,其主要用于自动驾驶场景下的相关测试,评测种类涵盖立体图像、光流、视觉测距、3D 物...Autonomous Driving 2D Box
599G 776
Livox激光雷达数据集V1.0 The Livox data set V1.0 is convenient for users to quickly verify algorithms, improve efficiency,and tap the potential o...Autonomous Driving 3D Box Tracking
0M 969