相关搜索
您是不是在找?
今日排行
本周排行
本月排行
ChatGPT情绪分析,ChatGPT推文分类一个月
ChatGPT has been a major talk in the tech world. The tweets about chatgpt were gathered for a month and then the sentime...NLP Classification
35.27M
1568
Charuni SA
Tweets on ChatGPT 数据集包ChatGPT上的推文
ChatGPT is a chatbot developed by OpenAI. It was launched in November 2022. The dataset contains tweets on #ChatGPT from...NLP Classification
133.86M
764
Manisha Bhattacharjee
街景文本(SVT)数据集,来自谷歌街景的图像数据
The Street View Text (SVT) dataset was harvested from Google Street View. Image text in this data exhibits high variabil...NLP,Energy 2D Box,Classification
112.7M
1332
Kai Wang
355M
786
Prof. Jin Hyung Kim Seonghun Lee
MSRA文本检测500数据库(MSRA-TD500)
MSRA文本检测500数据库(MSRA-TD500),作为评估文本检测算法的基准,目的是跟踪自然图像中文本检测领域的最新进展,尤其是检测...NLP 2D Box
96.05M
1268
Cong Yao
自然场景图像的合成文本,包含80万张图像和大约800万个合成单词实例
这是一个综合生成的数据集,其中word实例被放置在自然场景图像中,同时考虑场景布局。该数据集由80万张图像和大约800万个合成单...NLP,Animal 2D Box
37.9G
577
Ankush Gupta, Andrea Vedaldi and Andrew Zisserman
NASA 每日天文图片档案(7800 张图片,2011年)
发现宇宙!每天都会展示我们迷人宇宙的不同图像或照片,以及由专业天文学家撰写的简短说明,该数据集来自 apod.nasa.gov 的 7800...Physical Science,Physical Classification
2.57G
601
NASA
KDC-4007 库尔德语新闻和文章的数据集
这个数据集最重要的特点是使用简单,并且有很好的记录,可以广泛用于有关库尔德索拉尼新闻和文章的各种文本分析研究。这些文件包...NLP Classification
853K
579
uci-edu
文字袋数据集 可用于了解路透社的哪些文章是关于“企业收购”的
Data Set Information:The original data were formatted by Thorsten Joachims in the “bag-of-words” representation. There...NLP Classification
1.21M
768
University of California, Irvine
文字袋(包含文本和单词)数据集
Data Set Information:For each text collection, D is the number of documents, W is the number of words in the vocabulary,...NLP Classification
1.77G
735
University of California, Irvine
Primewords 中文普通话语料库,包含100小时的语音数据
This free Chinese Mandarin speech corpus set is released by Shanghai Primewords Information Technology Co., Ltd.The corp...Music Analysis Audio
9G
1382
primewords
免费 ST 中文普通话语料库
Thiscorpuswererecordedinsilencein-doorenvironmentusingcellphone.Ithas855speakers.Eachspeakerhas120utterances.Allutteranc...Music Analysis Audio
8.2G
918
surfing.ai
LAION-5B:大规模图文数据集
一、LAION-5B概述LAION-5B由58.5亿个图像文本组合组成,通过CLIP过滤的图像分类模型,其中23亿是图像-英文文本对,22亿是图像,...NLP,Image Search,Image Data Classification
80T
1653
laion
WikiLinks 一个大型跨文档指代消解英语语料数据
Wikilinks 是一个大型跨文档指代消解英语语料数据,从 Wikipedia 网站中的 300 万个实体中提取 4000 万的指代关系。从自由文本中...NLP,Languages Text
1.7G
744
马萨诸塞大学
Stanford Sentiment Treebank 英文语义词表数据
StanfordSentimentTreebank 是一个由斯坦福大学标注的语义词汇数据,人工标注了9645个英语句子的语义树结构。...NLP Text
12.56M
933
Stanford University
WikiText 英语词库 包含1亿个词汇的英文词库数据
WikiText英语词库数据(TheWikiTextLongTermDependencyLanguageModelingDataset)WikiText长期依赖语言建模数据集是一个包含1亿...NLP Text
373.28M
1050
Stephen Merity
8.2G
555
openslr