NLP
  • GitHub NLP分析的标题和描述 超过800万个GitHub发布了标题和描述

    2.85G

    886

    0

    NLP,Software

    GitHub NLP分析的标题和描述 超过800万个GitHub发布了标题和描述
    Classification
    David Shinn
  • 街景房屋编号(SVHN)数据集,可用于对象识别算法的真实图像数据集

    3.91G

    2231

    3

    NLP,OCR/Text Detection,Business,Image Search

    街景房屋编号(SVHN)数据集,可用于对象识别算法的真实图像数据集
    2D Box
    iapr-tc11
  • 街景文本(SVT)数据集,来自谷歌街景的图像数据

    112.7M

    1742

    0

    NLP,Energy

    街景文本(SVT)数据集,来自谷歌街景的图像数据
    2D Box,Classification
    Kai Wang
  • KAIST场景文本数据库

    355M

    1049

    2

    NLP

    KAIST场景文本数据库
    Classification
    Prof. Jin Hyung Kim Seonghun Lee
  • MSRA文本检测500数据库(MSRA-TD500)

    96.05M

    1553

    3

    NLP

    MSRA文本检测500数据库(MSRA-TD500)
    2D Box
    Cong Yao
  • 自然场景图像的合成文本,包含80万张图像和大约800万个合成单词实例

    37.9G

    820

    1

    NLP,Animal

    自然场景图像的合成文本,包含80万张图像和大约800万个合成单词实例
    2D Box
    Ankush Gupta, Andrea Vedaldi and Andrew Zisserman
  • IIIT 5K word数据集,包含广告牌、招牌、门牌号、门牌、电影海报等查询词

    101M

    899

    0

    NLP

    IIIT 5K word数据集,包含广告牌、招牌、门牌号、门牌、电影海报等查询词
    Classification
    Anand Mishra
  • 国产剧豆瓣评论数据

    3.66M

    716

    1

    NLP

    国产剧豆瓣评论数据
    2D Box
    sam
  • 企业重大合同数据

    53.36M

    814

    0

    NLP

    企业重大合同数据
    N/A
    lopo_hui
  • IAM 50个最常见的作家手写数据集

    186.97M

    1552

    18

    NLP

    IAM 50个最常见的作家手写数据集
    Text
    TejasReddy
  • 40万个手写姓名图像数据集

    1.26G

    1283

    35

    NLP

    40万个手写姓名图像数据集
    2D Box
    landlord
  • Twitter-dataset 数据集

    311.27M

    1823

    17

    NLP

    Twitter-dataset 数据集
    Text
    ICWSM
  • reddit 250万个帖子数据

    437.79M

    1711

    2

    NLP

    reddit 250万个帖子数据
    Text
    reddit
  • Multi-Domain Sentiment Dataset--多域情感数据集

    1.53M

    1404

    49

    NLP

    Multi-Domain Sentiment Dataset--多域情感数据集
    Text
    Mark Dredze
  • WMT 2011 News Crawl 机器翻译数据

    25.01G

    1049

    0

    NLP

    WMT 2011 News Crawl 机器翻译数据
    Text
    Europarl
  • 250万Reddit帖子数据

    452.85M

    919

    0

    NLP

    250万Reddit帖子数据
    Text
    Reddit
  • 新闻类别数据集,包含20万条新闻标题

    25.44M

    1571

    5

    NLP

    新闻类别数据集,包含20万条新闻标题
    Text
    Rishabh Misra
  • 爱尔兰时报新闻数据集

    48.93M

    936

    1

    NLP

    爱尔兰时报新闻数据集
    Text
    爱尔兰时报
  • Twitter 社交数据集

    31.4M

    1695

    9

    NLP

    Twitter 社交数据集
    Classification
    Stanford University
  • Google+ 社交圈子数据集

    773M

    1102

    1

    NLP

    Google+ 社交圈子数据集
    Classification
    Stanford University