Select Language

AI社区

公开数据集

电影数据集

电影数据集

1.65M
859 浏览
0 喜欢
4 次下载
0 条讨论
Music Analysis Classification

Data Set Information:数据以关系形式跨多个文件存储。中心文件(MAIN)是一个电影列表,每个电影都有一个唯一的标识符。这些标......

数据结构 ? 1.65M

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    Data Set Information:

    数据以关系形式跨多个文件存储。中心文件(MAIN)是一个电影列表,每个电影都有一个唯一的标识符。这些标识符可能在后续版本中更改。这些电影的演员(演员)与他们的角色一起列在一个不同的文件中。关于单个参与者(actors)的更多信息在第三个文件中。所有主要的导演都列在第四个文件(人物)中,其中包括一些重要的制片人、作家和摄影师。第五个文件(重拍)链接了大量相互复制的电影。第六个文件(STUDIOS)提供了一些关于MAIN中显示的STUDIOS的信息。


    最初的动机是数据库类练习,以取代枯燥的“玩具部门经理”查询。请注意,cast、reference MAIN和ACTORS在逻辑上与标准BOM表问题中的库存文件(reference to suppliers and assembly)相同。个人兴趣使得希区柯克所有电影和电视剧的数据库都变得完整。按类型和演员划分的相关电影逐渐增加。

    对时态数据库的后续研究导致添加日期字段(仅年)。比如说,它允许测试演员的工作日期是否与演员关系所显示的主要电影的日期相符。如DOC中所述,可以使用具有多个和两个级别值的字段测试面向对象的数据库功能。

    这些参赛作品是在1975年左右开始的课程工作中逐渐收集的,目前仍在更新中。大多数条目都是手工输入的。文档文件列出了使用的一些参考作品。更正和补充仍值得赞赏。


    Detailed descriptions of the fields and their formats is provided in doc.html.

    Missing Values:

    Outside of key fields, missing values are common. Their encoding is described in DOC. Sometimes the data seems to be unavailable, sometimes it hasn't been entered. Some information, as `lived-with' is inherently incomplete.

    Censored data:

    Minor actors are ignored.

    Dependencies:

    Every MAIN film must have a director in PEOPLE. about 50 pseudo director names ahve been listed in PEOPLE to allow interesting films to with (yet) unknown directors to be entered. Every CASTS entry must relate to a MAIN film entry. Every ACTOR should appear in some CASTS entry, but not vice versa. See DOC for more type information.

    Other Relevant Information:

    Films are listed, if known, with their original language title. An Alt(T: ) field provides English translations, where known.

    Data Format:

    The current files are in HTML, to allow easy parsing to other formats. An XML version is being considered.

    The approximate file sizes are:
    DOC .......    50K
    MAIN ...... 1 145K   11 400 entries
    PEOPLE ....   355K    3 290 entries
    CASTS ..... 4 340K   46 000 entries
    ACTORS ....   811K    6 800 entries
    REMAKES ...   135K    1 278 entries
    STUDIOS ...    26K      200 entries


    Attribute Information:

    N/A


    Relevant Papers:

    N/A


    Papers That Cite This Data Set1:


    Harsha Nagesh and Sanjay Goil and Alok N. Choudhary. Adaptive Grids for Clustering Massive Data Sets. Department of Energy ASCI.  [View Context].


    Citation Request:

    Copyright held by Gio Wiederhold, 1990-1999. This data may not be used for commercial resale.

    Please acknowledge the source when used: Gio Wiederhold, Stanford University.


    Original Owner and Donor

    Gio Wiederhold
    Stanford University
    650-725-8363
    gio '@' cs.stanford.edu

    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:10 去赚积分?
    • 859浏览
    • 4下载
    • 0点赞
    • 收藏
    • 分享