Select Language

AI社区

公开数据集

UCF-ARG 多角度人类动作识别数据

UCF-ARG 多角度人类动作识别数据

7.83G
802 浏览
4 喜欢
2 次下载
0 条讨论
Action/Event Detection 2D Box

UCF-ARG 是一个多角度人类动作识别数据,从3个不同角度的摄像机,拍摄12位志愿者的人类动作视频。拍摄的人类动作有10类,包括:......

数据结构 ? 7.83G

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    UCF-ARG 是一个多角度人类动作识别数据,从 3个 不同角度的摄像机,拍摄 12位 志愿者的人类动作视频。拍摄的人类动作有 10类,包括:拳击,携带,鼓掌,挖掘,慢跑,开关门,跑步,投掷,行走和挥手。

    UCF-ARG(佛罗里达大学航空相机,屋顶摄像机和地面摄像机)数据集是Multiview Human Action数据集。UCF-ARG包括由地面摄像机记录的12个演员执行的10个动作,高度为100英尺的屋顶摄像机,以及安装在13'Kingfisher Aerostat氦气球的有效载荷平台上的航空摄像机,如图所示。这10个动作是拳击,携带,拍手,挖掘,慢跑,开合树干,跑步,投掷,走路和挥舞。除了Open-Close Trunk之外,每个演员在不同方向上执行所有其他动作4次。开闭式行李箱仅执行3次,即停放在不同方向的3辆车。使用高清摄像机(Sanyo Xacti FH1A摄像机)1920 X 1080以60fps(每秒帧数)捕获动作。

    UCF-ARG评估集

    评估集使用天线,屋顶和地面摄像机拍摄约3分钟的视频。在任何给定的实例中,摄像机视图中的演员数量可以在4到8之间变化,并且演员可以自由地执行10个动作中的任何一个并且可以随时改变正在执行的动作。来自航空相机的序列使用VIPER格式进行注释以进行评估。注意:请注意,评估集视频的注释分辨率为1920x1080和60 fps。注释可能具有不属于数据集的动作,如手势,站立,拾取,网球挥杆以及行走时投掷等动作的组合。请告知我们任何严重的注释错误。我们知道一些缺失的注释。“mpg”中的视频 提供的格式可用于可视化VIPER中的注释。有关此数据集的问题,请联系 基肖尔雷迪。


    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:10 去赚积分?
    • 802浏览
    • 2下载
    • 4点赞
    • 收藏
    • 分享