行业报告 AI展会 数据标注 数据集
投稿发布
您的当前位置:主页 > 数据下载 > 数据工具 > 正文

Vatic视频标注工具

发布:可思数据 时间:2019-08-13
数据类型:工具软件 热度
★★★☆☆

文件类型: .zip              文件大小:2.46M

授权方式: 其它     发布时间:2019-08-13

数据来源:vatic             界面语言:英文

数据介绍:
VATIC - 来自加利福尼亚州欧文的视频注释工具
VATIC是一个用于计算机视觉研究的在线视频注释工具,它将工作众包给亚马逊的Mechanical Turk。我们的工具可以轻松构建大规模,经济实惠的视频数据集。Vatic适用于图像检测任务的数据集制作,它还可以做视频的标注,比如一个25fps的视频,只需要隔100帧左右手动标注一下物体的位置,最后在整个视频中就能有比较好的效果。这依赖于软件集成的opencv的追踪算法。可适用于数据众包市场有效扩大视频数据标注工作。

安装

注意:VATIC仅在Ubuntu上使用Apache 2.2 HTTP服务器和MySQL服务器进行了测试。本文档将介绍此平台上的安装,但它应适用于任何操作系统和任何服务器。

可思数据-人工智能资讯平台sykv.com

可思数据sykv.com,sykv.cn
下载

您可以从我们的网站下载并提取VATIC。注意:请勿以root用户身份运行安装程序。

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

$ wget http://mit.edu/vondrick/vatic/vatic-install.sh
$ chmod +x vatic-install.sh
$ ./vatic-install.sh
$ cd vatic
 可思数据sykv.com,sykv.cn 

可思数据sykv.com,sykv.cn

HTTP服务器配置

打开Apache配置文件。在Ubuntu上,此文件位于: 可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

/etc/apache2/sites-enabled/000-default
 

本文来自可思数据(sykv.com),转载请联系本站及注明出处

如果您不在此计算机上使用Apache用于任何其他目的,请将文件内容替换为:

可思数据sykv.com,sykv.cn

WSGIDaemonProcess www-data
WSGIProcessGroup www-data

<VirtualHost *:80>
    ServerName vatic.domain.edu
    DocumentRoot /path/to/vatic/public

    WSGIScriptAlias /server /path/to/vatic/server.py
    CustomLog /var/log/apache2/access.log combined
</VirtualHost>
 

可思数据-www.sykv.cn,sykv.com

使用您的域名更新ServerName,使用VATIC中公共目录的路径更新DocumentRoot,将WSGIScriptAlias更新为VATIC的server.py文件。

可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com

如果您确实将Apache用于其他目的,则必须使用正确的文档根和脚本别名设置新的虚拟主机,如上所示。 可思数据sykv.com,sykv.cn

确保已启用mod_headers模块:

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

$ sudo cp /etc/apache2/mods-available/headers.load /etc/apache2/mods-enabled
 可思数据sykv.com,sykv.cn 

进行这些更改后,重新启动Apache: 可思数据-www.sykv.cn,sykv.com

$ sudo apache2ctl graceful
 

内容来自可思数据sykv.com

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络
SQL Server配置

我们建议专门为VATIC创建一个单独的数据库:

本文来自可思数据(sykv.com),转载请联系本站及注明出处

$ mysql -u root
mysql> create database vatic;
 可思数据-人工智能资讯平台sykv.com 

下一节将自动创建必要的表。 可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

本文来自可思数据(sykv.com),转载请联系本站及注明出处 建立

在vatic目录中,将config.py-example复制到config.py:

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

$ cp config.py-example config.py
 可思数据sykv.com,sykv.cn 

然后打开config.py并更改以下变量以配置VATIC: 本文来自可思数据(sykv.com),转载请联系本站及注明出处

signature       Amazon Mechanical Turk AWS signature (secret access key)
accesskey       Amazon Mechanical Turk AWS access key (access key ID)
sandbox         If true, put into Mturk sandbox mode. For debugging.
localhost       The local HTTP address: http://vatic.domain.edu/ so it
                matches the ServerName in Apache.
database        Database connection string: for example,
                mysql://user:pass@localhost/vatic
geolocation     API key from ipinfodb.com for geolocation services
 

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

如果您不打算在Mechcanical Turk上使用VATIC(仅限offlien模式),则可以将签名和访问密钥保留为空。 可思数据-AI,sykv.com智能驾驶,人脸识别,区块链,大数据

保存结果后,您可以初始化数据库: 可思数据sykv.com,sykv.cn

$ turkic setup --database
 可思数据sykv.com,sykv.cn 

注意:如果要重置数据库,可以使用以下命令:

可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com

$ turkic setup --database --reset
 可思数据-AI,sykv.com智能驾驶,人脸识别,区块链,大数据 

这将需要确认重置,以防止数据丢失。 内容来自可思数据sykv.com

最后,您还必须允许VATIC访问turkic,这是一个主要的依赖: 本文来自可思数据(sykv.com),转载请联系本站及注明出处

$ turkic setup --public-symlink
 可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络 

本文来自可思数据(sykv.com),转载请联系本站及注明出处 注解

在继续之前,您应该验证安装是否正确。您可以通过以下方式验证:

可思数据sykv.com

$ turkic status --verify
 可思数据-人工智能资讯平台sykv.com 

如果您收到任何错误消息,则表示安装未完成,您应该查看上一节。注意:如果您不打算使用Mechanical Turk,则可以放心地忽略Mechanical Turk引起的任何错误。

可思数据sykv.com

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络
帧提取

我们的系统要求将视频提取到JPEG帧中。我们的工具可以为您自动执行此操作:

本文来自可思数据(sykv.com),转载请联系本站及注明出处

$ mkdir /path/to/output/directory
$ turkic extract /path/to/video.mp4 /path/to/output/directory
 
可思数据-AI,sykv.com智能驾驶,人脸识别,区块链,大数据

默认情况下,我们的工具会调整帧的大小以适应720x480矩形。我们相信此分辨率非常适合在线视频观看。您可以使用选项更改分辨率:

本文来自可思数据(sykv.com),转载请联系本站及注明出处

$ turkic extract /path/to/video.mp4 /path/to/output/directory
  --width 1000 --height 1000
 可思数据sykv.com,sykv.cn 

要么 可思数据sykv.com,sykv.cn

$ turkic extract /path/to/video.mp4 /path/to/output/directory
  --no-resize
 
本文来自可思数据(sykv.com),转载请联系本站及注明出处

该工具将在所有情况下保持纵横比。 可思数据sykv.com,sykv.cn

或者,如果您已经提取了帧,则可以使用formatframes命令将视频格式化为VATIC可以理解的格式: 可思数据-人工智能资讯平台sykv.com

$ turkic formatframes /path/to/frames/ /path/to/output/directory
 

可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com

上面的命令将读取/ path / to / frames中的所有图像,并在/ path / to / output /目录中创建硬链接(软拷贝)。

内容来自可思数据sykv.com

可思数据sykv.com,sykv.cn 导入视频

提取帧后,可以将视频导入我们的工具中进行注释。此操作的一般语法是: 内容来自可思数据sykv.com

$ turkic load identifier /path/to/output/directory Label1 Label2 LabelN
 可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络 

其中identifier是用于引用此视频的唯一字符串,/ path / to / output / directory是帧的目录,LabelX是您要注释的类标签(例如,Person,Car,Bicycle)。您可以拥有任意数量的类标签,但必须至少有一个。

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

导入视频时,视频会被分成几小段,通常只有几秒钟。当所有段都被注释时,注释将跨段合并,因为每个段与另一个段重叠一小段。 可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

上面的命令指定了所有必需的选项,但也有许多选项可用。我们建议使用这些选项。 本文来自可思数据(sykv.com),转载请联系本站及注明出处

MTurk Options
    --title         The title that MTurk workers see
    --description   The description that MTurk workers see
    --duration      Time in seconds that a worker has to complete the task
    --lifetime      Time in seconds that the task is online
    --keywords      Keywords that MTurk workers can search on
    --offline       Disable MTurk and use for self annotation only

Compensation Options
    --cost                  The price advertised to MTurk workers
    --per-object-bonus      A bonus in dollars paid for each object
    --completion-bonus      A bonus in dollars paid for completing the task

Qualification Options
    --min-approved-percent  Minimum percent of tasks the worker must have
                            approved before they can work for you
    --min-approved-amount   Minimum number of tasks that the worker must 
                            have completed before they can work for you

Video Options
    --length        The length of each segment for this video in frames
    --overlap       The overlap between segments in frames
    --use-frames    When splitting into segments, only the frame intervals
                    specified in this file. Each line should contain a
                    start frame, followed by a space, then the stop frame.
                    Frames outside the intervals in this file will be
                    ignored.
    --skip          If specified, request annotations only every N frames.
    --blow-radius   When a user marks an annotation, blow away all other
                    annotations within this many frames. If you want to
                    allow the user to make fine-grained annotations, set
                    this number to a small integer, or 0 to disable. By
                    default, this is 5, which we recommend.
 内容来自可思数据sykv.com 

您还可以指定每个对象标签可以采用的时间属性。例如,您可能有一个具有“行走”,“跑步”或“坐着”属性的人物对象。您可以使用与标签相同的方式指定属性,除了在文本之前添加〜,将属性绑定到上一个标签:

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

$ turkic load identifier /path/to/output/directory Label1 ~Attr1A ~Attr1B
  Label2 ~Attr2A ~Attr2B ~Attr2C Label3 
 内容来自可思数据sykv.com 

在上面的示例中,Label1将具有属性Attr1A和Attr1B,Label2将具有属性Attr2B,Attr2B和Attr2C,而Label3将没有属性。指定属性是可选的。 可思数据sykv.com,sykv.cn

可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com
黄金标准培训

事实证明,视频注释极具挑战性,大多数MTurk工作人员缺乏必要的耐心。出于这个原因,我们建议要求工作人员传递“黄金标准”视频。当新工作人员访问该任务时,他们将被重定向到已经注释了注释的视频。为了继续使用真正的注释,工作人员必须首先正确地注释黄金标准视频。我们发现这种方法显着提高了注释的质量。

可思数据sykv.com,sykv.cn

要使用此功能,请导入要用作黄金标准的视频: 可思数据-AI,sykv.com智能驾驶,人脸识别,区块链,大数据

$ turkic load identifier-train /path/to/frames Label1 Label2 LabelN
  --for-training --for-training-start 0 --for-training-stop 500
  --for-training-overlap 0.5 --for-training-tolerance 0.1
  --for-training-mistakes 1
 

内容来自可思数据sykv.com

您还可以使用上述任何选项。新选项的解释如下: 可思数据sykv.com,sykv.cn

--for-training              Specifies that this video is gold standard
--for-training-start        Specifies the first frame to use
--for-training-stop         Specifies the last frame to use
--for-training-overlap      Percent overlap that worker's boxes must match 
--for-training-tolerance    Percent that annotations must agree temporally
--for-training-mistakes     The number of completely wrong annotations 
                            allowed. We recommend setting this to a small,
                            nonzero integer.
 

本文来自可思数据(sykv.com),转载请联系本站及注明出处

运行上述命令后,它将为您提供一个URL,供您输入地面实况注释。你必须尽可能小心地对这个基本事实进行注释,因为它将用于评估未来的工人。

可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com

您现在可以指定视频应使用黄金标准视频: 可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com

$ turkic load identifier /path/to/output/directory Label1 Label2 LabelN
  --train-with identifier-train
 

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

当一位尚未见过的工作人员访问此视频时,他们现在将被重定向到培训视频,并被要求首先通过评估测试。

本文来自可思数据(sykv.com),转载请联系本站及注明出处

本文来自可思数据(sykv.com),转载请联系本站及注明出处 发布任务

当您准备好让MTurk工作人员进行注释时,您必须发布任务,这将允许工作人员开始注释: 可思数据sykv.com

$ turkic publish
 可思数据sykv.com,sykv.cn 

您可以限制已发布的任务数: 可思数据sykv.com,sykv.cn

$ turkic publish --limit 100
 可思数据sykv.com,sykv.cn 

重复运行以上命令将以100个批次启动任务。您还可以禁用所有挂起任务: 可思数据-AI,sykv.com智能驾驶,人脸识别,区块链,大数据

$ turkic publish --disable
 内容来自可思数据sykv.com 

这将“取消发布”尚未完成的任务。 可思数据sykv.com,sykv.cn

如果您的视频仅处于离线状态,则可以使用以下命令查看其访问网址:

可思数据sykv.com

$ turkic publish --offline
 可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络 

注意:要使上述命令起作用,您必须使用--offline参数加载视频: 可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

$ turkic load identifier /path/to/frames Person --offline
 
可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

本文来自可思数据(sykv.com),转载请联系本站及注明出处 检查状态

您可以使用以下命令检查视频注释服务器的状态: 可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com

$ turkic status
 
可思数据-www.sykv.cn,sykv.com

这将列出有关服务器的各种统计信息,例如已发布的作业数和已完成的作业数。通过从Amazon请求其他信息,您可以获得更多统计信息: 可思数据sykv.com

$ turkic status --turk
 
本文来自可思数据(sykv.com),转载请联系本站及注明出处

这将输出您的帐户中剩余的金额,以及其他统计数据。

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

当所有视频都被注释时,最后一行将显示为: 可思数据sykv.com

Server is offline.
 

本文来自可思数据(sykv.com),转载请联系本站及注明出处

可思数据sykv.com,sykv.cn 检索注释

您可以使用以下命令获取视频的所有注释: 可思数据sykv.com,sykv.cn

$ turkic dump identifier -o output.txt
 可思数据-人工智能资讯平台sykv.com 

这将写入文件“output.txt”,其中每行包含一个注释。每行包含10列以空格分隔。这些列的定义是: 可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

1   Track ID. All rows with the same ID belong to the same path.
2   xmin. The top left x-coordinate of the bounding box.
3   ymin. The top left y-coordinate of the bounding box.
4   xmax. The bottom right x-coordinate of the bounding box.
5   ymax. The bottom right y-coordinate of the bounding box.
6   frame. The frame that this annotation represents.
7   lost. If 1, the annotation is outside of the view screen.
8   occluded. If 1, the annotation is occluded.
9   generated. If 1, the annotation was automatically interpolated.
10  label. The label for this annotation, enclosed in quotation marks.
11+ attributes. Each column after this is an attribute.
 可思数据-www.sykv.cn,sykv.com 
下载地址:

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
转发量:


人工智能交流群扫码邀请
人工智能交流群扫码邀请

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
栏目分类

Copyright©2005-2020 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注行业联盟

人工智能资讯   人工智能资讯   人工智能资讯   人工智能资讯

人工智能资讯
扫码入群
扫码关注

微信公众号

返回顶部
扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部