行业报告 AI展会 数据标注 标注供求
数据标注数据集
主页 > 数据标注 > 正文

数据标注是做什么的?

想了解数据标注是做什么的,就要先了解人工智能的一些应用,以阿里巴巴的蜻蜓人脸识别系统为开端把想了解数据标注,这些基本概念都要了解下。
而我们在做数据标注的时候,其产生的数据标注都是提供给客户,使其做机器学习过程中的模型和算法训练数据集
而数据集又分为三类:
 
1.训练集 用来调试神经网络;
2.验证集 用来查看训练效果;
查看模型训练的效果,是否朝着坏的方向进行,及时停止训练
用在训练的过程中,几个epoch结束后就要跑一次验证集看看效果,及时发现模型或者参数的问题。如果模型设计不合理,训练的时候不容易发现,但是在验证集中可能会发散、mAP不增长或者增长很慢啦等等情况,这时可以及时终止训练,重新调参或者调整模型,而不需要等到训练结束,大大节省时间。另外一个好处是验证模型的泛化能力,如果在验证集上的效果比训练集上差很多,就该考虑模型是否过拟合了。同时,还可以通过验证集对比不同的模型。
3.测试集 用来测试网络的实际学习能力;
 
而我们在做人脸拉框或者其他的图片标注的时候,这些产生的数据,都会被用来做数据集来用,蜻蜓人脸识别系统,就是以此来进行调试,训练,以及验证的,使其在对你人脸识别的时候,知道你就是你,而不是别人。
 
当然图片标注只是其中一块,视屏标注的话,其实都差不多,都是靠图片一帧一帧的进行标注、
像语音标注的原理都差不多,不过涉及的方面也就更广一点,回头专门开个帖子来聊下。
以上由可思数据标注平台整理。
 
微信公众号

声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
SEM推广服务

Copyright©2005-2026 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注行业联盟

扫码入群
扫码关注

微信公众号

返回顶部