常见的数据标注类别有哪5种(什么是数据标注)

近年来,人工智能技术快速发展,其中,数据作为人工智能迭代创新的核心要素,在AI算法模型构建和应用中发挥着重要作用,也是人工智能应用落地的核心痛点。

由于Al应用对数据的质量、实时性等高质量要求,需要对数据采集、清洗、信息抽取、标注、质检、管理等环节进行更加精细的把控,需要花费大量精力,因此大部分公司都会选择将数据外包给专业的数据标注公司。

什么是数据标注

数据标注是指给原始数据(如图像、视频、文本、音频)添加标签的过程,带有标签的数据被称为训练数据,这些标签形成了数据属于哪一类对象的表示,帮助机器学习模型在未来遇到从未见过的数据时,也能准确识别数据中的内容;

训练数据可以有多种形式,包括图像、语音、文本或特征,这取决于所使用的机器学习模型和手头要解决的任务。简单来说,数据标注是对未经处理过的语音、图片、文本、视频等数据进行加工处理,从而转变成机器可识别信息的过程。

常见的数据标注类型

  • 图像数据标注

图像数据标注包括点云分割、连续帧标注、关键点标注、全景分割、3D点云、实体抽取、实例分割、2D/3DBOX、车道线、物体识别;

2D/3D融合标注、人脸识别、立体对象检测、融合标注、图片快判、2D/3D拉框3D点云分割、3D追踪、3D关键点、POI标记、图片属性标注、场所识别、泊车位标注、医疗影像标注、多边形等。

  • 语音/音频数据标注

语音审核、全景语义分割、语音转写、TTS声优数据、语音识别、3D空间语义分割、语音识别、语音合成、语音拓展、语音快判、声音复制、情感合成、声纹识别、意图判断、指代消解、语义分析、点云语义分割、语音评测、语音唤醒、AIUI人机交互等。

  • 文本数据标注

文本标注类型较为丰富,但不论哪种类型,它背后的主要意图是让机器学习算法能够理解文本背后的语义含义。

一个较为常见的用例是实体提取,人类标注员通过对文本的特定词汇或短语赋予相应的标签用来训练机器学习算法,使其能够分析文本中的关键信息并具有一定的推理能力。

  • 视频标注

视频分类、连续帧标注、视频目标跟踪、视频标注、视频打点、视频转录、视频分割等。普遍应用于人脸识别支付、自动驾驶、安防、机器人检测。

发布于 2023-12-12 21:31:32
分享
海报
6
上一篇:孙武为什么不救伍子胥(伍子胥怎么死的) 下一篇:深圳最有钱的十个村庄(深圳最有钱的村)
目录

    0 条评论

    本站已关闭游客评论,请登录或者注册后再评论吧~

    忘记密码?

    图形验证码