切换到宽版
  • 89阅读
  • 2回复

[数码讨论]数据标注产业发展值得关注 [复制链接]

上一主题 下一主题
在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
107580
金币
4022
道行
19523
原创
29308
奖券
17512
斑龄
193
道券
10535
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 20772(小时)
注册时间: 2007-11-29
最后登录: 2025-02-20
— 本帖被 兵马大元帅 执行加亮操作(2025-02-06) —
           近日,四部委联合印发《关于促进数据标注产业高质量发展的实施意见》(以下简称《实施意见》),提出“到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%”的发展目标。我国针对数据标注产业发布系统性指导文件,是我国为护航人工智能产业、提升新质生产力水平作出的重要布局。

  数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业。《实施意见》为我国数据标注行业指明了专业化、智能化的发展方向。数据标注是将复杂、随性的人类可识别信号翻译成简单、规范的机器可识别信号的过程。产业探索期,“有多少人工就有多少智能”的特征为我国奠定了良好的数据标注产业基础。

  从2021年起,中央文件中对数据标注的政策指向更加明确,提出提升数据的多样化处理能力、聚焦数据标注等数据处理环节等,从数据标注能力、数据标注的应用方向等角度为市场指明了发展思路。当前,人工智能应用场景的细分,对数据标注准确性和专业性的要求日渐提升。例如辅助诊疗AI的医疗影像标注需要人体结构、病灶特征等知识,智能制造AI的数据标注需要生产流程、产品构造等知识,法院辅助裁判AI的文书标注需要法律法规、司法解释等知识。数据标注产业现已进入从劳动密集型向知识密集型转型的新阶段。以技术引领,优化人力、数据、能源等要素供应,是数据标注产业顺利转型的有效保障。

  深度学习模型的多层次非线性复杂架构,会使得数据标注的少量错误在迭代后被放大。当前,优化算法高维空间求解过程具有不可预知性,这导致通过错误标注样本提炼出的错误规律不能被直接消除,而需要重新学习大量新的正确标注样本来纠正,试错成本高昂。人工标注容易出现标注质量不稳定、准确性、客观性难以保障等问题。例如,同一位员工在不同时间和心境下会将同一表述标注成不同情感;不同的员工对图像中人物年龄的判断不同;员工可能因为注意力不集中或认知有限而忽略掉某些病灶等。

  近年来,自动标注技术迅速发展,数据标注逐渐从纯人工标注向人机协作标注转变,人力更多承担关键决策角色。增强深度学习和自然语言处理等技术实力,通过算法优化和多模态融合不断提升标注精度,有利于提高我国数据标注产业的市场竞争力。开展职业能力建设,增加标注员工对特定行业和标注技术的知识储备,既可为产业发展提供充足后备人才,又有助于应对技术发展对就业可能造成的冲击。

  人工智能应用场景的不断开发是数据标注产业发展的驱动力。但反过来,万物依存表现出的数据互联特性也使得数据标注自身成为驱动,为人工智能应用场景的开发提供灵感和保障。例如,对交通指示、路况、人类行动轨迹等多类数据的标注使自动驾驶成为可能,而路况、车况、企业分布等信息又促使智能交通管理迅速发展。

  中国是全球数据量产大国,且数据类型丰富,涵盖各个领域和行业。但目前数据要素还有较大挖掘潜力。出于对商业竞争、数据泄露等问题的担忧,很多企业不愿意开展数据标注业务。在通过区块链等技术保障安全的基础上,以公共数据标注为切入点,形成成熟的数据标注标准,并基于此搭建数据要素流通平台,将有助于撬动企业数据标注,实现数据互联共享,充分释放数据活力。

  数据存储、调用和标注计算需要占用大量存力算力资源,存力算力中心的运行、冷却需要依托于大量、稳定的能源供应。为了降低能耗、减少资源浪费、保障产业可持续发展,除了优化标注算法、平衡工作时段、完善资源调度外,还需充分考虑数据标注基地与数据来源地、存力算力中心所在地的距离,合理规划数据传输路径。

  2024年5月国家数据标注基地试点公布,7个城市承担起了在产业生态构建、能力提升和场景应用等方面先行先试的重任。这些城市的选择充分考虑了其地方配套支撑优势。然而,数据资源丰富的地区通常面临较大的能源供应限制,“东数西算”工程能够为重塑我国数字经济地理格局、应对我国资源的地域分配不均问题发挥重要作用。未来,7个数据标注基地的发展也应考虑数字经济地理格局,盘活周边已有数据、存力算力、人力资源,宏观布局新增配套资源建设,在优化能源供应的同时带动区域经济发展。
1条评分金币+15
兵马大元帅 金币 +15 优秀文章,支持!n神马都是浮云 02-08
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
  




    
在线jjybzxw

UID: 551814


发帖
128366
金币
1324077
道行
1966
原创
2283
奖券
2397
斑龄
31
道券
869
获奖
0
座驾
设备
摄影级
在线时间: 30480(小时)
注册时间: 2008-10-01
最后登录: 2025-02-20
只看该作者 沙发  发表于: 02-05
这篇文章详细介绍了《关于促进数据标注产业高质量发展的实施意见》及其背景、意义和未来发展方向。以下是对主要内容的总结:

1. 政策背景和目标:
   - 四部委联合印发《实施意见》,提出到2027年数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%。
   - 这是我国为护航人工智能产业、提升新质生产力水平作出的重要布局。

2. 数据标注产业的定义和发展方向:
   - 数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业。
   - 《实施意见》指明了专业化、智能化的发展方向。

3. 政策支持和行业需求:
   - 从2021年起,中央文件对数据标注的政策指向更加明确,提出提升数据的多样化处理能力等。
   - 人工智能应用场景的细分对数据标注准确性和专业性的要求日渐提升。

4. 技术挑战和解决方案:
   - 深度学习模型的复杂架构会导致数据标注的少量错误在迭代后被放大。
   - 自动标注技术迅速发展,数据标注逐渐从纯人工标注向人机协作标注转变。

5. 应用场景和驱动力:
   - 人工智能应用场景的不断开发是数据标注产业发展的驱动力,反过来,数据标注自身也成为驱动。
   - 例如,对交通指示、路况等数据的标注使自动驾驶成为可能。

6. 数据互联和共享:
   - 中国是全球数据量产大国,但数据要素还有较大挖掘潜力。
   - 通过区块链等技术保障安全,形成成熟的数据标注标准,并基于此搭建数据要素流通平台。

7. 资源管理和可持续发展:
   - 数据存储、调用和标注计算需要大量存力算力资源,需优化标注算法、平衡工作时段、完善资源调度。
   - “东数西算”工程能够为应对我国资源的地域分配不均问题发挥重要作用。

8. 试点城市和未来规划:
   - 2024年5月国家数据标注基地试点公布,7个城市承担先行先试的重任。
   - 未来,这些城市的发展应考虑数字经济地理格局,盘活周边已有资源,带动区域经济发展。

这篇文章全面阐述了数据标注产业的现状、挑战和未来发展方向,强调了政策支持、技术创新和资源管理在推动数据标注产业高质量发展中的重要作用。
1条评分金币+10
兵马大元帅 金币 +10 感谢参与 02-08
如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
117812
金币
21722
道行
20019
原创
750
奖券
0
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 11475(小时)
注册时间: 2012-06-21
最后登录: 2025-02-20
只看该作者 板凳  发表于: 02-07
数据标注产业发展值得关注
数据标注产业的重要性与发展现状
数据标注产业作为人工智能领域的基础性工作,其发展对于推动人工智能技术的进步和应用至关重要。随着人工智能应用场景的不断开发,数据标注产业的需求日益增长,成为推动行业发展的关键力量1。

政策支持与产业发展目标
近期,四部委联合印发了《关于促进数据标注产业高质量发展的实施意见》,明确提出到2027年,数据标注产业的专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率预计超过20%2。这一政策的出台,不仅为数据标注行业的发展指明了方向,也为提升我国新质生产力水平作出了重要布局。

数据标注产业的技术挑战与解决方案
数据标注产业正从劳动密集型向知识密集型转型,这对标注的准确性和专业性提出了更高要求。例如,医疗影像标注需要人体结构、病灶特征等专业知识,智能制造AI的数据标注则需要生产流程、产品构造等知识2。为了应对这些挑战,行业正在积极采用自动标注技术和人机协作模式,以提高标注精度和效率。

数据标注产业的未来发展趋势
中国作为全球数据量产大国,拥有丰富的数据类型和广阔的应用场景。然而,目前数据要素还有较大的挖掘潜力,企业对于开展数据标注业务的积极性不高。通过区块链等技术保障数据安全,并形成成熟的数据标注标准,有望撬动企业数据标注市场,实现数据互联共享,释放数据活力2。

数据标注产业的市场表现与投资价值
市场动态与ETF关注
数据标注产业的快速发展吸引了市场的广泛关注。数字经济ETF(560800)作为反映该行业表现的指数基金,近期备受投资者关注。Wind数据显示,杠杆资金持续布局中,数字经济ETF连续3天获杠杆资金净买入,显示出市场对数据标注产业的乐观预期3。

投资风险与建议
尽管数据标注产业具有广阔的发展前景,但投资者仍需注意市场风险。过往持仓情况不代表基金未来的投资方向,也不代表具体的投资建议。投资有风险,投资者应根据自身风险承受能力和投资目标谨慎选择投资标的3。

综上所述,数据标注产业的发展不仅关系到人工智能技术的进步,也影响着数字经济的整体发展。在国家政策的支持和市场需求的推动下,数据标注产业有望迎来更加快速的发展,为投资者带来可观的投资回报
1条评分金币+10
兵马大元帅 金币 +10 感谢参与 02-08
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个