更新时间:06-05
去年冬天,我跟着一个做自动驾驶的朋友去他们公司参观,进门就看到一整面墙的屏幕,上面密密麻麻标注着各种颜色的框框,红的、黄的、绿的,把整条街道上的行人、车辆、交通标志全框了出来。朋友指着屏幕说,这些框框全是人工一个一个画出来的,光标注一条一公里的路,就要花掉三个标注员整整一天的时间。我当时就震惊了,原来我们天天念叨的自动驾驶,背后竟然是靠人肉一个个框出来的。后来我才慢慢搞明白,这就是数据批量标注地图,一个听起来特别技术流、实际上特别土办法的行业。

这个行业到底有多土呢?我认识一个在数据标注公司干过的姑娘,她说她们团队接了个项目,要标注某个城市所有路口的红绿灯。甲方给了一万张图片,要求把每个红绿灯的位置、状态、朝向都标出来。她们二十个人,对着电脑屏幕,一张图一张图地画框,画了整整两个月。画到那个姑娘说她闭上眼睛都是红色的框框在眼前晃。更夸张的是,标注完第一遍还要质检,质检完再返工,返工完还要二次质检。她说有一次她们标注一个路口,因为红绿灯的角度问题,跟甲方来回沟通了七次才通过。这就是数据批量标注地图的日常,看起来是个高科技产业,干起来却是流水线女工的活儿。
但你别小看这个土办法,它养活了一个庞大的产业链。我查了一下数据,截至2023年,中国大概有超过500家数据标注公司,从业人员超过30万人,光北京周边的河北、山东,就有几十个标注产业园。这些公司接的单子五花八门,有给高德、百度做路况标注的,有给自动驾驶公司做障碍物识别的,还有给测绘局做地图更新的。最夸张的是给滴滴做打车点标注的团队,要把全国几万个公交站、商场、小区的入口位置一个个标出来,标错了乘客找不着车,司机也找不着人。这个行业的特点就是,越细碎的活儿越值钱,越没人愿意干的活儿利润越高。
但是,这个行业正在经历一场巨大的变革。去年我去参加一个行业论坛,台上一个做AI算法的博士放了一段视频,是他团队开发的自动标注工具。视频里,一个红绿灯在几秒钟之内就被自动识别、框选、分类,整个过程不需要人工干预。博士说,他们现在的准确率已经达到97%,剩下的3%才需要人工复查。台下坐着几十个标注公司的老板,脸色都不太好看。有个老板散会后跟我吐槽,说他们公司刚花了200万买了500台电脑,准备大干一场,结果AI一来,这些电脑可能全要改成网吧机器了。这确实是个残酷的现实,技术革新的速度,往往比从业者想象的要快得多。
不过,AI也不是万能的。我后来专门找几个做地图标注的技术大牛聊过,他们告诉我一个有意思的现象:AI在标注城市主干道、标准路口的时候确实很厉害,但一遇到农村小路、山区盘山道、老旧小区里面那种弯弯绕绕的巷子,就彻底傻眼了。为什么?因为AI学习的数据主要来自城市,农村和山区的地图数据本身就少,AI根本没见过。更麻烦的是,有些地方的路况变化特别快,比如北京胡同里的临时施工、南方水乡的涨水断桥、西北戈壁的沙丘移动,这些突发状况AI根本处理不了,只能靠人工现场去拍、去标。这就意味着,标注行业的未来,不是AI替代人,而是AI干它擅长的,人干AI干不了的。
这种分工的变化,正在重塑整个标注行业的生态。我认识一个做地图更新的老板,他以前手下有200个标注员,每天的工作就是把卫星图上的新建筑、新道路标出来。去年他开始引入AI自动标注,效率提升了三倍,但标注员的数量不仅没减少,反而增加到300人。为什么?因为AI把那些简单的、重复的标注工作全干了,但标注员需要处理的复杂问题反而更多了。比如AI标出的新建筑,需要人工确认是不是违章建筑、是不是临时建筑;AI识别的新道路,需要人工核实这条路能不能走大车、有没有限高杆。这些判断性的工作,AI目前还做不了。这个老板说,他现在的标注员更像“地图侦探”,而不是以前的“绘图工人”。
这里面还有一个更深的逻辑,就是数据标注的本质正在从“量”转向“质”。以前大家拼的是谁标得快、标得多,一个标注员一天标1000张图就是高手。但现在,地图应用越来越智能,用户对精准度的要求越来越高。比如高德地图推出的车道级导航,要求每个车道线的位置必须精确到厘米级,标错一个车道,导航就会把用户引导到逆行车道上。这种高精度的标注,一个人一天能标50张图就算不错了。而且这些高精度数据的价格,是普通标注数据的十倍以上。所以现在标注公司都在抢着做高精地图的标注,虽然干活更慢了、更累了,但赚的钱反而更多了。
我想说的是,数据批量标注地图这个行业,表面上看起来是个技术问题,实际上是个管理问题。我见过最赚钱的标注公司,老板以前是开服装厂的,把流水线管理那一套搬过来,标注员分成小组,每组设组长,每天定额定量,超产有奖,质量倒扣。也见过最惨的标注公司,老板是学计算机的,花了上百万买最好的标注软件,结果员工效率反而比用免费软件的小作坊还低。说到底,地图标注跟造汽车、做衣服没本质区别,都是把人组织起来,用最笨的办法,干最精细的活。只是现在,这个最笨的活正在被AI一点点蚕食,而那些能在这个行业活下来的公司,一定是既懂管理、又懂技术、还愿意跟AI抢活儿干的公司。