來源:新華網
2020-08-21 15:31:08
新華社太原8月21日電 題:“90后”數據標注師,一天在屏幕上標200萬個點
新華社記者馬曉媛、梁曉飛
“都說數據是人工智能(AI)時代的石油,我們的工作就是把原油煉成汽油。”
“我們就像一個‘幼教’,教AI更好地認識數據。”
……
聊起數據標注師這份職業,“90后”李宇龍顯得格外興奮。雖然從業僅4年,但他已經是一名資深的數據標注師。
數據標注師是隨著人工智能的發展而出現的新職業。人工智能練習認知需要大量經過標注的數據,數據標注工作最早由AI工程師完成,隨著人工智能所需數據量的不斷增加,數據標注逐漸獨立成為新的工種。
“數據標注有時候就像玩游戲。”李宇龍最近正做一個自動駕駛的數據標注項目,工作內容是對照一張2D街景照片,在相應的3D點云圖上框選打點。
“你看,把汽車框起來,都打成白色的點,就代表這是一個障礙物。”隨著鼠標快速滑動,屏幕上的點云圖不斷翻轉,一個個針尖大的數據點被標注在圖中不同物體上——藍色是路面、綠色是綠植、紅色是路沿、白色是障礙物。
李宇龍說,像這樣一張普通的點云圖,大約要標注18萬個點,一個熟練的數據標注師只用半個多小時就能完成,“這樣算下來,一天標200萬個點不成問題”。
李宇龍原本在一家印制電路板的外資企業工作,偶然機會下接觸了數據標注行業,便投身其中。他說,與傳統產業相比,這份職業有種“科幻感”:傳統行業的原料、產品都看得見、摸得著,而數據標注師只需要一臺電腦、一根網線,原料是數據,產品也是數據。
然而,這份“科幻”的職業卻實實在在地改變著現實生活。自動駕駛、人臉支付、智慧醫療、智能家居……人工智能正在給生活帶來越來越多的便利,這背后都有著數據標注師的功勞。
“雖然我們從事的是人工智能領域最基礎的工作,卻經常能體會到價值感。”李宇龍說,新冠肺炎疫情期間他和同事做了一個醫療項目,是在肺部CT片上標注病灶數據,以提高人工智能對病毒的識別能力。“平常醫生看一張CT片需要幾分鐘,如果用改進后的人工智能算法作為輔助,幾秒鐘就能初步判斷一張CT上是否存在疑似病毒。”
從事數據標注需要每天對著電腦,不免讓人覺得枯燥。但李宇龍卻說,數據標注為他打開了更大的世界,因為經常接觸不同的項目,每個項目涉及的領域也不同,會經常帶來新鮮感。
“更重要的是,這會是一個持續發展的行業。”李宇龍說,隨著人工智能進入越來越多的行業領域,對數據標注的需求會更多、要求也會更高,數據標注行業的前景無限。
如今,僅李宇龍所在的百度(山西)人工智能基礎數據產業基地,就有35家數據標注企業、2300多名數據標注師。百度智能云數據眾包則擁有超過5萬名線下采集員,超過2000萬名眾包互聯網用戶。
“每當有人問起我的職業,我回答數據標注師的時候,對方的臉上總是寫滿了問號。”李宇龍說,期待有越來越多人了解這個行業,“希望有一天,大家提起數據標注師,就像提起教師、醫生一樣。”
想爆料?請登錄《陽光連線》( https://minsheng.iqilu.com/)、撥打新聞熱線0531-66661234或96678,或登錄齊魯網官方微博(@齊魯網)提供新聞線索。齊魯網廣告熱線0531-81695052,誠邀合作伙伴。