【AI 時代】AI 並非取代人力 若水身障數據標註師找到新活水

有些公司為了處理數據,從工程師請到工讀生,大概跑半年花了大量時間標數據,然而沒有專業的標註系統,一致判定標準最終效並不好,但卻已花上了徒勞的人力成本。
評論
若水執行長陳潔如 Sabrina(左)若水 AI 事業部協理簡季婕 Jessica(右)Photo Credit:INSIDE/Anny 攝
若水執行長陳潔如 Sabrina(左)若水 AI 事業部協理簡季婕 Jessica(右)Photo Credit:INSIDE/Anny 攝
評論

沒有數據的 AI,彷彿沒有輪子的車子,數據的確很重要,要說是產線的一環也無疑,不過在產業蓬勃發展,技術光環背後,人權的價值更該被彰顯,除了數位化下應運而生的資料權、不同科技產業中的工作權、公平的資訊人權

不少文章聳動的標題直指 AI 的工作將會讓未來多少的人失業,但鮮少人真正去理解,在 AI 的浪潮下將會應運而生哪些新的工作,舉例來說,AI 數據標註師不僅是處理數據,更能透過協作與即時回饋讓工程團隊調整模型,提升開發效率。

若水國際讓身障數據標註師找到新活水,乘著 AI 的浪潮,讓身心障礙者同樣能享有工作權,結合 AI 產業電腦視覺專家與身障數據標註師,形成自家 AI 數據服務團隊,讓數據標註工作者創造更高價值。

AI 浪潮下孕育的新興工作者

「若水是社會企業的本質,但是還是要符合市場客戶、身障者就業雙方面需求。」執行長 陳潔如 Sabrina 斬釘截鐵說道。

過去若水在第一個事業體 BIM(Building Information Modeling,建築資訊模型)其實已經取得不錯的發展,但是對於需要就業協助的身障者大多在出門工作上有困難,而 BIM 卻是需要高度協作的工作,於是團隊轉而思考,在高科技發展下還有哪些市場上的痛點,能透過遠端的協作挹注動能。

概覽市場現況,當時 AI 正在起飛,人工智慧發展大多與「數據」無法分割, 然而,很多業界的開發者、演算法工程師大多反應為了處理巨量資料,已耗盡時間,要處理演算法工程還有一段距離。

陳潔如認為,在產業分解上已經需要一個專業團對隊來協助,於是 2018 上半年籌組引擎,搭建身障者訓練系統。

一位數據標註師從 0 到上線接案的流程可以拆解成三階段:招募評估、職前訓練再進入正式標註訓練,最終完成考核,對很多身障者來說這都是第一份工作,工作意願、職能評估等審核,適性是最重要的評估,通過後才會進入人才庫。職前訓練包含如何運用 Zoom 開會、 Google Drive 的使用,其他還有資料安全保密重要性的基礎知識等等。

標註訓練包含畫 Bounding Box 或是 Segmentation 等各項技能,每項都有認證機制,完成之後才能正式成為標註師上線接案,根據每個個案居家狀況不同,完成上述流程正式工作時間略有差異,不過平均來說兩到三個月可以開始接案。

為佈建更迅速的就職流程,團隊甚至和認知心理學的博士合作,逐一將訓練中的核心能力建立起來,發展標註師核心能力研究,透過重點培養加速對接效率。

若水_AI_數據標註師_02
AI 數據標註師透過自身專業和工作輔具,在家遠距處理來自全球的 AI 專案 Photo Credit:若水

身為 AI  幕後推手,若水 AI 事業部協理簡季婕(Jessica)認為團隊在專案執行上的精神是驗證和回饋,因此他們會把市場執行成果回饋到訓練團隊,把這些元素做拆解放入課程中,確保教材與時俱進和市場能接軌,大眾也許覺得標註很簡單,似乎就是 Bundingbox。

然而,從 2018 年開始佈局,便發現隨著市場應用深化,標註也越來越多元,不在單純是像過去畫框框初步的 Bounding Box、下關鍵點,標註和應用息息相關,以台灣來說,智慧城市、無人車、醫療、安全監控等都走向加值 AI 化,監控涉及的不只靜態,還有動態,不同層次的 AI 訓練,要把這些拆解成不同單元。

透過完整的訓練能夠上手處理市場客戶的專案。2018 年年底若水的第二個 AI 事業體,也就是 AI 居家標註師團隊,正式商轉開始接案,目前日本也是若水的關鍵重要市場,目前在東京已設有據點。

綜觀日本市場,由於人力高昂,有更多應用需要減少人力,像是日本的智慧農業,在番茄、小黃瓜等作物的栽種應用,以及建築瑕疵檢測等。若是透過人工智慧輔助需要人力進行數據標註,再這之前就要先了解不同領域的 Know how,而若水認為目前自家 BIM (建築資訊模型),未來可與 AI 結合,兩個獨立事業體相輔相成助力建築瑕疵檢測。

企業落地應用的瓶頸 該怎麼解?

報章雜誌上洋洋灑灑報導著某企業導入了多少 AI 專案,將持續投入資源加大推廣,但是究竟這些有多少是在概念驗證,有多少真正走到商業驗證階段?

一直以來,在很多發表場合上,無一不是秀出 AI 壯碩的發展,但是這些份量究竟是扎實的訓練肌肉還是虛胖,仍然打上一個問號。若水 AI 事業部協理簡季婕(Jessica)就來聊聊,從數據策略夥伴的角度,究竟大家遇到什麼困難?

從 PoC, Pilot, Production 構成企業導入 AI 的金三角來看,目前絕大多數公司的確都是落在前兩者居多,能走到最後的以新創公司為主,但為數也不多,許多大企業想要導入但是進度仍是不如預期。

根據日前 IDC 調查,高達 71% 的企業領導者,認為 AI 將提升組織競爭力有所助益,但在台灣卻只有32%企業展開 AI 轉型。

根據若水的調查顯示,超過 60% 以上的企業不知如何有效精準的處理數據,對導入數據讓 AI 落地感到迷惘。過去的討論皆集中在 AI 的技術積累上,但是對於落地應用卻仍有距離。Jessica 認為最大的問題是:有沒有選對好的命題,專案題目太大,技術太深,又或是答案可解根本不需要 AI,找到痛點,而不是 nice to have。

對於如何選擇對與好的題目,目前許多是 AI 新創,協助大公司達成解決方案的,讓新創去幫大公司找題目,真正讓應用落地。另一種常見的是,大企業自己想佈局 AI,許多都成立AI 部門單打獨鬥,為了加大成功機會,一次就開很多個專案次議題,但是忽略中間所需花上的人力資源與成本,在資源分散下反而降低落地的機會。

從概念驗證的 POC 到第二階段都需要大量數據,圖像識別可能從五千張圖片資料到數萬張,要提高到 80-90% 的準確率需要的數據量是大大的倍增,並經由多次的訓練,才能讓模型真正運行。

許多企業輕忽從 PoC 到 Pilot、Production 階段的數據資料量和成本費用是遠超過想像的,模型要判定越來越難的數據,完成不同情境分門別類,對應的資料餵給養模型。

工程師沒有時間去看十幾萬筆資料,數據定義特徵值、蒐集數據能找尋策略夥伴專業分工,把模型各階段所需的數據規劃好,近一步協助 AI 專案管理清楚畫出 Roadmap;而透過數據標註師處理時遇到該批資料特性即時給予回報,讓工程團隊調整模型參數,提高資料訓練效率。最終甚至可以將數據重複使用,多個模型一起試驗, 讓 AI 專案的驗證變快。

單打獨鬥的隱形成本看不到。

有些公司為了處理數據,從工程師請到工讀生,大概跑半年花了大量時間標數據,然而沒有專業的標註系統,一致判定標準最終成效並不好,但卻已花上了徒勞的人力成本。

AI 是人機合作並非取代人類,把很基礎且重複性的工作取代,人力升級為知識工作者。

陳潔如有感地說。

也會有許多新興工作應運而生,在 AI 世代是以數據處理為核心的團隊,像是專案管理、RD 的思維都會有所不同,無法百分之百沿用過去的方法 。AI 世代下要把既有的人才 AI 化,若水本身滋養團隊能在這樣的世代做好工作,當初針對職稱也思索一番,最後以數據標註師定案,對於身障者是一個職業的尊嚴,對於 AI 世代更是新工作型態沿革的意義。

若水AI數據處理服務團隊_核心管理團隊_包含日本分公司社長
若水 AI 數據處理服務團隊與日本分公司社長。Photo Credit:若水

核稿編輯:Mia





精選熱門好工作

Web / Mobile App Developer (台北)

Oursky Limited (Taiwan)
臺北市.台灣

獎勵 NT$15,000

樂趣買Marketing Specialist(Rakuma)

台灣樂天市場
臺北市.台灣

獎勵 NT$15,000

(Platform)Senior Software Engineer

ShopBack 回饋網股份有限公司
臺北市.台灣

獎勵 NT$15,000