AIGC的數據標註訂單雷聲大雨點小,大模型不好用正常|專訪匯眾天智

2023-09-08     娛樂資本論

原標題:AIGC的數據標註訂單雷聲大雨點小,大模型不好用正常|專訪匯眾天智

在數字時代,數據標註逐漸成為人工智慧產業的背後英雄。它是許多先進技術的基石,從自動駕駛到語音識別,都離不開它的支撐。

近日,娛樂資本論·視智未來專訪了成都的匯眾天智總經理駱靖元。匯眾天智成立於2017年,是一家數字化服務提供商,為客戶提供數據採集、標註、審核、驗收等一站式服務。視智未來與駱靖元探討了該行業相關的熱門話題。從招聘背後的學歷要求到行業內部的激烈競爭,從大模型的發展趨勢到數據標註行業的興衰變遷,這次的對話為我們揭開了一個鮮為人知的數據標註領域的面紗。

---以下為採訪實錄---

關於員工

視智未來:你們招人對學歷要求高嗎?

匯眾天智總經理駱靖元(下同):

如果從全行業來判斷的話,不太高,但是你從業務上判斷的話。AIGC標註業務的公司基本一半是本科生。

大模型要有易用性,這要求標註員判斷內容的時候,要有知識儲備,邏輯判斷能力。整體說標註工作挺無聊的,所以流失率比較高。

視智未來:新聞寫寶媽是主流。

三年前、四年前可能這種還行,現在沒法保證質量和效率,很少了。現在人工智慧火後招人不用科普了,2017年京東的標註業務叫智能客服。

視智未來:今年2月GPT爆火,對你們影響大嗎?

剛開始訂單多了一些,可能整個社會都需要一個夢想,資本也需要炒冷飯。那時大公司的目的更多是為了割韭菜炒股價。後來大公司發現變現難,七八月份就很少在數據標註上投入了。實際上,我們訂單量沒有猛增,雷聲大雨點小。

視智未來:做大模型不需要多做數據標註嗎?

他靠以前原有的那些數據也能做大模型,如果市場反饋好再接著投錢,不好就不玩了。

這也說明了為什麼AIGC出來的時候,數據標註業務沒怎麼增長,是因為他們並沒有花錢來做這件事,而是找了國外現成的數據。

視智未來:你們現在競爭激烈嗎?

激烈,公司有定期篩選的機制,比如說這批我需要10家公司。那我就從100個裡面篩選,其中哪兩三個不合適,我再動態替換。這使得一些公司不斷報低價,惡性循環。

視智未來:你們接到的項目多是文本、圖片嗎?

圖像、文本、語音三大類都會有,看團隊更擅長什麼。圖片的話自動駕駛方面比較多。視頻標註是抽幀成圖片的形式做,應用在輿情監控方面。

關於行業

視智未來:你是怎麼入行的呢?

我以前在京東做智能客服,後來回家鄉出來單幹了。

視智未來:從業多年,你有什麼感受嗎?

我們同事常說,當看到應用落地的時候,還是比較欣慰的事情。雖然工資低,但終歸是做了點有用的事情。

視智未來:這幾年行業變化大嗎?

政府側推動效果也不是特別理想。數據標註行業2015 、2016火,2017年開始熱度下降。

像百度做了語音採集,高德、訊飛會再做一遍。算法都沒變,標註都是新瓶裝舊酒,同樣一批人臉識別的圖片,A公司做完B公司做,之後C公司再做,我們始終是在給別人做嫁衣。但這樣的日子也好景不長,如今訂單量變少,人員迅速增加後又會有斷檔期,大部分公司死在了斷檔期里。

視智未來:那能做數據中間商賺錢嗎?

一個是數據屬於客戶,另外雖然說的是 100 張圖,但不是同一批人的。

視智未來:你們的壁壘在哪裡?

地域優勢,人員成本其實不算高。管理能力,執行水平。數據保密的技術處理上。此外,我們有行業認可的學標組身份。

視智未來:你們行業為什麼越來越卷呢?

門檻低是最直接的問題。

視智未來:你怎麼看待行業發展呢?

人工智慧的產品會越來越多,行業越來越好的時候,也會越來越透明,越來越卷。

文章來源: https://twgreatdaily.com/zh-sg/07dc4073ccd10f436190ff52a768048f.html