我們有3億道題,至少60家大模型要買|專訪景聯文

2023-09-08     娛樂資本論

原標題:我們有3億道題,至少60家大模型要買|專訪景聯文

在人工智慧日益嶄露頭角的時代,數據標註成為了支持AI系統學習和成長的關鍵環節。而在這一背後不太為大眾所知的領域,景聯文科技顯然已經占據了一席之地。

這家企業不僅為全球的AI從業者和研究機構提供多元化的數據服務,還在醫療、教育等領域深度耕耘,打造出了專業題庫和醫學資料資料庫。為了了解更多關於景聯文科技的故事,娛樂資本論·視智未來採訪了其CEO劉雲濤。

景聯文科技成立於2012年,是一家以人工智慧數據服務和軟體開發為主的科技企業。

---以下為採訪實錄---

視智未來:可以介紹一下你們公司嗎?

景聯文科技CEO劉雲濤(下同):

2012年,我們看好人工智慧賽道,成立了景聯文科技,是一家以人工智慧數據服務與軟體開發為主的國家高新科技企業,為全球的人工智慧從業公司和高校科研機構提供AI數據採集、數據標註、數據集產品、標註平台定製開發等服務。

視智未來:你們數據採集標註的主要業務範圍是?

業務範圍包括常規的算法模型訓練需要用到的圖像視頻、語音、文本、點雲等。此外,我們也投入了巨額成本在指紋數據採集和泛健康領域的心率、血氧、血壓等數據採集業務上,目前全球幾乎所有手機廠商、指紋晶片廠商、測試機構的指紋數據都來自景聯文科技。

視智未來:你們在降本增效上有新舉措嗎?

內部降本上,我們通過自研智能標註平台和內部標準化管理系統的加持,提高內部的協同流程,將非標準化產品做標準化操作,降本增效。現在,2D拉框標註項目的成本降低了50%。

同時我們也一直深耕在數據領域的專業度,比如我們在AI醫療健康領域重點加大研發投入和設備投入,目前我們在該領域可以說是行業專家。

視智未來:你們有客戶分類嗎?

數據採集標註是非標準化產品,小客戶和大客戶相比,訂單量和收益都相差很打,經過一系列的沉澱思考和利潤考核,我們更願意選擇在頭部客戶中做深耕。

視智未來:你們現在的數據標註員工的情況是?

現有景聯文科技在全國有超過1000名全職標註人員,標註基地分布在杭州、衡陽、金華、武漢等。

隨著AI行業快速發展,數據標註行業對標註員的學歷等級、語言能力、理解能力,專業知識背景的要求都越來越高,比如語言標註團隊要求會各種小語種,醫療標註需要醫學院畢業的學生。

視智未來:工資的下限和上限能到多少?

只論標註人員,AI越來越智能,簡單的標註項目越來越少,標註難度越來越高,每個採集標註項目的難度也不一樣,工資上下限空間差距很大,上限能到11000,下限的話3000左右。

視智未來:人力成本占公司經營的多少呢?

40%人力成本,40%左右研發成本,剩下來20%綜合成本。景聯文科技已經從以前的純人工標註,發展為目前AI算法預標註加人工標註審核的生產模式。不能把數據標註公司做成一個人力公司,但也不是像網上講那麼瘋狂,說標註可以完全自注化,一萬框一秒鐘就能拉完。

視智未來:你們的壁壘是什麼?

第一、目前大語言模型火爆,把我們點爆了。教育方面,我們手上有3億道從小學、大學到職業教育的題,格式統一,解析維度包括專題分類、分析過程、考點解析、解答過程、教師點評等。醫療方面,我們也有超過400TB的醫學資料資料庫。現在大模型號稱百模大戰,至少有60家都要買我們的題庫。

第二是客戶資源。市面上80%以上的科技企業、獨角獸、上市公司,我們都在他們的供應商庫里,這就跟其他新公司不一樣。景聯文有非常好的市場資源和客戶資源。

第三是產品,在標註領域我們不斷投資研發景聯文智能標註平台。

第四是內部管理系統,景聯文從一個項目客戶進來,到最後項目結束是一整套的內部標準化的管理系統,能夠實現降本增效。

第五是專業性,原來我們和同行公司對 AI醫療和健康領域的數據採集都不專業,三年前出現心率、血氧、血壓這些數據業務,同行不關注,景聯文科技關注,重點投研發、買設備,招投標時雖然同行都參與,但他們的價格永遠比不過我們,因為這項業務他們做不了就要委託別人去做,成本就高,但我們是很低的,這就是核心競爭力。

視智未來:數據標註未來有哪些新機會和挑戰?

數據要專業性和前瞻性,比如醫療大模型需要三甲醫院的專家的病理數據,才能去做更高級的判斷,否則這事兒就沒有意義。前瞻性是要比其他人看的更遠更長更快,比如我們兩年前就開始拓展標註場景,選了醫療賽道,我相信不管經濟多不景氣,醫療始終有存在的意義和價值。

視智未來:政策方向你們有什麼建議嗎?

未來,中國的數據流通怎麼更合規化、更安全化是很大的問題,現在很多城市也在建立大數據交易中心,是積極的信號。

文章來源: https://twgreatdaily.com/zh-sg/373d386726b3e7473a9f838d99f80dc8.html