網際網路「保安」的日與夜

2024-08-05     經濟觀察報

經濟觀察網 記者 陳月芹 做了兩年短視頻審核員後,陳樊有時會分不清現實和網絡世界。現實中聽到有人罵髒話,不小心在馬路上看到老鼠、流浪貓被軋流血,或是看到小孩出現在超市刀具區,他的第一反應都是:「斃」掉它。

陳樊的日常工作就是坐在電腦前,日復一日地速覽千餘條視頻,識別其中低俗、涉黃或暴力等違反法律法規、公序良俗的內容,輕點滑鼠和鍵盤,將其「打回」,不予發布。

每一個用戶在網際網路平台上看到、聽到或傳播的內容,包括文章、評論、聲音、字幕、彈幕、廣告、直播、用戶頭像、買家秀等,都需要經過網際網路公司內容審核部門的篩選和監測。而在這些偌大的信息工廠里,每一條以不同形式呈現的內容都被放在流水線上,經過機器初篩和分類、人工審核、抽檢、推流或限流等環節,分發到網絡能到達的世界各個角落。

當用戶為獲得流量和關注花式「整活兒」時,各大平台也緊繃著弦兒,不斷更新自身的審核規則,並將其通過算法、策略和人工審核等構成的一整套審核體系落地。僅人工審核環節,網際網路大廠便需要數萬名像陳樊這樣的基層審核員,他們分布在全國的多個審核基地內,以分秒計地處理海量信息,三班輪換,24小時、365天在線把關。

實際上,幾乎每家大廠都設置了審核崗,尤其是內容類平台,規模最大的當數位元組跳動,其直接或間接雇用著數萬名審核員,用「人牆」堆起了保障平台內容質量安全的「防火牆」。據不完全統計,國內網際網路公司內容審核員的從業規模已經達到10萬人以上。

某種程度上,審核員可以被視為內容流水線上的「數字工人」。但陳樊更願意稱自己為網際網路「保安」,因為他的工作就是把不合規的內容攔在門外。

多審一條,三到五毛

張塬是騰訊旗下內容標準化方案提供商雲雀(下稱「騰訊雲雀」)的一名審核員,日常工作是審核騰訊視頻平台上用戶發布的原創視頻。每一條視頻已經被機器算法提前細分成若干分類,而他的任務只是排掉特定的「雷」,比如敏感詞彙,涉黃賭毒內容,少兒類動畫視頻中出現的血腥、暴力打鬥畫面等。

這些通過算法初篩並成功發布到平台上的視頻,會進入待審核的「視頻池」內,在這期間至少能被個別用戶看到,經過審核員們隨機分檢後,才會被推流。如果張塬發現其含有不合規的內容,就會添加標記,駁回,如遇到疑難案例,則申請上級部門覆核。

張塬所在小組負責的「視頻池」里每天有7000多條內容,有時數量會增減,分攤下來,組內審核員每天至少要審380條視頻,長中短視頻均有覆蓋。有時候遇到長達2小時的解說類長視頻,張塬只能跳著看開頭、中間和結尾。工作量不允許他面面俱到。

對審核員來說,工資和審核量、準確率直接掛鉤。張塬所在的騰訊雲雀天津基地將審核業務依據難度分成1段—5段,再根據審核數量分成1星—5星。騰訊雲雀按照不同的內容類型將業務部門劃分為業務段,當審核員的有效工作量超過所在業務段的基本數量要求後,超出的部分可以按照階梯單價折算成績效工資,每條單價在0.3元—0.5元左右,審得越多,超額部分的單價越高。

張塬所在的業務段,5780條是最低標準,算下來每天保底275條,但沒有人會滿足於只拿及格線的工資,且客觀上的激勵機制、來自主管的要求、團隊氛圍等,使得每個人都「卷」了起來。

張塬剛入職時,每天的工作量要求是310條左右,一周後正式上機,已經漲到380條了。「有些員工鉚足勁爭第一名,審更快、更多,加班干,一個月能做到1萬多條,也帶動整個團隊流水線提速,後來,『及格線』也一再提高。」

而牽制著審核量無限提高的另一因素是準確率。張塬所在業務的月度準確率底線是98%,低於此,審核員就會被扣除相應係數的績效,低於95.5%則當月績效為0,連續兩個月低於95.5%可能會被勸退。

用戶會隨時發布內容,這要求審核員也必須24小時在崗,因此網際網路大廠的審核員需要三班倒,一般分為早班、小夜班和大夜班。對多數審核員來說,最煎熬的是大夜班,一般是在晚上11點至次日8點工作,每月輪3次—5次,大夜班會有每小時8元的補助。

大夜班的好處是審核量相對少一些,但作息顛倒導致的生理不適也讓審核員的健康亮起紅燈:上完大夜班後,張塬偶爾會突然心悸、心臟疼。

另一位在網際網路中廠工作的審核員說,她每天上班是掐著小時度過的。此前,該公司根據大數據,剔除工作量最高和最低者,算出大部分人的平均審核速度約為200條/時,約7.5小時完成當天工作,據此算出每天工作量是1500條圖文內容,剩下的半小時是喝水、上廁所時間。到了今年5月,每天的工作量已經漲至1600條,「相當於每天多了半小時的量,做不完,自己留下來加班,且沒有加班費」。為了達標,她和同事們不得不審得更快些,吃午飯時也抱著電腦。

比起圖文、視頻,實時進行的直播更考驗審核員的敏感度和耐力。陳樊說,尤其要注意深夜異常熱鬧的直播間,可能有穿著暴露、言語曖昧的主播出現,這時他只能打起精神,並養成一眼鑑別「擦邊」內容的能力。

有時,投稿人還會帶著挑釁、戲弄的心態,試圖鑽審核體系的空子。有一次,陳樊上大夜班時,審到一個短片,突然視頻中的人物一回頭露出面目猙獰的鬼臉,這給他留下不小的心理陰影,以至於下了班自己不太敢看電影。

張塬更害怕質檢部門發來的漏放、錯判的彈窗信息,這意味著扣錢、扣分、一天白乾。今年開始,他每月到手的工資從5000元降至3000元左右,「大家更喜歡十幾秒的短視頻,而看劇的人少了,直接導致待審視頻變少,有時候一天只能審100多條」。

「大廠」背後的「大廠」

審核員的工作性質,決定了內容審核行業具有人力密集型的特徵。網際網路大廠也在不斷摸索方法,研究如何組建並管理龐大的審核業務。

公開信息顯示,騰訊全資子公司騰訊雲雀、騰訊瑞德銘等主要承接騰訊整個公司的內容審核業務,騰訊雲雀旗下有西安、海南、武漢、天津等多個審核基地。B站的審核團隊主要在南京、蕪湖、成都,小紅書的審核團隊紮根武漢,快手則在成都、武漢、天津等地布局審核業務。

作為內容分發行業的巨頭,位元組跳動也在國內擁有大規模的內容審核團隊,其下設的內容質量與數據服務平台(下稱「位元組CQC」),對今日頭條、抖音、西瓜視頻等十餘款產品的內容安全與質量進行把關。

審核扛起了網際網路公司內容質量保障和安全風控的重擔。為了實現這一目的,位元組跳動搭建了一個由算法、策略、人工審核構成的閉環控制系統,這也是擁有大量用戶規模和內容基數的大廠開展內容審核的主流思路。

其中,人工審核是內容審核業務中最為外人熟知的環節。

位元組CQC的管理人員蘇昉向經濟觀察網透露,位元組跳動將人工審核業務分給三類公司承接。第一類是位元組跳動在全國設立的十餘個審核基地,位於天津、濟南、西安、武漢等地,員工簽約主體為位元組跳動子公司,享受位元組跳動員工的福利待遇,這類業務被稱為「內包」。第二類是「衛星城」項目,位元組跳動把業務分流到大城市旁的小城市,如廣東清遠、四川內江等地,一線審核員用外包形式僱傭,管理崗位由位元組跳動派駐。第三類是將非核心審核業務交由第三方公司的純外包業務。這三類業務對審核員的招募要求不同,一般情況下,用工成本逐級遞減。

位元組跳動未披露過審核業務的具體信息,據財經媒體《晚點 LatePost》的報道,2021年初其審核團隊已超2萬人。蘇昉透露,如今該審核團隊的整體規模較3年前有所增長。

管理數萬人規模的一線審核團隊,不是一件易事。

和傳統製造業相比,網際網路平台生產的內容數量龐大、瑣碎且複雜。以位元組跳動為例,其平台上的內容涵蓋文章、小說、圖片、短視頻、音頻、直播、彈幕、評論、廣告甚至用戶頭像、個人信息等,都需要審核。僅今日頭條,日活躍用戶數上億,創作者每天上傳的內容達百萬篇量級。

蘇昉說,網際網路公司是靠數據指標來運轉的,要完成某個產品的審核任務,需要先把所有內容拆解,細化成數百個、數千個項目,再制定審核規則,交給每個基地的團隊去招人、培訓、上機實操。而基地的管理層、位元組CQC中台部門通過回收審核數據,來檢驗審核的結果,並不負責調整審核規則。

位元組跳動人力資源部門前員工魏洵曾負責該公司某審核基地的人員招聘,如培訓師、不同職級的管理崗等。他透露,位元組跳動本部負責招聘管理序列,而一線審核員則通過外包的人力資源公司大批量招聘。

不同職級的管理崗支撐起整個審核基地的運作和管理。魏洵和業務部門對齊人才畫像後,摸索出了一些心得:和內容審核管理崗最適配的是電銷團隊的管理者,例如蘋果售後、移動客服的管理人員。「(這些業務的)場景很像,都是管一批人進行簡單的流水線工作,而且電銷會有管理超200人的管理崗,其他單位很少有這樣大的管理幅度。一個基地多則上千人,管理難度不亞於一個製造業大工廠。」

除此之外,魏洵還常盯著出身快消品、餐飲連鎖店的管理人員,如國美電器、麥當勞、肯德基、手機品牌線下門店的店長或經理等,定向挖人。

實體商業的管理經驗有時無法適配到內容審核業務中,所以來自頭部快消品的質量管理師有了用武之地。「這類管理者有運用工具保證車間質檢率的經驗,如果能藉此創造出新的測量工具,能作為調整審核員績效激勵機制的參考。」魏洵說。

「紅線」和「可見度」

審核員的工作不僅是排「雷」。海量內容經審核、分類處理後,能形成一系列數據,作為衡量各產品內容質量的反饋。一定程度上,內容審核不僅是監管要求使然,其背後還是一家網際網路企業價值觀的映射:依據什麼標準,來分辨一條條內容孰優孰劣。

在大型內容平台上,每天巨量的原創內容必須先經過機器審核,再由審核員識別違規內容、有潛力獲得更大流量的優質內容等,背後需要算法和策略部門制定後驗式的規則。因此,除了人工審核,後台算法部門和中台策略部門也發揮著重要作用。

一位位元組CQC策略部門人士稱,他主要負責對接審核基地,參與修訂審核規則的工作。如果人力和成本沒有上限,平台上的所有的內容都可以過一遍人工審核。正因為有上限,所以需要策略部門來決定哪些內容由機器來審,哪些內容優先審、從嚴審。

「紅線」規則較為明確,即相關監管文件里的條文精神,它是不可逾越的生命線,也是各大廠審核里優先、緊急和重要程度最高的部分。

但除此之外,還有大量內容處在灰色地帶。不同平台也在通過機器審核和人工審核等環節,在儘量不影響用戶體驗的情況下給予這類內容一定的包容度。

上述位元組CQC策略部門人士補充說,內容審核的標準不是非紅即黑的,有一定的主觀性。而且,內容管理也可以非常精細化,平台上的每條內容都有一個維度叫可見度,大廠以此限制內容的傳播,例如僅用戶自己可見,或是在流量上限定傳播範圍,包括小端小推(僅在部分埠推廣)等。例如,一些博主在視頻中分享股票、基金等涉及金融的觀點,但他沒有給出明確的投資建議。這類內容既有正面科普作用,也可能帶來風險,但並非絕對的「紅線」風險,所以平台會在可見度等維度上將其限流。

有些用戶因為內容閱讀量過低,常會投訴平台限流。「有時不關平台的事,單純只是他的內容沒什麼人看而已。」上述位元組CQC策略部門人士解釋。

而對違法內容,平台則會直接刪除、不予發布甚至封禁用戶的處理。

持續降本課題

站在網際網路公司的角度,讓審核員保質保量完成工作的同時,持續優化成本,是內容審核業務的重要課題。

將審核基地轉外包,便是其中的一個降本思路。2022年,位元組CQC內部開始推動審核業務商務流程外包(BPO)實驗,將不同核心程度的審核環節外包,並對比效果,以選擇最優方案。

蘇昉參與了多個位元組CQC審核業務從基地轉外包的工作。他說,不只是位元組跳動在做審核外包,在網際網路行業審核業務的用工管理上有個很明顯的趨勢:外包越來越多了。不同大廠之間比拼的是把降本增效做到極致,又不影響內容質量和安全。

上游的產品部門核算成本時,覺得審核業務所占成本過高,就會向位元組CQC發起降本需求。蘇昉和團隊的工作是給出多個將審核基地(內包)轉「衛星城」或轉外包的方案,其中包含轉外包後成本預計降多少、風險提高多少等數據。蘇昉需要給出具體建議,哪些審核項目更適合轉成外包,而涉及敏感信息的部分項目,如果交給外包公司做,審核員走神或對規則不熟悉,導致錯放、漏放問題內容後,平台可能因此面臨處罰。

選擇哪些外包公司,是採購部門的工作,蘇昉需要給出需求,如外包公司需要具備哪些招人的能力——能否快速招到符合資質標準的人,如果有臨時項目或審核業務臨時爆量,能否在短時間內招到足量的人。談好外包公司後,位元組CQC還需作為甲方,在前期明確招聘審核員的要求、培訓審核規則,在中後期不停地進行抽檢等工作。

將基地轉去哪裡,位元組CQC在選址上首先考慮人力成本,其次評估外包公司的報價、口碑,最後才會考慮是否離其辦公地更近一些,方便出差。基於此,「審核之都」也在不斷下沉,從最初的天津、濟南、武漢、西安等青年勞動力充足的二線城市,轉移到三四線城市,例如騰訊雲雀下沉到河北邯鄲、海南澄邁,位元組跳動CQC去了四川內江、廣東清遠。蘇昉經手的基地轉外包項目,降本比例能達到10%—30%,這和城市能級、人員素質和薪資水平直接相關。

為了承接內容審核業務,許多城市推出稅收優惠政策、興建產業園,以此吸引網際網路公司進駐。這個網際網路行業邊緣工種,能給一座二三線城市創造過萬的就業崗位,眾多年輕人將留在當地納稅、消費和買房。近年來,天津已有騰訊、位元組跳動、快手、陌陌等公司的審核業務落地,武漢憑藉高校資源優勢,也吸引了位元組跳動、騰訊、快手、網易、百度、小紅書、B站、鬥魚、金山、小米、搜狐、Soul等公司聚集。

蘇昉還表示,拉動就業率能讓這些公司獲得當地政府的稅收政策支持,這也能縮減一定的成本。

被算法代替

先使用機器審核完成初篩,再使用人工審核複審,目前仍是網際網路公司採用的主要審核流程。但用機器算法代替人力,已成為內容審核行業降本的另一重要手段。

某家網際網路小廠的一位前內容審核基層管理人士稱,以前沒有人工智慧(AI)的年代,需要鋪設大量人力去做審核。後來,可以24小時不間斷進行審核的AI算法替換了很多人力,留下來的審核員主要做樣本校正維護、訓練AI、處理AI過濾不了的問題等工作。

AI對審核效率的提升效果十分顯著。「以前人工審一張圖需要3秒—5秒,會有視覺疲勞,按照政策要求先審後發,會有內容積壓。」上述小廠前基層管理人士說,現在內容審核工作已經能實現機器秒過,掃描幾十萬字符的內容可能只需要十幾分鐘,大廠的服務帶寬和模型庫條件更好,機器審核速度就更快了。

上述小廠前基層管理人士表示,2019年,他所在公司剛接入AI審核的時候,機器審核的準確率只有70%。隨著各公司的策略部門不斷優化模型、補充模型、識別變種模型,目前行業內的機器審核準確率可以達到85%以上。

不過,用戶也在不斷對抗機器算法,有的用戶會將涉敏感內容的圖片旋轉塗畫、將敏感詞用諧音字或首字母替代。蘇昉說,這意味著人工審核暫時無法完全被機器審核替代,「當審核部門識別到多數用戶存在新的違規行為,而機器算法覆蓋不了,就必須調整規則,策略部門、算法部門和審核基地迅速開會拉齊信息」。

蘇昉還稱,不管是審核基地,還是中台的策略部門,現在正配合位元組CQC提供審核數據,訓練機器算法。「一定程度上,審核部門承擔很多投喂數據、訓練機器的任務,但把機器訓練得越好,審核和策略部門人員被裁得也越快。」

據上述小廠前基層管理人士觀察,受機器算法衝擊最大的,就是基層審核崗位。很多已經適應當前基層工作、不會去主動學習更深層次的業務、安於現狀的審核員,通常是網際網路公司的裁員目標。

對陳樊來說,這不算是個好消息。在做了兩年視頻審核工作後,他發現自己的語言組織能力和邏輯思維能力明顯下降。這份重複點擊滑鼠的工作,幾乎不需要他進行表達和創造。

(應受訪者要求,陳樊、張塬、蘇昉、魏洵為化名)

文章來源: https://twgreatdaily.com/zh/ee94b998ce4114254f070f9120c2aa27.html