「我們為AI準備了20年」| 專訪龍源執行總裁湯楊

2023-12-11     娛樂資本論

原標題:「我們為AI準備了20年」| 專訪龍源執行總裁湯楊

作者|知行

龍源是中國數字出版的代表性企業,核心資產經過了20年的發展和積累,聚集了全國人文大眾類90%的期刊雜誌的數字內容。這些內容從一開始就注重文本格式的數字化製作和標引,使得這些內容成為今天AI時代語言大模型最有價值的支撐素材。開創了將AIGC工具與區塊鏈版權內容互為支撐的知識服務模式。

娛樂資本論·視智未來專訪了龍源傳媒的執行總裁湯楊,探討了龍源傳媒如何結合AI技術為知識創造更大的價值,以及面對未來,龍源有何計劃和展望。

---以下為採訪實錄---

VOL.1

文可知識庫是AI大語言模型與區塊鏈內容庫結合的賦能平台

視智未來:可以介紹龍源和文可知識庫嗎?

龍源傳媒執行總裁湯楊,下同)

龍源創新數字傳媒(北京)股份有限公司是中國數字出版和數字傳媒領域的代表性企業之一,被業界和大眾廣泛認知的特色是人文大類期刊雜誌。此外,公司還有大量的其他數字化版權,包括圖書、圖片、音視頻IP以及簽約的作者,包括專業作者和草根作者。我們為公司定位的商務模式是「數字版權中台」。2022年正式命名為「知識樹」平台。我們的使命是「為知識創造價值,為知識的創造者創造財富」。

視智未來:請介紹一下文可知識庫?

文可知識庫是龍源將版權知識庫同LLM大語言模型,結合在一起的創新產品。核心功能是將版權文章參與到AI語言大模型的生成過程,輔助用戶通過歸納文章概要,加入個人觀點,以提升文章的質量和原創性。

現在AI寫作更多是幫助用戶整理思路,準確性不足。很多時候是一本正經的「胡說八道」。「文可」可以讓用戶更容易搜索到自己想要的、靠譜的知識,寫出正確的內容,把以往沉澱的知識內容從書庫束之高閣的書架上激活,變為大眾創新的鮮活題材。

VOL.2

所有的創新都是「推陳」:讓AI輔助創作內容更容易、更普及

視智未來:版權人會不會覺得,AI在剽竊我的智慧財產權?

ChatGPT所代表的AI語言大模型開啟了革命性的新時代。其不斷演進和發展的速度將超過我們的想像。版權問題是ChatGPT背後隱藏的巨大問題。這些語言大模型號稱是機器自動生成,但實際上我們知道生成的基礎一定是現有知識內容的基礎,只是利用的內容顆粒度很小,來源眾多,「無中生有」是不可能的。所有的創新都是基於以往的積累和融合。

比如我們以前寫一篇論文,可能主要受5篇文章影響,所以我在論文後面會對這些引用進行標註。但ChatGPT可能引用了成千上萬個來源,也仍然需要認可,對這些智慧財產權的認可和尊重是需要從法律、職業倫理、技術方面解決,「文可」是向這方面努力的重要一步。

視智未來:「文可」的壁壘是什麼?

所有產品最高級別的壁壘可能是價值觀,其次海量的專業版權內容庫,然後是讓使用更便利的技術性的壁壘。文可的核心壁壘就是龍源一貫堅持的「知識主體論」價值觀。我們認為知識產業的價值鏈由知識的創造者、知識的使用者和知識的經驗者構成。其中知識的創造者是根本,其次是知識的使用者,也就是用戶,最後才是知識的經營者。比如龍源、百度、谷歌、OpenAI都屬於知識的經營者。當然還有龍源獲得的海量知識IP版權內容,能夠作為用戶創作的靈感、基礎和依據。

視智未來:你們也在做區塊鏈嗎?

對。區塊鏈技術平台一直在做。國內的區塊鏈平台大部分只是一個技術鏈,而區塊鏈的確權和溯源價值必須和司法體系打通,獲得官方和法律的認可。2019年我們和北京市版權局主導的「首都鏈」達成戰略合作。版權的確權結果可以獲得官方認可。此外,我們創立了「知識區塊鏈」的新理念,2017年在北師大設立了「知識區塊鏈研究基金」,和北師大金融學院和技術學院共同成立了「北師大知識區塊鏈研究中心」,不但從技術角度研究知識內容的確權和溯源方面的難題,而且從「證券化」的角度研究區塊鏈「激勵」機制。

視智未來:未來「文可」和AI產品的發展方向是?

「文可」的使命是將已經正式發表的版權內容庫同ChatGPT結合起來,彌補現階段的短板和漏洞。包括潛在的版權問題和「政治正確」問題。

目前幾乎所有的大學、機關、媒體都明文禁止使用純粹用ChatGPT生成的文章。主要擔心文章內容的原創性和正確性無法判斷。

此外,對普通使用者來說,最基本的問題是無法給機器提出基本的指令和大綱,也就是PROMPT。我們升級版的功能將協助用戶通過PGC的內容和用戶的觀點和判斷的參與,生成具有原創性的基本觀點和大綱。而不是像現在的AI完全基於機器生成。

視智未來:還有商業模式的問題,「文可」如何實現盈利和價值?

嚴格意義上來說,「文可」以及龍源版權中台採用的是web3.0的模式。其核心特徵是「共享」而不是追求利潤最大化。

我們的大部分收入都會通過確權和溯源機制分配給版權利益的各方,此外也為平台的升級和運營服務形成良性的造血功能,主要是通過會員制的方式實現的。

我們第一階段把用戶定位於需要大量生產知識內容的領域,包括上千萬的公眾號等新媒體的運營者。他們需要每天更新公眾號內容,但純粹的GTP內容平台不會接受的。原創的內容成本太高。我們目前分為基本會員和高級會員兩種會員類型。主要區別是版權授權內容的數量和其他增值服務。

對於需要大量生產文章或視頻內容的用戶來說,完成一篇有高質量公眾號或媒體文章只有不到10元的成本,這是極為划算的。

我們本身並不提供基於算力的大模型,而是通過合作接口API整合各類算法和模型,加上其他輔助工具的增值服務,為用戶提供會員制的綜合服務。會員除了可以方便地免費使用「文心一言」「OpenAI」「訊飛星火」等大模型外,還可以引用龍源知識庫的文章內容。下一步文可還將為用戶提供「知識微視頻的創作」,讓視頻內容更加便宜優質。

視智未來:據我所知很多大廠都在尋找優質內容來訓練的大模型,你們會把龍源知識庫賣給他們嗎?

許多大企業也在構建自己的私域大模型為自己的產業和行業服務。已經有不少大企業找到我們,希望將我們的版權內容數據能賣給他們,提升內部大模型的質量,但我們提供的主要是數據內容,並不是版權的授權。

龍源知識庫的版權內容數據是已經經過專家系統參與整理的知識體系內容,是可以稱之為高結構化內容。這個價值是各語言大模型平台很看重的。我們希望他們可以按年使用付費,並和整體收益掛鉤,給龍源適當的分成。或者,我們成為大模型的一個插件,用戶使用我們的產品時單獨付費。

視智未來:類似Scholarly嗎?

對,這是最接近我們的產品。用戶寫學術論文的時候需要引用文獻,這個插件會顯示出來。

視智未來:你們為會員提供的增值服務還有查重服務和AI檢測工具嗎?

對。AI檢測工具可以推斷內容生成方面的AI比例。檢測報告的準確率很高,底層數據和知網的查重檢測是一家技術公司,實際上付費的還是學生。比如清華大學用多種檢測工具檢查學術不端的問題。但這種查重服務的模式主要是為了「除惡」,但AI檢測工具是引導行業「向善」。

視智未來:目前文可知識庫有多少會員?

目前還在試運營階段,有十幾萬註冊用戶,其中有30%的重度用戶,每天生成100多篇文章。最近三個月我們正在免費送出試用會員。現階段還不追求盈利。

VOL.3

「我們一直在為基於AI的知識區塊鏈社會做準備」

視智未來:「文可」做了多久?

「文可」的研發時間並不長。但可以說龍源20年來都在為基於AI和知識區塊鏈的社會做準備。

龍源創立之初就確立了「為知識創造價值,為知識的創造者創造財富」的宗旨和使命。「為知識創造價值」是對知識服務端來講的。知識的傳播越廣,使用越充分,知識的價值才能最大限度地體現出來。把知識鎖進抽屜里是無法體現價值的;「為知識的創造者創造財富」是對版權方來講的。必須充分保護知識創造者的利益,知識生產才能源源不斷,生生不息。而建設以知識為主體的社會才是比權力主體社會、資本主義社會更理想的未來社會。而實現這個理想的技術支撐就是區塊鏈和AI技術。從這個意義上說,我們的追求一以貫之,一開始就在為基於AI的知識區塊鏈社會做準備。

視智未來:「知識樹」平台的功能和目標是什麼?

「知識樹平台」是一個整合性的生態系統,包括區塊鏈確權平台、AI編創平台、內容分發平台以及相關的輔助工具,形成了未來知識服務完整的價值鏈。

龍源20年前就開始對所有的內容進行文本格式處理,並進行了全面的關鍵詞標引。這也使我們的內容不但可以方便地轉換為語音版、繁體字版甚至視頻化處理,而且借用AI的工具將內容按照最基礎的邏輯單位進行重組。而這正是語言大模型需要的儲備建設。

(本文呈現的談話內容僅反映受訪者的個人意見)

文章來源: https://twgreatdaily.com/zh-mo/56127ed32ac20bcb10b90d6ec33f3854.html