隱私計算九問!涉及斷直連、ChatGPT、數據開放

2023-04-21     零壹財經

原標題:隱私計算九問!涉及斷直連、ChatGPT、數據開放

作者 | 楚濟慈 來源 | 零壹財經

脫離數據安全談數字經濟的發展是虛妄的,且不能高效流通數據的數字經濟是僵死的。安全與流通,兩者的平衡,僅僅通過制度規定還不足以實現。技術發展帶來的問題,還是要靠技術來解決。在此背景下,隱私計算被寄予厚望。所謂隱私計算,是指在保護數據本身不對外泄的前提下實現數據分析計算的技術集合,達到數據「可用不可見」的目的,在充分保護數據和隱私安全的前提下,實現數據價值的轉化和釋放。

4月9日,「零壹讀書會04期:《隱私計算:數字經濟新基建》」在京舉辦,中國精算師協會會長、數字保險智庫學術委員會主席王和,全聯併購公會信用委副主任、北京信用學會副會長劉新海,洞見科技創始人、董事長姚明,鍩崴科技合伙人、醫療大健康事業部總經理吳凡,零壹智庫CEO柏亮圍繞書籍共同探討了隱私計算在數字經濟時代的發展、應用、創新和趨勢。本文是對現場交流環節的全記錄。

1、多中心節點的前提下,使用不同的隱私計算平台,會影響互聯互通嗎?

姚明:肯定有影響。在沒開源的前提之下,隱私計算公司對於數據的處理機制、計算的協議其實都是黑盒狀態,這也正是互聯互通技術標準建立的初衷。從約束性角度來說,未來,相關標準應該會約束其他隱私計算廠商,對於新進入隱私計算賽道的一些創業公司,在做自己的平台算法和架構時,也一定會參考互聯互通的技術標準。

從商業化落地角度來看,確實有一些客戶構建了自己的互聯互通平台,它可能是一個數據應用方,和它所提供數據的機構使用不同的隱私計算平台。這時,需要建立互聯互通的底座,包括去做互聯互通實質性的交互開發,這已成為現在商業化的常態。洞見科技的一些銀行客戶,包括通信運營商客戶都在做這樣的事情。

從影響的方面來說,第一、技術的複雜度肯定會增加。標準雖然建立了,但是需要適配這個標準,然後對於自身的技術體系做出一些規範和調整是必不可少的。第二、這種互聯互通的技術體系本身不同於開源。如果開源的話,大家很容易就互聯互通了,目前我們所有談到的互聯互通是指至少有一方是閉源狀態。對於閉源的互聯互通,勢必會涉及到算法的可信和互通協議的安全問題。從技術上來說,我們需要不斷地去優化和疊代這套標準體系,讓連接的多方能更容易建立信任,更容易評估平台互聯互通之後的安全性。

2、互聯互通,醫療領域會更難嗎?

吳凡:舉個簡單例子,目前很多醫院應用的醫院信息系統HIS,以及電子病歷和患者主索引軟體EMR,這兩種軟體都存儲了患者信息、醫生的診療診斷信息等。在美國做這類軟體的廠商只有三四家,這意味著只要這三四家的接口打通就可以互聯了,但在中國這類廠商有三四百家,要把所有接口都打通非常困難。

不過,經過十多年的發展,目前醫療領域數據互聯互通已經有了很好的進展。原因在於我國要求電子病歷標準化,醫院和區域互聯互通已經做了很多年。目前的狀況是,相比十年前明顯看到了很多進展,但是仍然沒有辦法做到暢通無阻的互聯互通。所以一方面需要用新的技術去打通,另一方面需要在法律法規層面來解決。

3、信創產品用了飛騰的CPU、麒麟的作業系統、達摩的資料庫,這是否是一個可信的環境?國外像英特爾、AMD、ARM等都有自己的TEE(可信執行環境),這兩者有何區別?

吳凡:這兩種一個可以理解為廣義的可信執行環境,另一種則是狹義的可信執行環境。

廣義的可信執行環境就是大的信創範疇,包含資料庫、伺服器、各種各樣的伺服器作業系統等等來達到可信。狹義的可信執行環境,比如英特爾的SGX,是真正的可信執行環境。TEE是一種單獨的技術,是在計算平台上以軟硬體方法構建的一個安全區域,保證在安全區域內加載的代碼和數據在機密性和完整性方面得到保護。

廣義、狹義這兩者不衝突,未來在整個大的信創範疇內,也會應用到隱私保護計算的可信執行環境。鍩崴科技推出的鍩崴信隱私保護計算一體機,目前除了可以支持英特爾的SGX,包括ARM架構,還可以支持信創產品,如國內的飛騰、海光、鯤鵬都可以支持,相當於我們用了這樣一個可信執行環境技術,適配了信創大場景下的每一個參與方。

4、政府數據開放的效果如何?在數據要素市場產生經濟價值了嗎?

姚明:政府數據開放和商業化數據開放有著本質的差異。對於政府數據開放來說,商業變現不是主要訴求,更多還是促進社會公益和賦能實體經濟發展。同時,政府數據開放,是在分類分級標準指引下的逐步開放。從2021年開始,已有一些政府數據基於隱私計算開放的商業案例真正落地。不過,各地方政府數據底層基礎設施的完備程度不同,分類分級標準也並不完全統一,所以也會導致各地政府數據目錄有比較大的差異。

目前,對於這類純粹的公共數據開放,障礙是最小的。比如說一些環保的信息、治理的信息、統計類信息或者群體類信息開放,幾乎沒有什麼障礙。阻力比較大的是涉及主體信息的數據開放,不管是以個人為主體還是以企業為主體,這類數據往往價值更大、更直觀,從風險角度來說也是挑戰最大的。所以也導致了各地方政府對於這類數據開放的程度、顆粒化細化程度和開放時間的步調會形成比較大的差異。

隨著隱私計算技術的推廣和被信任,「數據二十條」等政策的發布,越來越多的行業標準和測評認證機構給予隱私計算技術以肯定,隱私計算勢必會逐步改善這件事情,但是從進展來說政府數據開放的進度仍遠遠落後於商業化數據開放的進度。

5、如果隱私計算普及,斷直連模式是否可以取消掉?

劉新海:斷直連的初衷是想解決個人隱私保護以及網絡信息安全問題。如果有技術手段把這兩個問題解決了,監管放心,社會放心,銀行也放心。所以大家嘗試隱私計算,但其基礎設施建設不是一時半會可以完成的。目前徵信機構還有很大問題,作為新生機構,它們的服務能力跟不上,同時也伴隨著監管問題,建議隱私計算廠商可以往徵信方向嘗試。

隱私計算還有兩大問題也不能忽視,第一個是效率,隱私計算數據處理效率問題亟待解決。另外一個問題是隱私計算需要配套機制。此外還包括大眾對隱私計算的認知,新技術要想完全推廣應用不是特別容易的事情,特別是這類非常前沿、有挑戰性的技術。

6、在數據跨境上,隱私計算有哪些應用或嘗試?

姚明:基於隱私計算技術的數據跨境,洞見科技在2020年就已開始嘗試。從技術上來說已經具備了商業化條件,但依然會受政策性因素的困擾。

目前很多企業實行報備機制,比如報備哪些數據要離境,數據要用於什麼目的等等。從監管的視角來看,企業是不是如自己所宣稱、報備的那樣,輸出數據和報回數據內容是一致的,這實際上是一個監管問題。應用隱私計算技術,並給出一些方案和探索實踐,主要是從監管這個角度來說。在數據可用不可見的情況之下,去驗證這些企業所宣稱的與實際的行動結果是否一致,是否符合國家政策法規的要求,仍需要隱私計算廠商繼續去做探索和實踐。

劉新海:通過研究全球徵信,我發現其實在沒有隱私計算之前,數據跨境早就實現了,比如歐美之間的通商數據早就跨境了,人都可以流動、數據自然也跟著動了。具體的例子像歐盟一體化,它的徵信數據是可以跨境流動的,他們當時是在機制的設計下就搞成了,那是十年前的事,當時還沒有隱私計算。

現在有了隱私計算技術,我覺得會更好。目前粵港澳大灣區數據、徵信為什麼推不動,最重要的問題是沒有一個非常強有力的「領導」,當然監管也需要有人來推動。另外隱私計算技術在國內要想大量應用,需要一步一步地推廣,一步一步地解決跨境問題、徵信問題、AI問題以及數據孤島的問題。

7、通用隱私計算技術的出現,是隱私計算最後的突破?

姚明:這是個技術問題。沒有萬能的技術只有萬能的方案,方案是對技術的拼接和對技術本身的重組和重構。

隱私計算技術所謂的流派之爭,並不是在商業化實踐層面,更多是在學術層面有爭議。商業化實踐的層面更多圍繞行業的一個領域、客戶的具體需求給出最優解決方案,這個方案包括技術本身,也包括它的商業性價比,這其實才是真正推動一項技術快速疊代和產生大規模應用的出發點。

我們當然希望有理想化的技術可以解決全部的問題,理論上來說,密碼學、同態加密等這些技術的組合可以解決絕大部分技術場景的問題,但是因為計算複雜度、性能、網絡帶寬消耗等問題,導致在商業化的過程中遇到了各式各樣的問題,無法真正取得大量商業案例的落地,這才有了大家去研發新的、更輕量化的技術體系。

從我的角度來看,通用型技術就是一套融合引擎。剛才談到ChatGPT,它並不是一個技術而是一類技術,僅僅靠著一類技術仍然不能夠去開發出超級人工智慧模型,還需要喂進去大量的數據,這正好補充了一點,對數據跨境,擺在面前最實際的問題就是ChatGPT需要數據喂它的時候,如果你用的是境外的ChatGPT,可能數據就已經出境了。

前幾天有很多國家,包括國內的一些機構,在討論要不要斷掉ChatGPT現階段的使用或者限制,說明一項技術即使通用也可能產生很多意想不到的負面東西,所以需要綜合更多的技術,或者更多的方案才能變成讓各方都滿意的解決方案。在我看來,ChatGPT在不遠的將來也會引入隱私計算等技術,堵上當前數據泄露或者隱私泄露的「坑」。

吳凡:通用取決於從哪個角度去看,對於廠商和供應方來講,我認為是不可能通用的。目前隱私計算的技術框架有3種,即依賴硬體的可信執行環境,依賴密碼學的MPC及同態加密,依賴人工智慧的聯邦學習,這些技術路徑不可能通用。

但是從用戶的角度講,最終肯定是通用的,因為用戶最終只看到一個結果——是不是計算效率夠高、是不是算力很少、是不是能達到精確的計算結果。這是鍩崴科技,乃至整個行業努力的一個方向,即用各種各樣不通用的技術方式,最終達到給用戶通用的結果和感受。

8、「數據二十條」對隱私計算的落地有哪些助推作用?

劉新海:國家數據局的組建,意在促進數據的應用,以及促進數據的集中管理。未來的職能仍有待觀察,對隱私計算肯定有促進作用,但是不能期望太高。在研究數據的過程中,我發現有些理念跟現代實際的體量以及應用的生態是不匹配的。大家不能只依靠國家來出政策,而是需要行業、智庫以及各方力量共同推進。

9、隱私計算未來要想快速發展,最重要的三件事是什麼?

吳凡:第一個最想乾的事是把《隱私計算:數字經濟新基建》這本書讀完。第二,希望更多擁有數據的人可以了解隱私計算這項技術,並且信任這項技術。第三,希望行業對技術供應方案的要求更嚴苛些,倒逼業內真正有技術實力的公司和人才脫穎而出,如果說行業需求始終局限在level100,那就沒有辦法真正檢驗出擁有level500技術能力的公司,希望這個時刻儘快的到來。

姚明:集中精力做好一件事,那就是不斷地去打磨從底層技術研發到服務客戶的完整體系,給客戶簡單、易用、好用的產品服務體系。

劉新海:ChatGPT的巨大成功逼出來一個大招,類似的模式是不是能用到隱私計算中,比如產學研的整合。拿徵信來說,央行徵信中心每年有大量的經費,這些是否可以投入到大規模的應用上,用最頂尖的人才,年輕人挂帥,把這種研發的機制學過來,對隱私計算將來的突破,以及真正實現新型基礎設施建設,是非常重要的。

柏亮:零壹智庫在與業內機構、金融機構及地方政府的溝通中發現,大家對隱私計算有很強的實踐需求,但同時這項技術的普及程度也確實不夠。在此,零壹智庫誠摯邀請在座的各位嘉賓及相關機構和數字經濟各個領域的前沿創新機構,一起去推動隱私計算髮展,以更高的效率、更低的成本去推動科研創新在經濟、實踐領域的應用。

文章來源: https://twgreatdaily.com/986be5cf4b00ee3f5c89070a8d941c5e.html

新基建下的蛋

2024-05-16