大模型再發展5年,搜尋引擎還在麼?

2023-09-08     AI狐頭條

原標題:大模型再發展5年,搜尋引擎還在麼?

原創 | 人人都是產品經理

搜尋引擎自誕生到現在已經經歷了很長一段時間,那麼大模型的出現,會對搜尋引擎帶來哪些影響?大模型再發展5-10年,搜尋引擎是否還會存在?不妨來看看作者的分析。

大模型既是內容的生成器也是信息的過濾器,而搜索只是信息的過濾器,那發展下去搜尋引擎這個自網際網路發生以來就存在的產品會受到什麼影響?

一、被動搖的搜索根基

想像一個中期場景:假如一半以上的內容是人工智慧體在生產和消費,那搜尋引擎會怎麼樣?

原始意義的搜尋引擎會消失,名實具亡。

因為搜索最基礎的機制會被動搖,並逐漸失效。

搜尋引擎從產品上看並不複雜,就是要在海量信息中快速找到你需要信息的工具。而判斷是不是你需要的信息就在於PageRank等算法,這些算法依賴連結數和質量等判斷內容的權重,再依賴關鍵字來判斷匹配度。

現在這兩點正好都會出問題。

連結可能不是真的連結,而關鍵字對應的內容可能是人工智慧生成的內容。人工智慧生成的內容增長速度一定遠大於人生成的內容,而這部分內容並沒譜,是帶著我們經常說的幻覺所生成的內容。

假如網際網路上的內容一共是十,如果這部分內容的比例超過五,那搜索要面對的就是機率在50%以上的一個虛擬世界反饋出的結果。不管你怎麼用算法來排序,也規避不了這種失真和不準的問題。

可以想像一個極端情況,就是全網50%的內容都和一個人工智慧生成的內容發生連結,那按照搜索的機制,無疑的這是應該被排到前面的,而則可能是不對的,它不一定質量很好,而只可能是被用其它模型生成內容用的多。

這進一步意味著信息精度的責任方在轉移,過去是搜尋引擎負責從已有內容中儘可能過濾出有價值的信息,而如果這套機制失靈,那就變成大模型在信息生成的同時需要扮演信息質量保證者的角色。模型自身決定了信息的精度。

二、不局限於搜尋引擎

這顯然不局限於搜尋引擎,過去我們一共有兩種主要信息集散方法:

一種就是上面說的搜尋引擎,一種則是在頭條和抖音上廣泛被應用的個性化推薦。

而如果大模型在內容源上占據統治性,超過50%,那依賴於個性化推薦的產品同樣會受到衝擊。不過衝擊的表現形式會有所不同。

國內幾個個性化推薦平台,通常和UGC相關,這樣一來,首先衝擊的是內容生成端。

如果把大模型的內容生產水平畫一條線,那這條線以下的生產能力,沒有存在的基礎,會很快的被淹沒。而在這條線上面的除非有明確的標識度,比如你在社會上是個名人,否則也會被淹沒。

而如果是大模型對大模型(都基於大模型進行生產),那數據量則會飛漲。

內容膨脹之後,很可能流量分布上會兩個趨勢同時發生一個是中心節點會有更大的增長量,一個則是一般的流量會被攤的更加稀薄,也就是上面說的一般人會更容易被淹沒。

像更加靠譜的中心節點集中是因為不知道別的信息是對是錯,只能藉助於傳統的社會體系的篩選,一般的流量更加分散則是因為內容過多,流量還是那麼多,內容變多,那平均下來肯定更加稀薄。

這就會產生一個流量的鴻溝

跨越流量鴻溝可能比現在更為困難,而在此之前拿到的流量可能會變的更加值錢。

與此同時,另一個附帶效果可能是UGC平台利潤空間會下降,因為信息的總價值並不會因為因為量的增加而增加,但它的處理成本卻會因此而上升。信息量增加後,不管存儲還是計算成本都會增加。

三、怎麼辦?

怎麼辦裡面最原點的選擇是不用(比如禁止大模型使用),但這顯然不靠譜。

不同的學校對此也採取過不同的態度,有的學校是完全禁絕大模型在做作業等環節的應用;有的學校則非常開放,全面接受。

但這事其實不難選擇,因為我們好像又回到了大禹和他爹的選擇

未來的現實是大模型會成為工作生活的底座和外殼,在它之上每個人都會變成現實版的鋼鐵俠。

你可以選擇不穿,那你力量就弱。既然如此,那顯然不能禁止,只能比誰用的更好。

關鍵是要在面對的同時處理它潛在的負向結果。

最典型辦法就是唯一性身份認證。唯一性身份認證能夠降低一部分純粹機器人的內容生產,但沒辦法避免每個內容生產者都變成超級英雄一樣超高速進行內容生產。

次一級的方法則是模型對模型。我們確實需要清楚的認識到因為信息的暴漲,最終只有模型才可能處理模型相關的事務。但即使把模型滲透到審核等環節,模型對模型也只能降低的太差的水貨,或者說明顯在認知錯誤。模型生產出來的真的質量上乘的作品是沒辦法的,也不應該被禁止。但不管結果如何,模型要肩負起信息生成和分發的責任是確定的。

從這個角度再遞進一步,到每個人具體的生活體驗,也會發生變化。因為信息的膨脹個人已經失去了自我篩選信息的能力(看報紙的時候基本是自我進行信息篩選),所以這時候助理會履行這個職責,別看過去的小愛同學等又呆又傻,但到後面它還是會變得越來越不可或缺。助理首先衝擊搜索,相當於在搜索上又套了個殼,推薦由於本質上相當於是助理在後台進行推送,影響還在搜索之後,比如個人助理怎麼和推薦進行交互一樣是需要解決的問題。

但影響還不止於此。

四、奇點曲線的新解

全面擁抱大模型等馬上就帶來一個新的後果。

我們都知道當年奇點臨近里畫了一條指數曲線,但這條曲線的含義卻很少被進一步解讀。

當社會的變化和智能是指數型向上的時候,比如GDP增長,那意味著企業或者個人的事業必須是指數向上,否則就會被甩下來。道理很簡單,如果平均GDP增長是10%,一個企業的增長則是5%,那大機率它會破產,而一個人的收入增長如果是5%,那很可能他會變的相對貧困。

人的部分是不可能做出指數型增長的,所以能夠匹配高速增長且不掉落,就只可能是基於大模型等技術的組織和個人。這是一種碳基智能和矽基智能找到合適邊界的復合體。從這個角度看大模型確實也只能被擁抱,而不可能被規避。

回到我們文章題目的設問,從這個角度看,現在形態的搜索可能五年到十年後就真的不在了。因為當下搜索這種信息分發方式太不智能了,智能越翻倍,這種初級的信息分發方式就顯的越落後和不精準

五、小結

在《尋找智能飛輪:從數據枯竭到多模態再到自生成》里,我們提到過這樣一個觀點:企業里的場景和任務,其實是在封閉和開放之間連續的,比如總是既有外賣小哥這類工作,也有CEO的工作,前者就封閉後者就開放。然後不同的企業里不同類型的工作配比不一樣,比如工廠里或者清潔公司就封閉度高,大學可能就開放度高。如果面向未來的話,那顯然要加一點,矽基的人工智慧和碳基的人類所對應的整體智能配比也不同,這會變成未來組織的一個關鍵特徵。

文章來源: https://twgreatdaily.com/zh-hk/f0b5ac3be82c8055f6f54953176d6455.html