AI合成技術的 To C之路

2019-09-20   AiChinaTech

近日,百度地圖推出了定製化語音導航功能,簡單說就是用戶根據提示採集原聲,十幾分鐘後你將獲得屬於自己定製化的語音導航音頻包。所以說用戶除了郭德綱、林志玲、羅振宇。。。這一票人之外還有更多選擇。其實我們在使用明星導航音頻包時會發現,除了很多「左轉」「紅綠燈路口」這類常規交通詞彙外,很多涉及地名的、地標的詞是可以聽的出是合成的。而現在「語音合成」技術推向普通用戶,就有了這些AI定製化合成服務。



單從使用AI合成的相關App來看,不禁聯想到那個「一夜而紅」的ZAO,還有國外的Deepfake,AI脫衣軟體DeepNude等等。而國內專注於人工智慧領域的企業越來越多,例如:商湯科技、曠視科技這兩艘「AI巨輪」的業務主要是對政府及企業的;而科大訊飛、大疆、華為、小米、優必選科技的部分硬體類業務是to C類的;極鏈科技是專注於視頻領域的人工智慧企業,業務面向品牌主及流量方,也就是to B類的。

對於廣大 C端 用戶來說,AI合成技術正在通過各種智能設備實現並應用。比如地圖AR增強,定製化音頻服務、定製化視頻服務、專屬智能客服等。

其實剛才提到過的曾經爆火的這些App應用,「ZAO」、「Deepfake」、「DeepNude」技術上有些共同之處,但是娛樂的點不同。「DeepNude」涉及色情內容,並上升到人身攻擊最終被禁止。網友用「Deepfake」在網上大量惡搞政府首腦,比如特朗普的惡搞視頻眾多。



而離我們最近的「ZAO」,在有了前車之鑑後,看的出在儘可能規避可能產生的負面效果,視頻素材內容由平台方把控。但不可避免的是在用戶對照片進行授權所涉及的隱私問題,因為不單純是上傳照片即可,而是需要用戶多角度的認證,有些「恐慌」確實不可避免,因為掃臉支付、掃臉登陸等功能已經被廣泛應用,這是用戶最直接的對「ZAO」開發者的質疑。隨後不久背後的公司陌陌科技被有關部門談話並要求整改,目前來看在ios的熱度及下載量仍然穩定在前三名。



不再處於風口浪尖,「ZAO」進入了平穩期,而大家對其盈利模式以及產品定位仍有疑問,似乎並沒看到一個清晰的變現方式。雖說當前「視頻社交」火爆,但是僅憑陌陌的用戶帶動還是比較乏力的。App自身沒有社交屬性,只是單純的內容產出,和其他的分發渠道聯合顯得很必要。而問題又來了,這些內容只適合小範圍內私域傳播,用戶不願意擴散是關鍵。沒有爆炸傳播的潛質,所以營銷能力也被削弱。或許只是曇花一現,但是對於用戶來說,拍照合成視頻的趣味性還是非常強的,但關於變現場景仍需要一段較長的摸索期。

工具類軟體更能被大家接受認可,微信中音頻轉文字功能用起來很方便,並且通過計算機的學習,準確度也在不斷提高。而科大訊飛推出的「訊飛聽見」是目前將音頻轉文字業務做的較為成熟的平台。業務細分為機器快轉和中文人工精轉兩種服務,可直接收費變現。和百度地圖的定製版語音導航類似,屬於上傳後的AI處理,非在線轉化。

地圖app,作為一個相對高頻使用的工具類應用,除了在滿足常規通行服務外,正在發現更多的To C服務場景。比如google地圖推出的AR導航功能,已經開始測試應用,用於幫助用戶以在線實景增強的方式判斷方向及路線。華為也正在布局地圖服務,在Cyberverse數據平台上發了Map Kit,而相關AR技術的應用是在景區、博物館之類的場景做實景增強標註和講解服務。在2017年高德地圖就推出了景區語音導遊服務,發展至今已經比較成熟。

AI+音樂,在線音頻也一直被關注。今年7月抖音對外宣布了收購英國AI初創公司Jukedeck,這家公司正在研發一種技術,將用人工智慧創作音樂,對歌詞自動配樂等方面。通過AI對音樂的深度學習,滿足用戶自由選擇音樂類型、曲風、時長等要求,讓每一個用戶都能體驗到音樂創作的樂趣。

可以發現,相比5年前,AI合成技術已經不再那麼神秘。而那些曾經「紅」極一時的深度偽造類App,通常在道德、隱私、風險等方面遊走規則的邊緣,似乎滿足人們原始「窺視」、「色情」、「臆想」需求的功能成了火熱表相之下的底色,或許這並不是開發者的初心,但是從環節上把控內容的方向,依舊很有必要。

另外隱私問題開始被用戶所注重,但是隨著智慧型手機的普及應用,智能化的服務的增多,包括面部解鎖、刷臉交易、刷臉登陸等。過去很長一段時間用戶對App應用上的用戶數據留痕,可能無暇顧及,但是當下面部信息已經成為了個人服務的入口,並且直接關聯用戶隱私、數據信息以及財產的安全性。

總體來看,AI合成技術的工具類應用是比較被用戶認可的,無論是功能性還是體驗度,相對傳統服務有了較大提升。專業技術對普通用戶的門檻正在降低,服務、效率、準確率、費用等因素會成為工具類應用的競爭點。