AI的廣電價值丨方世彤專欄

2019-10-28     綜藝報

隨著工作場所中實時流式傳輸和點播視頻的使用不斷增長,添加 AI 有望成倍增加視頻的使用以促進廣電工作方式以及員工溝通與協作方面所帶來的價值。

人工智慧(AI)允許計算機模仿人類能力,自動化的過程是指創建能夠執行基於流程的任務而無須人工干預。在當下,AI的最常見形式是機器學習,將大量數據「饋送」到算法中以進行訓練,一旦訓練完成,該算法便能在無輔助的後續數據饋送中對項目進行分類。科幻電影《機器人瓦力》中,主角機器人瓦力的知識就是通過看錄像帶獲得的,他把一盤盤的錄像帶吞吐腹中,人類上百年歷史的影像給了瓦力足夠的知識去追另一個機器人女孩。

然而,機器學習的一個主要缺點是要依賴擁有大量準確數據的樣本。因此,輸入數據來源的質量高低,限制著機器學習應用的成效。當我們提供足夠好的數據樣本時,機器也會學習得聰明些,不然人工智慧就會變成人工愚蠢。

AI應用於視頻最相關的人工智慧學科是「計算機視覺」Computer Vision。「計算機視覺」是使用人工智慧解釋圖像或視頻的視覺元素。計算機視覺可以使用機器學習或深度學習技術來實現此目標,是諸如面部識別和自動車輛無人駕駛等新興技術應用的基礎。事實證明,教計算機像人類一樣處理視覺數據比將算法簡單地連接到相機要困難得多。挑戰主要來自於對人類視覺如何複製現實的基本理解,就好比我們看到樹葉發黃,會想到秋天來了天氣變冷了,甚至會有些詩人的情緒出來。可是機器人識別樹葉發黃就是發黃了,它是不會有太多情感上的聯想的,也不會把樹葉發黃的事情理解為秋天的到來,更不會生髮出豐收抑或愁緒的情感。

正因為計算機視覺目前缺少情緒管理,我們還是比較難在人文創作或者視頻創作上應用這項技術。科學家們一直試圖實現AI人文理解上的突破。十年前我在英國學習時的室友就是將計算機視覺應用到宗教研究的博士後,他的課題是讓計算機閱讀學習歐洲各大教堂的宗教名畫,讓計算機能夠刻畫出上帝的真正形象(聽上去很不靠譜的感覺,但這真是人工智慧的博士後研究項目)。而央視這次國慶閱兵也推出了AI剪輯,相關人士介紹該剪輯就是讓機器學習前幾次閱兵的鏡頭剪輯規律,讓機器自動剪片,大大節省了人力。

我們需要了解視頻AI的基石有哪些,能在多大程度上影響廣電業的發展和視頻技術的成長。很多時候我們把視頻當成活動的照片,畢竟我們定義視頻也是每秒多少張圖片的連續動畫。但除去影像,語音其實是視頻的重要組成部分,人工智慧可以通過多種方式幫助解釋、演繹語音:人工智慧早期的例子之一是機器轉錄,其中的算法能夠將語音數據解釋轉換為文本記錄。這項技術現在很普遍,甚至已經在我們的智能手機中大量使用,更由於深度學習新技術的出現,正在實現復興。我一好友在一家得到文化基金投資的創業公司工作,他們的產品就是利用人工智慧轉錄技術將記者外采的視頻語音轉化成文字稿,提供給後期編輯撰稿使用。

口語單詞被消化成文本數據後,便會解鎖其他功能,例如翻譯成其他語言。谷歌是人工智慧領域的先驅之一,其於2006年首次使用聯合國和歐洲議會的筆錄作為基礎語言數據,啟動了機器翻譯服務,當下谷歌支持100多種語言,每天服務5億人。我周邊很多視頻製作者們都在使用一個人工智慧平台,它能輕鬆地對視頻里的語言進行識別翻譯,所以很多朋友用它並非是翻譯視頻,而是製作母語視頻字幕。

現在的虛擬主持人已經在應用一些人工智慧技術,可以想像未來這些主持人說的也不一定是我們的母語,很可能是說外語的主持人。

人工智慧的應用正變得越來越普遍,人工智慧無疑可為廣電製作帶來價值。隨著工作場所中實時流式傳輸和點播視頻的使用不斷增長,添加AI有望成倍增加視頻的使用以促進廣電工作方式以及員工溝通與協作方面所帶來的價值。

文章來源: https://twgreatdaily.com/HxF1E24BMH2_cNUg7HT8.html