評測:短視頻字幕生成難題,搜狗AI錄音筆上手直接解決

2019-11-07     豎鋸評測

短視頻在近幾年的發展比較迅速,其流量、熱度逐年升高,一旦你的短視頻拍攝質量高、內容有趣便可以吸引大量觀眾,或許你就能成為新一代「網紅」。基於此,短視頻也是目前很多自媒體作者首選的創作方向之一,只需要一台手機、一個自拍杆或穩定器,就能開始短視頻拍攝。

不過,短視頻拍攝雖然容易,但是想要在眾多創作者中脫穎而出的話,這還是需要通過後期的編輯,打造出差異化的效果才行,例如:給視頻添加字幕、音樂等。

我個人目前也準備「進軍」短視頻領域,去拍攝一些有關數碼產品開箱的短視頻。而通過幾次嘗試後,在拍攝方面沒有遇到太大難題,但只是在進行後期編輯給視頻添加字幕時犯了難。

我也嘗試下載幾款所謂的字幕軟體給拍攝的視頻添加字幕,而這些軟體的工作原理就是通過識別視頻中的語音,然後轉換生成文字,但這些軟體轉換後的效果並不理想,整體識別效率低,需要花費大量時間修改後才能使用。所以我只能用最傻的方法去添加字幕,也就是「一個字一個字」地手動輸入添加。

後來,通過朋友的推薦以及個人搜索了解,我發現搜狗推出的AI智能錄音筆C1可以幫助我解決這個難題。

首先,搜狗AI智能錄音筆C1是一款具備了「錄音轉寫」功能的錄音筆,也就是可以將錄製的語音快速正確轉寫成文本格式。比方說當我在拍攝短視頻的同時將C1開啟錄製語音,等視頻拍攝完成後直接提取C1轉寫語音後的文本,隨後「CTRL+C+V」添加到視頻中來,這樣不就省去手動輸入的麻煩了嗎?

看到這裡,如果不來點實測內容的話,大家肯定認為我在「胡吹」,畢竟一款小小的錄音筆怎麼能夠去解決字幕的問題呢?那麼,下面我就給大家簡單分享一下我使用搜狗AI智能錄音筆C1的體驗感受以及實測內容吧。

隨身便攜性強,輕輕「一夾」就能固定

我選擇搜狗AI智能錄音筆C1的主要原因,除了Ta支持語音轉寫成文字這個功能外,還有就是因為Ta的外觀小巧、隨身攜帶性強。C1在機身背面設計了一個夾子,這樣在使用的時候,我們就可以夾在背包、衣領、或者衣服口袋等地方,不需要手持,就跟裝上一個微型麥克風差不多。

搜狗AI智能錄音筆C1的底部為Type-C接口設計,除了可以給錄音筆充電外,還可以起到OTG傳輸的作用。剛好我現在使用的手機是Type-C接口,就可以跟搜狗AI智能錄音筆C1共用一個充電器及數據線,免去了「多線」困擾。

搜狗AI智能錄音筆C1背面實拍,整體外觀顏值看上去還不錯吧?

為了保證錄音的質量以及語音轉寫的識別率,搜狗AI智能錄音筆C1在機身正面設有兩個深度定製的全數字高靈敏麥克風,這兩個麥克風具有高信噪比、高靈敏度、以及高一致性等優勢,可以實現準確捕捉以及高度還原聲音。同時,搜狗AI智能錄音筆C1還搭載了搜狗自主研發的Smart Voice數字降噪算法及深度定製的去混響技術,可以有效優化錄音時的噪音。

而搜狗AI智能錄音筆C1的機身頂部則設有一個多功能按鍵,可以起到開機、關機、錄音等多個功能。

功能實測:語音轉寫文字

這部分的內容我們來實測下搜狗AI智能錄音筆C1的語音轉寫效果吧。

C1通過跟專用的APP連接以後可以實現:演講速記、採訪速記、普通錄音、導入音頻、同聲傳譯、以及對話翻譯這6個功能。其中:演講速記、採訪速記、普通錄音還有同聲傳譯這四個功能都可以幫助視頻添加字幕,讓我們先來看看「演講速記」吧。

演講速記比較適用於0.3米的近場錄音,當我們拍攝一些開箱、吃播視頻的時候,就可以使用這個功能來錄製語音。在識別準確率方面,通過上面的「語音轉寫成文字」實測截圖,我們可以看到除了「Android」這個因為讀法問題被識別成「安卓」外,還有些就是標點符號以及文欄位落位置不對,其餘則沒有什麼問題,識別準確率比較高的。

當語音轉寫成文字後,我們可以通過APP頂端的分享功能一鍵複製全文,然後再通過社交軟體發送到電腦上進行備用,這樣就相當於「提取」字幕了。這時候再打開視頻編輯軟體,將C1轉寫的文字編輯添加到相應視頻內容上,這就相當於是為視頻添加字幕的整個工作流程。

除了可以通過APP來提取轉寫後的文字外,我們還可以通過網頁端來進行提取文字。這主要是因為搜狗AI智能錄音筆C1支持雲存儲功能,錄音數據會自動備份至雲端,並且由騰訊雲提供的企業級加密存儲保障隱私。相較於APP提取來說,很明顯在網頁端提取更方便,提取完成後,直接打開視頻編輯軟體就可以為視頻添加字幕。

另外,搜狗AI智能錄音筆C1的「普通錄音」跟「演講速記」轉寫文字形式差不多,所以這裡就不給大家實測「普通錄音」的轉寫效果了。只不過演講速記適用於0.3米,屬於近場錄音;而普通錄音則適用於1-3米,屬於全向錄音,這個錄音功能比較適合拍攝旅遊景點、戶外場景等視頻時使用。

功能實測:多人對話轉寫成文字

我們在拍攝視頻的時候,會遇到多人對話的場景。那麼遇到這樣的場景時,我們可以通過搜狗AI智能錄音筆C1的「採訪速記」錄音功能,來提取對應的多人對話轉寫文字。

採訪速記這個錄音功能在進行語音轉寫文字時可以實現區分不同的講話人,並為多個講話人注釋,而提取轉寫後的文字也是注釋後的效果,並非區分前的效果。

另外,在多人對話時的語音轉寫識別率上,搜狗AI智能錄音筆C1的表現也不錯,僅iPhone Xs被識別成了iPhone差s,其實這個問題也正常,這是我的讀法問題,如果按照正確的英文字母來說,就不會有這個問題了。

功能實測:遇到外國人也不怕

當我們在拍攝視頻需要採訪外國友人時,那麼面對英文我們又如何通過搜狗AI智能錄音筆C1來提取字幕呢?

這時候我們可以使用C1的「同聲傳譯」這個功能,來實現提取「英文+中文」雙語言轉寫的文本。而「同聲傳譯」的工作原理,就是實時進行中英互譯,而在互譯的同時也會進行錄音,並且還支持轉寫成雙語言文字。不過,這個功能等同於是一個實時互譯,不太適合在拍攝視頻的時候一起錄音,比較適合視頻拍攝完成後通過搜狗AI智能錄音筆C1來進行互譯視頻中的英語部分並進行轉寫,從而提取出對應的「英文+中文」雙語言轉寫文本。

小結

總體來說,對於一些「技術大佬」而言,可能我使用搜狗AI智能錄音筆C1的「錄音+轉寫」功能為視頻添加字幕的方式有點「呆」,但是個人覺得對於我們這些非專業團隊、僅個人創作者來說,這也應該算是一個「花費少、耗時短」的字幕生成方式了,畢竟搜狗AI智能錄音筆C1的價格也就300多。

好了,關於搜狗AI智能錄音筆C1的話題咱們就說到這吧。如果你也正在為視頻生成字幕而煩惱,不妨可以試試我所說的這種「低成本」方式吧。

文章來源: https://twgreatdaily.com/zh-hk/smvORm4BMH2_cNUgsSCC.html