本指南將涵蓋當今音頻流服務使用的一些最流行的格式,並解釋它們的區別。
什麼是音頻文件格式?
數字音頻文件是記錄內容如何保存在計算機、媒體播放器、智慧型手機或其他設備上的方式。在最基本的層面上,數字音頻是設備可以用來重現聲波的一系列數字。有多種方法可以完成此操作,然後壓縮(或不壓縮)結果數據。我們知道,通過在從模數轉換到 44.1kHz 的至少 16 位的過程中對聲波進行採樣,我們可以在以後再次完美地再現捕獲的信號。這要歸功於稱為Nyquist-Shannon 採樣定理的一些數學運算。我們可以實現更高的比特率和頻率範圍,但是否有人能聽到差異——即使是最好的耳機——充其量也是值得商榷的。
如果我們只是按原樣保存該數據(稱為脈衝編碼調製或 PCM),則該文件會占用大量空間。這就是開發有損和無損音頻壓縮形式的原因。有損音頻會拋出我們耳朵聽不到的音頻頻率,而無損音頻則會保留它們。有損音頻格式還可以使用其他技巧來進一步壓縮音頻,我們稍後會介紹。
因為如今大多數人通過流媒體服務訪問他們的音樂,所以壓縮的有損文件格式是分發內容的主要方式。隨便聽也沒關係,但有些人要求最高質量。因此,現在可以使用越來越多的高質量甚至無損流媒體選項。但是,如下圖所示,有損格式占用的空間更少,消耗的移動數據也更少,這是無法迴避的事實。
MP3
在下載音樂時,MP3 音頻文件格式曾經是至高無上的。事實上,這種格式是移動音樂解決方案的代名詞,以至於「MP3 播放器」現在是音頻播放設備的通用格式。但是,由於各種原因,如今它已不那麼突出了。不過,它仍在繼續。了解 MP3 文件也可以幫助我們更輕鬆地了解其他格式,所以我們將從這裡開始。
MP3 文件是有損音頻文件,這意味著它會丟棄我們耳朵聽不到的數據。幾乎每個人的聽力範圍都在 2oHz 到 20kHz 之間。上限實際上隨著年齡的增長而降低,但一般來說,這是你聽到的每一種噪音的範圍內的謊言。因為我們知道其他頻率因此是多餘的,所以 MP3 會丟棄此範圍之外的所有頻率。
為了進一步節省一些空間,MP3 文件使用了更多的技巧。音頻工程師使用基於人耳和大腦心理聲學效應的噪聲整形算法來去除我們不應該聽到的部分音樂。例如,大腦無法區分相鄰的兩個頻率。此外,成年人的耳朵很難識別高頻聲音的方向。它在 16kHz 以上也開始失去靈敏度。另外,響亮的聲音可以掩蓋更安靜的聲音。所有這些都可以刪除,最終聽眾幾乎沒有明顯的區別。
基本上,MP3 文件會刪除我們聽不到的頻率和我們可以單獨聽到的頻率,但不能因為它們在特定歌曲中的組合方式。
MP3 將軌道分成 576 個樣本幀,並使用快速傅立葉變換 (FFT)從這些幀中獲取頻率數據。然後分析頻率數據以查看是否存在任何機會來應用如上所述的基於人類聽力的壓縮規則。如果是這樣,則將這些部分向下捨入(量化)以降低比特率,這有助於節省空間。有關如何將每個幀恢復為其完整聲波表示的數據將保存到 32 位標頭中。
比特率決定了每幀允許的最大文件大小。壓縮越激進,算法就越有可能刪除可聽得見的東西。此外,這種類型的過濾和切割並不完美,量化可能會留下一些人可以聽到的偽影。這種有損心理聲學壓縮之後是類似於 .zip 文件的無損Huffman 編碼壓縮,以節省更多空間。
如果這聽起來太複雜,那麼 MP3 文件會刪除我們聽不到的頻率以及我們理論上可以單獨聽到的頻率,但由於聽覺掩蔽而不能在特定歌曲中聽到。這可能會導致文件非常小。但是,如果它過於激進或比特率太低,質量可能會受到影響。因此,MP3 對於流媒體來說不再那麼流行了。
AAC、M4A 和 OGG Vorbis 音頻格式
音頻壓縮可以採用多種形式,並且已經開發了其他格式。它們使用略有不同的算法和技術來完成任務,因此我們不能僅根據比特率來比較它們。
OGG Vorbis 是 MP3 的開源替代品。它仍然使用 FFT 和類似方法來分析和量化可屏蔽頻率信息,但採用了不同的算法。Vorbis 還考慮了本底噪聲以提高低比特率性能。Spotify以 320kbps 的速度使用這種格式。
還有 AAC,被Apple Music、Tidal、Pandora 和YouTube Music使用。它是 MPEG (MP3) 格式的演變,允許高達 96kHz 的更高採樣率。此外,它可以在需要時在 1024/960 或 128/120 樣本之間動態切換幀長度以獲得更好的解析度。與 MP3 相比,它在較小的文件大小下表現更好,以啟動。
您可能會遇到的另一種文件類型是 M4A 文件。這些文件使用 AAC 格式編碼,然後存儲在 MPEG-4 容器中,因此文件擴展名為 .m4a。Apple 創建這種類型是對 MP3 的回應。雖然沒有得到普遍支持,但無論如何都不少見。
由於這些原因,例如,您不能直接比較比特率並聲稱更高的比特率將是 AAC 和 MP3 之間聽起來更好的文件。較低比特率的 AAC 和 M4A 文件在占用較少空間的同時聽起來仍然不錯。
這使得 OGG Vorbis 和 AAC 等格式對流媒體服務具有吸引力。它們可以提供更高質量的聲音,同時消耗更少的移動數據。
FLAC
如果您不想丟棄任何頻率,但仍想要一個小於原始數據的文件,這就是 FLAC 的用武之地。FLAC 不會丟棄錄音的任何部分,因此它被稱為無損。Apple 的無損編解碼器版本稱為 ALAC。這兩種編解碼器的功能都類似於 .zip 文件。如果您曾經壓縮然後解壓縮一組文件,您就會理解基本思想。什麼都沒有被刪除,FLAC 文件只是尋找合併重複模式和數據的方法,然後在播放時重新構建它們。
儘管如此,FLAC 文件永遠不會像 MP3 或 AAC 文件那么小。但是隨著帶寬變得更便宜和更容易獲得,越來越多的流媒體服務提供了使用 FLAC 流媒體的能力。這些通常是「高清」、「超高清」或「高保真」訂閱。Amazon Music Unlimited、Tidal HiFi 和 HiFi Plus、Deezer Premium和 Qobuz 都提供 FLAC 流媒體。
請注意,FLAC 文件比有損格式大,並且會占用大量數據。如果您將它們保存到設備中,它們也會很快開始占用存儲空間。
WAV 和 AIFF 音頻格式
錄音可以只是保存到設備上的純 PCM,本質上就是 WAV(在 Windows 上)和 AIFF(在 Mac 上)。它們代表了一些最早的數字音樂存儲形式。這些文件沒有壓縮或應用其他任何東西。事實上,您可以通過以下等式很容易地找出它們的文件大小:
PCM 大小 = 採樣率 X(每個樣本的位數 /8)X 時間(以秒為單位) X 通道數
因此,這些格式可能會導致文件非常大。這意味著它們很少用於流媒體和下載,儘管像HDtracks這樣的服務確實提供了它們。這些文件真正有用的是音頻混合和編輯。由於沒有進行轉換、壓縮或其他任何操作,因此可以輕鬆快速地編輯曲目、保存它們,然後根據需要再次編輯它們。