正規化

音量の最大値がデジタル音声の最大シグナルと同じ(または特定の割合)にすることを、音声の正規化と言います。通常、音声編集作業の最後に全てのファイルを100%に正規化することで、音にゆがみが生じない範囲の最大音量に設定を行います。正規化を行うことで複数の音声トラックの音量を同等または平均化することができます。

「ピーク」値を使った正規化は、ファイル内の最大音量のサンプルを検出し、この値を「ピーク」値として正規化を行います。正規化のピークレベルを100%(0dB)に設定することで、ファイル全体のピークが0dBに達するよう音量が増幅されます。

「平均ラウドネス(RMS)」を使った正規化は、複数ファイルの音量の平均値を元に行います。この方法を使って複数のファイルを同じピークレベルに正規化した場合、各ファイルのラウドネスの平均が揃います。平均ラウドネスは常にピーク音量よりも低いため、この方法を使う際の「正規化ピークレベル」は「ピーク」値を使う際より低く設定します。

「ピークラウドネス(RMS)」を使った正規化は、ファイル内の最大音量がどの程度大きいかを元に正規化を行います。複数のトラックの最大音量を同じにする場合は、この方法が最適です。ピークラウドネスを使った正規化も、ピークラウドネスが常にピーク音量よりも低いため、「正規化ピークレベル」は「ピーク」値を使う際より低く設定します。ピーク値の実際の算出法は、50ミリ秒の窓ごとのRMSを検出し、検出した窓を大きい順に並べ、これらの内の第95百分位数を「ピーク」とするというものです。異なる周波数に対する人間の知覚の違いに対する調整は行われません。

知覚ラウドネス(dBA)の正規化法は、人間の耳で知覚される空気中の音の相対的なラウドネスの表現であるA特性デシベルを使用します。正規化は、高い周波数に比べて、低い音声周波数(特に1000Hz以下の周波数)に対する人間の耳の感度が低いため行われます。

平均ラウドネス値(EBU)の正規化法は、ラウドネスの正規化と最大音声信号の国際規格であるR-128を使用します。Spotify(-14dB)やYouTube(-14dB)、Apple Music(-16dB)、Facebook(-18dB)、テレビ/ラジオ(-23dB)など様々なプラットフォームに使われています。詳しくは EBU R-128を参照してください。