January 30, 2014

第85回サラウンド寺子屋 〜 演奏音の最適残響レベル 2013年九州大学博士論文研究より

By Mick Sawaguchi サラウンド寺子屋塾 主宰

テーマ:演奏音の最適残響レベル
〜無饗室録音音源と電子残響を用いた音源信号の特徴量と残響の最適ミキシングレベルの関係の考察〜2013年度九州大学博士論文より

講師:入交 英雄 (株式会社毎日放送 放送運営局 送出部 マネージャー)
日時:20131205日 目黒TACセミナールーム






沢口:みなさんこんにちは。第85回のサラウンド寺子屋塾を始めたいとおもいます。日頃サラウンド制作の実際について発表している寺子屋塾にしては、今回のテーマは、大変アカデミックな内容です。(笑い)そのせいか日頃の参加者とは、異なった初参加のみなさんが多いのも本日の特徴かと思います。




本日講師の入交さんは、出身母体の九州大学芸術工学府、(私の年代では九州芸術工科大学といったほうがなじみですが、)を1981年に卒業後大阪の毎日放送に在籍しています。
本業の傍ら、2007年には、オーケストラ録音におけるサラウンドメインマイクの主観評価実験や、西のトーマス、ルンドか東の入交かと認識されるほど、近年は放送ラウドネス運用について取り組みをしてきました。今日のお話は、入交さんが長年追求したかったクラシック音楽と最適残響の関係について、50歳から取り組みあしかけ5年をかけた博士論文の研究の一端を紹介してもらいます。この主観評価実験にサラウンド寺子屋塾のメンバーも協力をした関係で、是非その成果を寺子屋塾でも紹介したいという希望で開催となりました。では、よろしくお願いします。また今回会場を提供していただきましたTACシステム山本さんにも感謝申し上げます。




入交:
みなさん平日の午後にもかかわらず参加いただきありがとうございます。残響のテーマは、私がクラシックの録音制作をやるひとりとして永遠のテーマです。




さて、みなさんが、よく聞くことばで、クリティカルディスタンスという言葉があると思います。これは、直接音と間接音の比(D/R値で表す。)が1になる距離と定義され(すなわち、音源からクリティカルディスタンスだけ離れた場所では、直接音と残響音のエネルギーが等しい場所となる。)、クラシック録音をホールなどで行う場合、楽器からこの距離だけ離れた場所にメインマイクを置けば、最適な残響バランスの録音が行なえると考えられています。
しかし、私の経験では、それでうまくいったためしがありませんでした。そこで、間接音である「残響をどう扱えばいいのか」を究明できないかということから今回の研究が始まりました。それでは、以下の項目に沿って説明していきます。

1) 本研究の背景と経緯、目的について 
2) 実験方法 
3) エンベロープ指数について 
4) 楽曲要因を調べる実験(実験2:エンジニア) 
5) 楽曲要因と再生レベルの影響(実験3:学生) 
6) 再生レベルの影響 詳細(実験4:エンジニア) 
7) 残響時間要因の詳細(実験5:学生) 
8) 楽曲要因の詳細検討(実験6:学生) 
9) 結論 

1 研究の背景と目的

録音という行為は、芸術かあるいは技術か?
録音は、音楽家の要求や音楽内容、そして録音家自身の考え方をエンジニアリングによって実現する行為といえます。
特にクラシック録音では、空間を捉えるためのマイクロフォンの最適化が重要なキーとなります。これは、従来先輩から後輩へ経験則として伝えられてきました。しかし最近は、そのような師弟関係がなくなり、ノウハウを継承するためには、何らかのマニュアル化が必要となってきました。そのひとつとして演奏音の最適残響レベルを理論的に体系化したいというのが本研究の動機です。

楽器とホールの響きを捉える方法は、



直接音と間接音のバランスの良い位置へメインマイクを設置する。
楽器に近いメインマイクとホールの間接音を捉えるアンビエンスマイクの
 バランスで捉える

といった方法があります。前者は、最適位置に置くことができれば良い録音ができますが、最適位置を見つけることはなかなか難しいのが現実です。後者は、TV放送収録など時間の制約がある場合には、有効な方法です。
前者では、D/R値という指標が目安にされ、直接音と間接音のエネルギーが等しくなる場所、すなわちD/R値が1に近くなる音源からクリティカルディスタンスだけ離れた場所がワンポイント録音のマイク位置として良いとされてきました。しかし、そのことを実際に証明した先行研究は見つかりませんでした。
良い録音の物理条件、と言ったテーマは研究になりにくいこともあり、関連した先行研究、特にホールの残響音の善し悪しに関する研究は、大変少ないのが現実です。今回は、残響に普遍的な要素があるのかどうかを研究してみることにしました。

本研究の目的は、以下の1−2に記した2つを解明することです。また、目的を達成するためには、1−3のような残響の条件を考察することが必要で、本研究が達成されると、1−4のような波及効果が期待されます。

1−2 目的
残響に個人的な嗜好はあるのか?
良い残響の条件に普遍的要素はあるのか?

1−3 良い録音に必要な残響の条件、要素 とは?
● 残響時間 
● 残響のミキシングレベル 
● 残響の到来方向 
● 楽曲の特徴と相互関係 

1−4 本研究の波及効果 
●  録音=芸術行為 → 科学的アプローチ 
   莫大な試行錯誤を効率改善 
   録音品質の安定と向上へ寄与




2 実験方法
実験は、以下のような方法としました。

無響室録音音源へ電子残響付加を行うことでモデル化して実施。以下は実験の要素です。

• 残響パラメータ:残響時間とミキシングレベル 
• 刺激音源   :出来るだけ様々な楽曲を選ぶ 
• 実験参加者  :ミキシングエンジニアと一般聴取者人(学生) 
• 最も好ましいと思う残響音レベルをデータ集積 
  これを → 残響の最適ミキシングレベル Lpm(以下、最適残響レベルと表記)と定義 
• 楽曲の持つ特徴量の数値化を検討して定義した E値、スペクトラム標準偏差、ES値。 (これは、先行研究でD.グルージンガーが発表している「楽曲の構成の差異により残響音は聞こえたり聞こえなかったりする」という論文を参考に楽曲の構成要素も大きな要因になると考えたからです。)

このE値という定義を行った経緯を述べます。2−2で述べる予備実験を行った結果として、最適残響レベルは、楽曲の構成によって異なることがわかりました。例えばピッチカートの多い楽曲は、フルートの定常音が連続する楽曲よりも残響が聞こえ易いので、フルートより少なめの残響レベルが最適となる、といったことがあります。そこで楽曲の持つ特徴を何か数値化しておく必要があると思い、楽曲の包絡線(エンベロープ)から特徴量を導く工夫をおこないました。



詳細は難しくなりますのでイメージで説明しますと、まず、楽曲の波形エンベロープを算出しグラフに書きます。プロツールズの波形表示を思い浮かべてください。
次に、波形エンベロープで最初に現れたピークから、残響の減衰カーブに相当する減衰カーブを書き加えます。その減衰カーブは、次に波形エンベロープがその減衰カーブを上回るところまで記入します。
以下、同様にして、次の波形エンベロープのピークから、再び残響の減衰カーブに相当する減衰カーブを書き加える、といった作業を音楽の波形エンベロープの最後まで行います。

このようにして、楽曲の波形エンベロープのうち、残響が付加されるであろう部分を減衰カーブへ置き換えたエンベロープを仮想残響エンベロープと呼ぶことにしました。
グラフ上で仮想残響エンベロープと波形エンベロープで囲まれた部分が、残響の聴こえに有効な残響成分で、残響の聴こえは、囲まれた面積に比例すると考えるわけです。
すなわち、仮想残響エンベロープから計算される総エネルギーと楽曲の波形エンベロープから計算される総エネルギーの比をデシベル化した値がこの面積に相当し
エンベロープ指数=E値として定義しました。





実際に計算するときには、原信号のサンプル単位で算出するのではなく、一旦、20msecごとの波形のパワーレベルを求め、サンプリング周波数を50Hzにリサンプルし、上記の手続きに準じて算出します。また、仮想残響の残響時間は、実際の残響時間とは関係があまりなく、カットアンドトライによる検討で2秒程度が適切であることがわかってきました。この条件のE値を特にE2(20)と表示します。E値は、値が大きいほど、残響が聞こえ易い、という指標になります。

2−2 予備実験 研究の方向性を確認する実験

場所は、東京芸術大学千住キャンパスの音響制作(SP)室です。評定者は、プロのエンジニアで、あらかじめ設定した楽曲に対し、残響音のレベルコントロールフェーダを操作して、もっとも好ましいと思う残響レベルに調整してもらいます。電子残響はプロツールズのプラグインAvid ReVibeで、1sec、2sec、3sec秒(ホールアルゴリズムを用い、各パラメータをバイパスし後期残響成分のみ使用)の残響時間を使用。再生方法は,モノ/2CHステレオ/4CHステレオで、モニターレベルは、ARIB TR-B30に準じて校正。-23dBFSrmsピンクノイズの各チャンネルの音圧を、79dB/C特性としています。




音源は、演奏法、テンポなど曲想の異なる4種類の楽曲

モーツァルト フィガロの結婚序曲:Figaro、
シュトラウスⅡ ピチカートポルカ:PizzPolka、
グリンカ ルスランとリュドミラ序曲:Ruslan、
ドビュッシー 牧神の午後への前奏曲:Debussy


を、DENONの無饗室オーケストラというCDより使用しました。ラウドネスマッチングは行わず、CDのオリジナルレベルで再生。実験後に評定者の耳の位置で音圧レベルを測定したところ、Figaro:73dB/A特性、PizzPolka 50dB/A特性、Ruslan:76dB/A特性、Debussy:55dB/A特性でした。36通りの実験結果から、以下のことが分析できました。これは本実験を行う上で、大変有益だったと思います。


残響時間が長くなると最適残響レベルが小さくなる、負の相関がある。
最適残響レベルは、楽曲の構成で異なる。
最適残響レベルは、再生チャンネル数には依存しない。

という結果が得られましたので、次ぎに楽曲の異なる構成と最適残響レベルの関係について考察することにしました。

2−4 実験2 E値の信頼性確認実験

この実験は、定義したE値が楽曲の特徴を表すのに適正な指標であるかどうかを検証するために実施しました。場所は、前回同様で評定者もプロのエンジニアです。

無饗室音源15曲に検証用音源6曲を加えた21曲、15secずつで実施。

PizzPolkaについては、ピッチカート/レガート/スタッカートの3種類
の演奏法をシンセで制作。
再生レベルの影響を調べるため、オリジナルレベルの低い
Debussyは+10dBしたものを追加。
● 同一曲内での影響を調べるため、ブルックナーの曲では、
あるフレーズを前半と後半に分けて追加。
● ソロ演奏の傾向を調べるためビオラ独奏と
トランペット独奏を追加。

で実験を行いました。




分析結果
データの分析結果は、

エンベロープに着目したE値は、楽曲音響信号の特徴量として、適切な指標となる。
  (残響の最適ミキシングレベルとE値の相関係数 
   全ての楽曲 r = -0.71:やや高い相関 
   オーケストラ r = -0.95:非常に高い相関 )
同じE値でも、オーケストラとソロ楽器では、周波数分布が異なることで
最適残響レベルが異なる。すなわち、E値と残響の最適ミキシングレベルの関係は、小編成楽曲とオーケストラ楽曲で傾向が異なる。

さらに検証用音源に着目すると、

音源レベルを+10dBとすると、最適残響レベルが3dB下がったことから考えると、
ラウドネスが、最適残響レベルに影響する。
シンセによるPizzPolkaの結果を見ると、それぞれの演奏法のE値と最適残響レベル
が全体の相関関係に沿う傾向がある。つまり、楽曲の楽理の特徴と言うよりは、演奏法の変化による音色の相違が、最適残響レベルに影響する。
楽曲の構成要素別の検討(ピアノ単独、ソプラノ単独とMIX音源)では、
MIX音源のE値は、単独演奏それぞれのE値の中間となり、その最適残響レベルも中間となった。
ブルックナーの楽曲の異なる場所では、
場所場所のE値と最適残響レベルの関係が、全体の相関関係に沿う傾向があった。つまり、最適残響レベルは楽曲全体のイメージとして固定されるものではなく、楽曲の切り取る場所で異なる。



次の課題として
ラウドネスが最適残響レベルに影響する。
プロのエンジニアと一般人に差があるのか無いのか?

という点を検証することにしました。

2−5 実験−3 一般評定者による同種実験

一般の評定者として学生について実験を行いました。場所は、九州大学可変残響室で残響時間を最小の0.3secにしました。使用した音源は、無饗室録音音源16曲を選定し、再生レベルの影響を調べるため各々+/-10dBのレベルを変えた音源も制作し、計48曲、15secで実施しました。スピーカの校正は、前回と同様で、規定ピンクノイズの再生レベルをチャンネル当たり79dB/C特性としています。

分析結果
E値と最適残響レベルとの関係を、実験2と3で共通に用いた音源10サンプルから
分析した結果、プロと一般人で最適残響レベルの判断に差がないことがわかりました。
最適な響きという感覚は、訓練して得られたというより、普遍的な感受性
ではないかと思います。
再生レベルを変えた音源の実験から、
再生レベルが4dB変化すると最適残響レベルが
1dB変化していることがわかりました。この点に関し、さらに詳細を調べるため次の実
験を行いました。




2−6 実験−4 再生レベル差による最適残響レベルの考察



実験3での再生レベルの変化をさらに細分化し、再生レベルと最適残響レベルの関係を考察する実験を行いました。場所は、私の属するMBS試写室でプロのエンジニア15名により、無饗室録音5曲、15secを選定し、それぞれ+/-6dB、+/-12dBのサンプルを作成、今回はラウドネスマッチングを行いました。







分析結果
再生レベルが1dB変化すると最適残響レベルは0.1dB変化しています。
この値は、実験3で一般の評定者から得られた結果より変動幅が小さい結果です。
その理由は、プロは日頃から異なる再生レベルでも最適残響レベルをバランスできよう訓練されているからだと思います。


さて、予備実験で3つの異なる残響時間での最適残響レベルを調査しましたが、
これをさらに詳細に分析するため7段階の残響時間で実験しました。

2−7 実験—5 残響時間の細分化による最適残響レベルの調査 

無饗室録音音源7曲を、各々15sec間選定し、ラウドネスを-24LKFSにノーマライズし、残響時間を、1、1.4、2、2.8、4、5.6、8secの7段階としています。場所は、名古屋芸術大学音響制作室で14名の評定者で行いました。




分析結果
残響時間を2倍にすると最適残響レベルは、6dB減少する。
しかし、残響時間が短い場合、それ以上最適残響レベルが増加しない限界点がある
 (残響飽和点)。
残響感は、残響時間ではなく、残響の減衰勾配によって決まる。
C値に関する考察(C値という指標は、部屋などのインパルスレスポンスの初期音エネ
ルギーと後期音エネルギーの比として定義された指標で、明瞭度を評価する時に使わ
れます。通常、初期音と後期音の切り分けに、音が発生してから80msの時点を用いるが、
本検討では、より厳密に初期音を切り分ける必要から5msを用いた。)
残響時間が2倍になるとC値が3dB上昇する傾向が認められた。

前述の残響時間2倍あたり最適残響レベル-6dBから、パワーレベルで定義されるC値は
+3dBの勾配といなることが予想されたが、その通りとなった。

2−8 実験−6 楽曲カテゴリーを増やして最適残響レベルをさらに考察する

これまでの検証で、再生ラウドネス、残響時間と最適残響レベルの関係がわかりましたので、楽曲カテゴリーを増やして楽曲の特徴量を検討する実験をしました。楽曲サンプル
は、28曲で、場所は、九州大学可変残響室、評定者は、15名です。






分析結果
楽曲カテゴリー別に、E値と最適残響レベルとの関係がグループ分けできる。
 (楽曲構成によって最適残響レベルが異なる)
実験2の検討で、E値を時間軸方向の情報としてのみ扱ったが、

異なる楽曲グループ別に
 E値と最適残響レベルの関係が異なることを考えると、楽曲の特徴量に周波数軸方向の
 情報にも着目すべきではないか。
楽曲のスペクトラム分析(1/12オクターブ分析)から

周波数軸方向のばらつきが特徴量
と出来ないか検討。ばらつきを標準偏差として算出したものを
「スペクトラム標準偏差」として定義した。
スペクトラム標準偏差と最適残響レベルの関係を調べると、
スペクトラム標準偏差によって、楽曲グループが分けられることが判った。
総合的な楽曲の特徴量を周波数情報であるスペクトラム標準偏差と、時間軸情報で
あるE値との積として、新たな指標「ES値」を検討。


この新たな指標ES値に基づいて分析を行うと

● 全楽曲において、ES値と最適残響レベルに高い相関が認められた。 
● 楽曲グループ別の相関も中度の相関が認められ、
全体勾配とおよそ同じ傾きとなることがわかった。
すなわち、全体として一つの相関関係に収まった。

このことからES値という指標によって、楽曲の最適残響レベルが求められる方向性が見いだせたことになります。 



3 結論
これらの実験 分析を経て以下のような結論を見いだすことができました。

1. 無響室録音のオーケストラ楽曲に電子残響を付加するという条件で人が最適と感じる最適残響ミキシングレベル Lpm を調べたところ(予備実験)
→残響時間と、楽曲の要素によって変化する。
→再生チャンネル数の差異であまり変化しない。

2. 残響時間の異なる残響を付加するとき
→残響時間の対数と最適残響ミキシングレベル Lpm に負の比例関係(-6dB/残響時間2倍)が存在する。

3. 各楽曲音源における最適残響ミキシングレベル Lpm におけるC05値
→ +3dB/残響時間2倍の関係が存在する。

4. 楽曲音響信号の特徴量として、エンベロープ指数 = E値 を提案した。
→ E値は、楽曲種別に、Lpm を推定する適切な指標となることを示した。
→ E2(20)値をE値の代表値とした。

5. E値と最適残響ミキシングレベル Lpm の関係
→ 録音エンジニア、一般聴衆、に同一事象。
→ E値と最適な残響量との関係は普遍的
6.残響レベル推定要素
①電子残響の残響時間、
②楽曲種、
③無響室録音相当E値、

が分かれば最適な残響レベルを推定可能。

7. 再生レベルの最適残響ミキシングレベル Lpmへの影響
→ 録音エンジニア、一般聴衆に共通に生じる。
→ 録音エンジニアと一般聴衆で影響度が異なる。
(訓練を受けた録音エンジニアでは、最適残響ミキシングレベルLpm に対する再生レベルの影響が小さい。)

8. 再生レベルの最適残響ミキシングレベル Lpm への影響量
エンジニア :再生レベル変化の1/10程度。
一般聴衆  :再生レベル変化の1/4(1/10~1/3)程度。

9. スペクトラム標準偏差によって楽曲種が分離できる。

10. E 値とスペクトラム標準偏差の積の対数 => ES値と定義
全楽曲において最適残響ミキシングレベル Lpm と ES値の相関が大きい

11. 以上、総合すると、最適残響ミキシングレベル Lpm は、次式によって推定できる。







この式は、一見ややこしそうですが、要するに、

◎ 定数とESに従って決まる値、
◎ 楽曲固有の値、
◎ 残響時間によって決まる値、
◎ 再生レベルによって決まる値



の4つの独立した要素によって、最適残響レベルが求められると言うことを表しています。



4 まとめ
ここから以下のようなことが言えると思います。

● モニタ・レベルを一定とすることの重要性。 
● 曲想によって、曲途中の残響量を可変する合理性。 
● 音量起伏が平坦 /スペクトラムが平坦 /音量が小さい 楽曲は、最適残響レベル Lpm が大きい。
ex) ppストリングスの白玉は、残響を大きくしたい 等。
● オケよりも独奏の方が、対象に対しマイク位置が近いことの合理性。(オケよりも独奏の方が、相対的に残響が少なくて良い。すなわち、家庭で聴取する録音では、ホールで独奏楽器がオケよりも少音量であることとは関係なく、ほぼ同じくらいの音量で聴取されること、スペクトラム起伏は、一般的にオケよりも独奏楽器の方が大きいこと、により、上記結論より残響が少なくて良いことが導き出される。)  
→ クリティカルディスタンスは、都市伝説であったと結論される。
一方、ホールでの聴取は、独奏楽器の方が小音量であるため、小音量のために必要となる残響量の増加と、スペクトラム起伏によって少なくて済む残響量が相殺し合って、同じ残響時間でも、それほど違和感なく残響を感じているものと考えられる。
スポットマイクのゲインアップ 
→ ソロのラウドネス音量大の時、最適残響レベル Lpm は小さくなるので 
   → スポットマイクのリバーブは、思ったほど足さなくて良い(ほどほどが良い)。




入交:いつもの寺子屋塾とは傾向が異なる数式やデータが多くなりましたので、みなさんには、少し難解な部分もあったかと思います。




私は、冒頭にも述べましたように録音という行為は、芸術かあるいは技術か?
特にクラシック録音では、空間を捉えるためのマイクロフォンの最適化が重要なキーとなります。これは、従来先輩から後輩へ経験則として伝えられてきました。しかし最近は、先輩がいなくなり、ノウハウを継承するためには、何らかのマニュアル化が必要となってきました。そのひとつとして残響の最適レベルを理論的に体系化したいという思いからこうした一連の実験と研究を通じてノウハウ、技能といったものに何らかの体系化を試みた次第です。すこしでもみなさんの参考になれば幸いです。どうもありがとうございました。

沢口:入交さん、どうもありがとうございました。
5年にわたり、クラシックホール録音における最適残響ミキシングレベルをLpmと定義し、E値の提案やさらにES値といったあらたな定義を行って業務の傍ら研究された行為そのものは、私たちに行動の継続性の大切さを示してくれたのではないかと思います。(了)

No comments:

Post a Comment