今の仮説: 20kHz以上の聴こえない周波数が身体に影響するのでなく、「ギザギザ」の波形が滑らかになるからでもなく、普通に測定したのでは測定できない、超高域の可聴域の成分の変化が、音質に影響するのかも知れない。

いくら精密に測定しても測定できないのだから、ハイレゾ無意味派と意味がある派、双方の主張が合わない訳だ。どちらも正しかったのだ。間違っていたものがあるとすれば、測定・評価方法だったのだ。

(6/7の検討のまとめ: まだ検証していないので、結論ではない)

現実には、まず、録音の時のAD変換で、超高域の振幅が低下するのだろう。

  • 制作時に気付かれれば補正(強調)されて、超高域の低下がカバーされた音源ができる。
    • それを再生する時のDA変換では、音は既にデジタルになっているので、サンプリング時刻のずれは生じないので、超高域は低下せず、そのまま(収録されたまま)再生可能なのではないか。
  • 制作時に気付かれなかった場合、超高域は(収録時よりも)低下したまま再生される。
    • だが、そもそも、気付かれなかったものが意図された制作物(= 「原音」)なので、(収録時よりも)低下したまま再生されても、それが「正しい」音である。

→ だから、やっぱりハイレゾ(高サンプリングレート)は必須ではない。

※ただ、超高域の振幅が低下する問題は、録音時にAD変換のサンプリングレートを充分高くしていれば(→ ハイレゾで制作する=「ハイレゾ音源」を制作すれば)、起こらないはずだとは言える。

(6/7 20:53 追記)

超高域の振幅の低下が、AD変換のサンプリングのタイミングと音の波形との位相のずれによって生じるのであれば、振幅の低下する音とそうでない音が生じるはずで、それが音の成分・構成を変えてしまうことで、音を変質させる可能性はあるだろう。ただ、それにしても、制作時に分かる(か分からない)ことであり、変質が耐えられないものだったら収録し直しになるはずだから、結局、世に出る音源は、このような問題のないものになり、再生時の問題はないのではないだろうか。

(6/10 1:31 追記)

推測を含めて、録音・制作の過程を考える。今は、録音(のサンプリングレート)は、おそらく、44.1kHzではなく、最低でも96kHz前後なのではないだろうか。すると、上に書いた、AD変換での超高域の振幅の低下は、録音時には、可聴域では起こらない。

問題になるのは、CDを作る時(=44.1kHzに落とす時)だ。その時には、超高域の振幅の低下が起こりうる。というのは、サンプリングレートを半分に落とすので、少なくとも2つのサンプル(音のデータ)が1つになるためだ(あとで図で説明したい)。落とすには単純な平均ではなくフィルタを使うが、いずれにしても、超高域では振幅は低下する。

例:

マスター音源(ここでは88.2kHzとする)の連続する2サンプル(音のデータ)の値が 1と0 だった場合(22kHz相当)、

単純平均でCD(44.1kHz)に落とすと、0.5(=(1+0)/2)になってしまい、最初のサンプルに比べて音量が半分になる。

演奏者なりプロデューサーなりエンジニアがそれに気付いて問題と思えば補正するし、気にならなければ、補正しない。いずれにしても、そのどちらかの状態が最終的な制作物で、「原音」となる。そして、そのCDを再生する際には、超高域の振幅の低下は生じない。

だから、結局、ハイレゾ(高サンプリングレート)でなくたって、問題は起こらないという結論になる。言い換えれば、演奏者や制作者が意図した音がCDに入っているのなら、(必要十分な性能のシステムを用いれば、)それをそのまま再生できて、問題は生じないのだから、ハイレゾは要らないということだ。もし、CDに落とす際の補正では良くないとか不充分だと感じる演奏者や制作者が居れば、ハイレゾ(高サンプリングレート)形式で発表するだろうし、それは意味があることだと思う。

 

(以下はメモ書きだが、今までの主張を覆すことなので、すぐに書きたくなった。後で清書したい。)

さっき、ようやく、昔あるサイトで見て、昨日も別のところで(誤った説明を)見た、AD(・DA)変換した時、ナイキスト周波数近くの信号の位相がAD変換のサンプリングの位相からずれている場合、振幅(正弦波でも)が小さくなることがあることを理解した。これは、サンプリング定理の欠陥なのか、既知の問題なのか、当たり前のことなのか。あとで調査・検討・実験したい。

PCや測定器などで周波数特性を測定する時は、(自分で生成した、)AD変換のサンプリングの位相とぴったり合った(= 位相0°の)信号を出して受けるから、振幅が低下しないのだ(そうでないと、被測定系での位相ずれが測定できない)。

この、超高域での振幅の低下を感知できる人が、アップサンプルすると音が変わると感じるのかも知れない。そして、高サンプリングレートにする価値はここにあるのかも知れない。

昔、Windowsで、AD変換のサンプリングに同期していない正弦波(スイープ信号)を使って特性を測った時、20kHz付近で3dB程度落ちていたのは、この影響なのかも知れない。そして、その低下量は正弦波の実効値になっていたのかも知れない。実際、正弦波の実効値は0.71(= 1/√2)で、-3dBとなる。更に、ホワイトノイズの特性が同様に落ちていた記憶があるのも、このせいだったのかも知れない。

もしこれが正しいなら、今すぐにでも96kHzにアップサンプルして再生したいくらいだ(が、実際には、僕は15kHzですら聴こえないから、やっぱり無意味な気はするw)。

(6/7に調べたこと: 6/7 19:56追記)

・上記の、誤っている(と僕が思っている)説明: 中頃の「一見問題なさそうである。(以下略)」の下の図の右側の波形は「波形の体すらなしていない」とあるが、信号が連続していることを考慮していないので正しくない。単発のパルスなら正しい(けれど、それはナイキスト周波数を超えているので、そもそも正しく再現できない波形である)が、正弦波のような連続波形であれば、右端に左端の波形がつながるから、振幅は小さいけど、元の波形が再現される。

・上記の超高音の低下は「アパーチャ効果」によるものなのか? → まだ詳しく読んでいないので、何とも言えないが、ちょっと違う気がしている。(以下、引用。図の参照は削除した)

一般に、D-Aコンバータの周波数特性は平坦ではない。帯域内(サンプリング周波数の1/2以下)であっても、高域側に行くに連れ、アナログ出力信号の振幅が減衰してしまう。例えば、サンプリング周波数をfSとすると、fS/2の80%の周波数信号では、出力振幅が2.42dBも減衰する。

・別のページでも、類似の現象が解説されている。 (以下、グラフの説明を引用。下線は私が付けた)

fs≒2×fin
入力信号の周波数は、ほぼ再現できますが振幅にうねり(ビート)が生じます。

fs=2×fin
このときのfinはナイキスト周波数と呼ばれます。
サンプリングの位相が合わなければ小さい振幅の波形が観測されます。

(つづく)

  •   0
  •   0

コメントを書く

名前    

メール 

URL