音楽心理学への御招待1


中島 祥好

1 はじめに

音楽心理学という学問分野について、耳にされたことのある方は多いと思います。本屋でそういう本を立読みした、教職の単位で取らされた、この前そう言う分野の研究者と酒を飲んだ、などいろいろな関わりかたがあるだろうと思います。ひょっとすると、昔関連する書物を買い集めた、と言う方もいらっしゃるかもしれませんし、音楽心理学の専門家はどうしてあんなに当り前のことばかり言って喜んでいるのだろう、と腑に落ちない方もいらっしゃるでしょう。私もこの分野に関わっており、論文や参考書の執筆までしていますが、自分が専門家であると言う意識はあまりありません。知覚心理学の研究を商売とし、音楽を趣味としているため、必然的に音楽心理学と言う分野に関わることが多くなるだけなのです。忙しい研究生活の中で、音楽心理学は、心をくつろがせるオアシスのようなものです。これで商売になれば、こんなにうまい話はないはずなのですが、どちらかと言うと、このオアシスで時間を潰しすぎると本業がおろそかになりますから、うまい話もほどほどにと言うところでしょうか。

 音楽に関わっておられる方々にとって、音楽心理学を学ばれることは、楽しみを兼ねた頭の訓練になり、音楽を理解するにも役立つと思われますので、この場をお借りしてこの学問分野の宣伝をさせていただきます。音楽、音楽教育を職業としておられる方々には、私の場合とやって来る方向は違いますが、音楽心理学の勉強が心のオアシスになるかもしれません。趣味で音楽を楽しんでおられる方々は、音楽心理学を通して趣味の幅が広がる可能性があります。

 音楽心理学と聞いて、「ああシーショアなんかのあれね。」と思われた方は、率直に申しあげて古すぎます。音楽心理学と音楽療法とはほとんど同じであると確信しておられる方がもしいらっしゃるならば、それは思いこみです。アルファ波の話や日本人の左脳の話をまっ先に思浮べられた方は、メディアに乗せられたかもしれません。(メディアには注意が必要で、例えば、モナリザの声を合成したと称するインチキ科学者が、なぜあれだけテレビや雑誌に出るのか、研究者仲間では絶好の酒飲み話になっています。)現在の音楽心理学は、かなりの程度まで、演奏や作曲に直接関連づけられるような問題を扱うようになってきています。実験心理学(知覚心理学、学習心理学、認知心理学などの分野の総称)の側から見れば、人間の知覚や動作の能力を最大限に生かし、しかも感情に強く訴えかける音楽は、研究材料の宝庫と言えます。このことは昔から判っていたのですが、実際の研究においては技術的に難しい点が多く、本当に面白い成果が出ているのは、ここ二、三十年くらいのことです。

どのような分野でも同じであると思いますが、初めて学ぶための教科書や参考書をお買い求めになるときには、いくら古典的な名著であっても、あまりにも古いものは避けたほうが無難です。とは言っても、日本語の書物は大変限られており、聴覚の仕組みにまで触れた包括的な参考書は次のものしかありません:ダイアナ・ドイチュ編「音楽の心理学(上・下)」西村書店(各¥3800)。内容は古くなっていますが、音楽心理学の広がりを把握するために欠かせない書物です。コンピューター科学に関連した有益な書物として、次の二つがあります:波多野誼余夫編「音楽と認知」東京大学出版会(¥1800);ジョン・R・ピアース著「音楽の科学」日経サイエンス社(CD付き¥7000)。「音楽の科学」の翻訳には少し問題がありますが、原著では付録がソノシートになっていたのに対して、日本語版にはCDが付いており、これは私も大学の音楽心理学の授業に活用しています。大山正ほか編「新編:感覚・知覚心理学ハンドブック」誠信書房(¥51500)は、個人で買うには少し高すぎますが、「音楽の知覚」に30頁くらいを割いており、その部分は私の友人と私とが執筆しておりますので、図書館などで見かけられたら、ぜひ手に取ってみてください。関連分野である音楽療法に関しては、次の本が解りやすいようです:松井紀和著「音楽療法の手引」牧野出版(¥2600)。もう少し新しい本については、また後で触れる機会があるでしょう。

 では、最近の音楽心理学は、どのような疑問に答えようとしているのでしょうか。イメージを持っていただくために、例をいくつか挙げてみます:

1)根音は、なぜ和音の基礎なのか?
2)完全4度も完全5度も協和音程なのに、減5度はなぜ不協和なのか?
3)ソナタの主題がさんざん変形されても、元の主題だと判るのはなぜか?
4)12音技法の規則は、聴く人にとっては無意味ではないのか?
5)複調音楽の、それぞれの調を聴分けることはできるか?
6)平行5度は、なぜいけないのか?
7)バッハの無伴奏ヴァイオリン曲が、まるで合奏のように聴こえるのはなぜか?
8)モーツァルトの交響曲に見られる突然の休止には、どんな効果があるか?
9)日本語のロックはなぜ腑抜けになるのか?
10)ラヴェルの「ボレロ」の管弦楽法は、本当に計算しつくされたものなのか?
11)絶対音感は有害ではないか?
12)コンピューターから出てくるリズムが変に聴えるのはなぜか?

誇大宣伝にならないように、お断りしておきますが、音楽心理学を学んでも、このような疑問が完全に解けるわけではありません。しかし、問題を把握するときの態度は、確実に変ると思います。私がよく学生に言うのは「耳で考えよう」と言うことです。現実の音について考えを巡らせることによって、音楽に対する理解も深まるのではないでしょうか。

2 調性の話

 今回は、いきなり問題を出します。「調性」とは何でしょうか?音楽と付きあっていると、この言葉を聞いたり使ったりするチャンスは多いはずです。しかし、その意味が解っているようでも、わざわざ聞かれると困ってしまいます。それでは、私たちが調性を強く感ずるのはどのようなときかと言うと、調性が崩れたり、乱れたりするときです。

 ジャズ・ピアニストの山下洋輔名人が「センチメンタル」と言うソロのアルバムを出し、そこにシューマンの「トロイメライ」を収めています。フリー・ジャズ風に味付けがしてあり、「山下洋輔のトロイメライ」になっているのは当然のことですが、一応おとなしくヘ長調で始ります。ところが、少し進んだところで、とんでもない音が鳴りだします。どんな風にとんでもないかと言うと、ヘ長調の流れに全くそぐわないのです。それで、聴く方はびっくりして、喜んだり怒ったりするわけです。実は、古典的名曲においても、このような効果はあちこちで用いられています。楽聖ベートーヴェンの「ヴァイオリン協奏曲」が古典中の古典であることを疑う方はいらっしゃらないと思います。この曲は、ティンパニが静かにDの音を刻むところから始まり、木管楽器が格調高いハーモニーを聴かせます。ここは、確固としたニ長調です。ところが、10小節目で第一ヴァイオリンのパートが単独で登場し、D#の音を刻んだあとC#に落着きます。このとき、ふっと「これは大事なことなんだよ」と語りかけられたような気分になりますが、これは、オーケストラのヴァイオリンが、ニ長調の文脈では少し意外なD#の音で登場することと無関係ではないでしょう(納得の行かない方は、すぐにレコードを聴いてみてください。)。私たちの頭の中には、冒頭の9小節でニ長調の「調性」が確立され、それが10小節目に乱されることによって、大理石のような音楽に、陰影が刻みこまれるのです。

 心理学者と言うのは、不謹慎なことをいろいろと考えるのが主な仕事ですから、D#の音をDに置換えたらどうなるか、などと考えてピアノで弾いてみるわけです。結果は何とも平凡で、薄っぺらい響きとなり、そこから先を聴こうと言う気持ちが弱まってしまいます。「ヴァイオリン協奏曲」のような芸術作品は、実験材料としてはややこしいので、替りにもっと分りやすいニ長調の音階やカデンツを使ってみたらと、更に不謹慎なことを考えます。音階やカデンツを鳴らした後に、一つだけおまけの音を鳴らすことにし、このおまけの音として、D#やDだけでなく、全ての音名を代表する12の音を次々に置いてみます。平均律を用いるので、A#とBbの区別などはありません。そこそこ音楽経験のある被験者(いわゆるモルモットのこと)を選び、おまけの音が、どのくらい「その場に当てはまった感じに聴こえるか」を答えてもらいます。これは、アメリカのコーネル大学に所属されるキャロル・クラムハンスル先生と言う方が、ケスラーさんと言う方と共同で行われた実験です。ただし、クラムハンスル先生は数学科出身の才媛ですから、私がお話ししたような不謹慎な発想をされたかどうかは定かではありません。おまけの音は、少し格好をつけて「プローブ音」と呼ばれており、このような実験手法は「プローブ音法」と名付けられました。実験結果によれば、ニ長調の音階やカデンツの後には、D、A、F#がよく当てはまり、Gなども悪くありません。一方、D#、F、G#、A#、Cの当てはまりは良くありません。「ヴァイオリン協奏曲」では、ニ長調の流れに当てはまりの悪いD#の音が敢えて使われていたわけです。当てはまりが悪いと言うことは、予測や期待が外れたと言うことです。と言うことは−−−私たちの頭の中に、何かしら予測や期待があったと言うことになります。この予測または期待を、調性の核をなすものと考えるのです。今回は才媛に出ていただいたので、次回はいかめしい大先生に御登場願います。

3 調性の話

 前回は、ニ長調の音階やカデンツを鳴らした後には、D、A、F#と言った「プローブ音」がよく当てはまり、Gなども悪くないと言うことを申しましたが、ト長調の文脈には、G、D、Bがよく当てはまり、Cがそれに次ぎます。Dはこの二つの調に共通してよく当てはまっており、Gもまあ共通していると考えてよいでしょう。ニ長調とト長調とは、プローブ音の当てはまり具合いが、よく似ています。ところが、変イ長調の文脈によく当てはまるのは、Ab、Eb、C、少し落ちてDbとなり、最後のDb(=C#)を除いて、ニ長調の文脈に当てはまりの悪いものばかりです。Dbの当てはまりも良いわけではありません。つまり、ニ長調と変イ長調とは、プローブ音の当てはまり具合いが全く似ていません。ニ長調に対して、ト長調は近いが、変イ長調は遠いと言うわけです。クラムハンスル先生は、こんな実験データを得意の数学でちょいとひとひねりして、調と調との位置関係を表す地図を作りあげました。その地図を見れば、ニ長調に心理的に近いのは、ト長調、イ長調、ニ短調、ロ短調と言う近親調であることが読み取れます。ほかに、嬰ヘ短調も近いようです。

 調の地図を描くと言うことは、かのシェーンベルク大先生が思いついています。しかし、それを科学のルールに従って検証することは、また別の話です。「調性は音楽的文脈の中にあり、調性を見るには、文脈にどの音が当てはまり、どの音が当てはまらないかを調べることが有効である。」と言う明快な考えかたに御注目ください。この話を聞く前に「調性と言うのはどこにあるのですか。」と聞かれて、ここまで明快に答えられた方は多くないでしょう。

 シェーンベルク大先生の調の地図は、測量法の発達していない時代に描かれた古地図のようなものです。もちろん、近代的な測量法を知らなかったからこそ、調性をなくすなどと言う大胆なことを思いつかれたのかもしれません。プローブ音法があれば、無調音楽の「調性」について論ずることも可能になってしまい、まずいことになります。ベルクなどは、十二音技法の作品に、かなり意識的に調性を埋めこんだとのことですが、彼の音楽について考察するには、プローブ音法が役立つかもしれません。

 十二音技法の基礎となるのは、12の音名を作曲者の決めた順序に並べたもの、すなわちセリーです。セリーを作る規則は簡単で、一度使った音名は二度と使わないと言うことだけです。曲の進行につれて、元のセリーはさまざまに変形されますが、「一度使った音名は、12の音名を一巡りするまで二度と使わない。」と言う規則は守られます。大先生には失礼かもしれませんが、十二音技法の発想は、驚くほど単細胞的です。不思議なのは、これが、並外れた知性を持った作曲家たちを引きつけたと言うことで、何か隠れた理由があるに違いありません。

 ここでもう一つ、クラムハンスル先生の実験を紹介しておきます。シェーンベルク大先生の「弦楽四重奏曲第4番」には次のセリーが用いられています:D、C#、A、Bb、F、Eb、E、C、Ab、G、F#、B。このセリーの、初めの9音を順番に鳴らした後に、プローブ音を鳴らします。被験者は、「無調音楽として聴いたとき、」プローブ音がどのくらいその文脈によく当てはまっているかを答えます。実験結果を見ると、被験者は、答えかたの違う2つのグループに分かれました。第一グループでは、当てはまりの良いプローブ音が、G、B、D、F#などであるのに対して、第二グループでは、Ab、C、E、Aの当てはまりが良いと出ました。第一グループの被験者は、セリーの中でまだ一度も使われていない音名がプローブ音に用いられたときに、当てはまりが良いと感じたわけですが、第二グループの被験者は、プローブ音の直前付近で用いられた音名が、くり返して現れたときに、当てはまりが良いと感じています。第一グループの人だけが、十二音技法に合わせた聴きかたをしているわけですが、このグループの被験者は、正規の音楽教育をより多く受けており、無調音楽に関してもより多くの経験を持つ、との傾向が見られました。十二音音楽の聴きかたも、教育によって磨かれる可能性があるわけです。

4 倍音の話

ヴァイオリンの開放弦でGの音を鳴らすと、大変豊かな響きが得られます。この豊かな響きに貢献しているのが、豊富な倍音です。倍音とは何かをきっちりと説明するのは難しいことで、ここでは直観的な説明しかできません。開放弦のGの音は、大体196 ヘルツの周波数を持っています。荒っぽく言えば、弦が一秒に196 回の速さで振動し、この振動が空気を伝わって私たちの耳に到達し、私たちの鼓膜も、この速さで振動します。周波数の値が大きくなるほど、耳に聴こえる音の高さは高くなり、周波数が2倍になると、およそ1オクターブ上がったように感じられる、などと言うことは、皆様どこかでお聞きになったことがあるでしょう。ところが、フーリエ分析という数学の手法を用いると、この開放弦の振動には、196 ルツの成分だけでなく、その2倍の 392 ヘルツの成分、3倍の 588 ヘルツの成分、さらに、4倍、5倍、6倍、7倍−−−の成分を含んでいることが判ります。一つの成分だけを取り出したものが、純音と呼ばれる音で、時報の「ピー」という音や、音叉の音、グラスハーモニカの音、などが純音に近い音です。純音は、ただ一つの周波数の成分だけを含む音で、大変澄んだ響きがします(数学的には正弦波と呼ばれるものです。)。Gの開放弦の音は、実は、たくさんの純音成分が同時に鳴らされたものなのです。196 ヘルツの成分を「基本音」と呼び、196x2 =392 ヘルツの成分を「2倍音」、193x3 = 588 ヘルツの成分を「3倍音」と呼びます。このあと、「4倍音」、「5倍音」−−と続きます。

 それでは、なぜ沢山の純音が耳に聴こえてこないのか、と疑問を持たれる方もいらっしゃると思います。実は聴こえているのです。耳に聴こえているヴァイオリンの音は、明らかに時報の音とは違います。その理由の一つは、豊富に含まれる倍音のせいなのです。このように、倍音は豊かな音色を作るのに役立っています。それにしても、音の高さに着目する限り、Gの音が一つだけ聴こえるのはやはり不思議だと思われるかもしれません。確かに、基本音と倍音が一つ一つ聴こえるのであれば、基本音の高さはGとなり、2倍音はオクターブ上のG、3倍音はその上のD、このあとG、B、D、F、G−−と続くはずです。と言うことは、ハ長調の属7和音(コード・ネームではG7)が聴こえてもよさそうなのですが−−−。実は、私たちの耳は、基本音と倍音との関係、すなわち倍音関係にあるいくつかの純音を聴かされたとき、全部をまとめて一つの音として聴いてしまう働きを持っています。この働きが現れるとき、音の高さは基本音の高さのところに感じられます。この辺りの聴覚の仕組みについては、いまだに論争が続いていますが、ともかく、音が一つだけ聴こえると言うことは、子供にでも判ることです。

 ここで、例によっていたずらをします。沢山鳴っている純音成分のうち、基本音、2倍音、3倍音あたりの、低い方のものをとり除いてしまうのです。あとに残った、4倍音、5倍音、6倍音−−−といった成分は、やはり一つの音にまとまって聴こえるでしょうか? 答は:その通りです。では、低い成分を取り除いた分だけ、その音の高さは高くなるのでしょうか? 面白いことに、多くの場合、とり除いたはずの基本音の高さが聴こえるのです。ただし、音色は甲高くなります。甲高くなるので、時には音の高さが1オクターブ高くなったような気がするかもしれませんが、「G」の音の高さであると言う点は変わりません。実際に鳴らされている4倍音、5倍音、6倍音と言えば、G、B、Dの音です(コード・ネームはGになります。)。これを聴かされて、もっと低いGの音が聴こえると言うのは、長三和音を聴かされて、根音に重みを感ずるのと似ています。この二つの事柄は、同じ聴覚の仕組みを反映している、と考えたのはミュンヘン工科大学のエルンスト・テルハルト先生で、これに賛同する研究者は多いようです。

 基本音が抜けているのに、その高さが感ぜられると言うことを体験するには、電子オルガンで、純音に近い高い音域の音(例えばピッコロ)を選び、C、E、G、Bbの和音(コード・ネームではC7)と、Db、F、Ab、Cbの和音(Db7)とを、交替させてみてください。4つの音を正確に同時に鳴らすのがコツです。そうすると、聴きかたによっては、和音の感じがなくなって音が一つになり、現実に鳴っているC、Dbの音よりも2オクターブ低いところで、C、Dbの音が交替しているように聴こえることがあります。

5 音階の話

ややこしい倍音の話に絡めて、音階の話をさせていただきます。この話もややこしいのですが、どうしても必要な事柄ですので、よろしくおつきあいください。ここでは「ドレミファソラシド」の長音階の話だけにいたします。Gの音の4倍音、5倍音、6倍音を、G、B、Dと呼ぶことができると言うことは、前回申しあげました。この考えかたに従うと、長三和音の基本形をなすG、B、Dと言う三つの音の周波数は、4:5:6と言う比率になるわけで、

 Gの周波数が 196x4 = 784 ヘルツ、であるとすると、
 Bの周波数は 196x5 = 980 ヘルツ、
 Dの周波数は 196x6 =1176 ヘルツ

となります。196 ヘルツという値は、基本音のGの周波数で、ヴァイオリンの一番低い開放弦に相当します。

 Gの周波数が一つ決まると、他のオクターブにあるGの周波数も自動的に決まります。周波数を2倍にすれば、1オクターブ上の音が得られ、周波数を半分にすれば、1オクターブ下の音が得られるからです。さらに、いまお話しした4:5:6の関係から、あらゆるオクターブのB、Dの周波数も決まってしまいます。ところで、C、E、Gも長三和音ですから、同じく4:5:6の周波数を持つはずです。Gの周波数が既に決まっているのですから、C、Eの周波数が決まります。D、F#、Aも長三和音で、Dの周波数が既に決まっていますから、今度はF#、Aの周波数が決まります。

「C、E、G」、   (周波数の比率は4:5:6)
        「G、B、D」、          (4:5:6)
            「D、F#、A」         (4:5:6)

と言う三つの長三和音を考えることによって、

  「G、A、B、C、D、E、F#」 (24 :27 :30 :32 :36 :40 :45)

と言うト長調の音階のメンバーが出揃い、それぞれの周波数が決まってしまいました。音階を作るには、音階を構成する音の周波数の関係についての規則、つまり「音律」が必要です。ここで紹介したのは「純正律」と言う音律です。階名でドに当たる音の周波数が決まれば、レ、ミ、ファ、ソ、ラ、シの周波数が決まります。196 ヘルツの音がドであると決めると、一つの長音階が決まります。現代の楽器調律の状況に照らすと、このドの音にG(=ト)と言う音名を当てはめるのが適当ですから、ここでは「ト長調の純正律」が得られたことになります。
 倍音に現われる4:5:6と言う周波数の比率が、長三和音の基礎になり、長三和音が三つ揃えば、純正律の長音階が得られると言うわけです。

6 音階の話

チェンバロなどにおいて、純正律の音階を用いると、長三和音がよくまとまって落着いた感じに響くようです。ここでは、倍音関係があれば音をひとまとめに聴きやすい、と言う聴覚の仕組みが現われていると考えられます。例えば、上に示したG、B、Dの音が、それぞれ、基本音、2倍音、3倍音を含んでいるとしましょう。そうすると、

 Gの基本音は 196x4 = 784 ヘルツ、
 Gの2倍音は 196x4x2 = 1568 ヘルツ、
Gの3倍音は 196x4x3 = 2352 ヘルツ、

 Bの基本音は 196x5    = 980 ヘルツ、
 Bの2倍音は 196x5x2 = 1960 ヘルツ、
 Bの3倍音は 196x5x3 = 2940 ヘルツ、

 Dの基本音は 196x6    = 1176 ヘルツ、
 Dの2倍音は 196x6x2 = 2352 ヘルツ、
 Dの3倍音は 196x6x3 = 3528 ヘルツ、

となり、いずれも 196 ヘルツの倍数であることは明らかです。Gの3倍音と、Dの2倍音とは、周波数が完全に一致し、一つの成分になってしまいます。この長三和音は、196 ヘルツの基本音に対する倍音のみから構成されているわけで、聴きかたによっては一つの音に感じられることもありうるくらいに、まとまって聴こえる傾向があります。聴覚システムは、倍音関係にある成分を、ひとまとめにして捉えやすいからです。

 ところで、私たちに一番なじみのある音律は、純正律ではなく平均律です。厳密な呼びかたは「12平均律」となります。現在使われている多くの鍵盤楽器では、まん中のAの音が 440 ヘルツと決まっています。12平均律のもとでは、その半音上のBbの音は466.16 ヘルツ になります。AとBbとの周波数の比率は、1:1.0595 となります。半音の違いは全てこの比率で表されると言うのが、12平均律の基本です。この比率をもっと精密に示すと、

 1:1.059463094

となります。

 Bの音の周波数は 440x1.059463094x1.059463094      ≒ 493.88 ヘルツ、  Cの音は     440x1.059463094x1.059463094x1.059463094 ≒ 523.25 ヘルツ、  Gの音は     440・..059463094・..059463094    ≒ 392.00 ヘルツ、

と言うように、

 「半音上がるたびに 1.059463094 を掛ける」、  「半音下がるたびに 1.059463094 で割る」

と言う簡単な手順で、全ての白鍵と黒鍵に対応する周波数を計算することができます。440 ヘルツのAの音より1オクターブ高いAの音は、半音12個分だけ高くなるわけですから、440 ヘルツに1.059463094 を12回掛けることによって、その周波数を計算することができます。答はぴったり 880 ヘルツとなります。1オクターブ上昇すれば周波数が2倍になると言う原則が当てはまるわけです。実は、こうなるようにうまく選んだ数値が 1.059463094 だったのです。この値は「2の12乗根」で、一番安い関数電卓でもすぐに計算できます(ひょっとすると、計算の桁数は落ちるかもしれませんが)。なぜ、この音律を「平均律」と呼ぶかと言うと、「半音上がる」と言う変化が、どこの半音を取っても、「周波数が 1.059463094 倍になる」と言う等しい変化に「平均化されて」いるからです。

7 音階の話

前回と前々回とで数字がたくさん出てきましたから、今回は少し数字を控えます。音階に用いる音の周波数を決めるのに、純正律と12平均律と言う二種類の音律があると言う話をいたしましたが、音律は他にも山ほどあります。どれが正しいかを決めることはできず、結局は「趣味の問題」です。ところが、現在では12平均律が絶対に正しいと思いこんでおられる方がかなり多いようです。本人にそのつもりがなくても、当てがいぶちの音律で調律してもらった鍵盤楽器を何の疑問もなく弾いておられる方、無伴奏の合唱曲の音程をピアノに合わせて決めている方は、そう思いこんでおられることになります。中には、鍵盤楽器の調律くらい、音楽的に鋭い耳の持主であれば、誰にでもできるなどと考えておられる方もいらっしゃるようです。

 ところが、この調律という作業は、一筋縄ではゆきません。「ドレミファソラシド」の長音階で、「ドミソ」、「ソシレ」などの長三和音を澄んだ響きにしようとすると、メロディーを演奏したときに「ミファ」や「シド」などの半音の幅が広くなりすぎて、滑らかにつながりにくいことがあります。「ドレドシド」どいうメロディーを演奏するときには、「シ」の音を高めにするときれいに聴こえるのですが、そうすると「ソシレ」の和音が濁ってしまいます。まさに「あちらを立てれば、こちらが立たず」で、音階のそれぞれの音の周波数は、時と場合によって変化してくれるほうが都合がよいと言うことになってしまいます。それを、あえて固定せざるをえないのが鍵盤楽器の宿命です。12平均律などと言うものは、「あちらを少し立て、こちらも少し立てる」と言う、妥協の産物なのです。ついでに言っておきますが、ピアノの音の1オクターブの間隔は、周波数の比率が1:2となる物理的に正しい1オクターブよりも、僅かに広くする必要があります。さまざまな理由により、私たちの耳にはそのほうが自然に聴こえるのです。調律師は、微妙な妥協を成立たせるために、耳を精密な測定器として用いる必要があり、特別に訓練された耳を必要とします。

 12平均律のピアノで「ドレドシド」と言うメロディーを弾くとき(純正律の場合よりはましですが)、導音である「シ」の音が少し低すぎるので、音と音との滑らかなつながりが損なわれがちです。ヴァイオリニストや声楽家は、「シ」の音をチョイと高めにすることができますが、ピアニストは、独自の対策を立てなければなりません。メロディーをできるだけレガートでつなぐとか、最後の「ド」を強く叩きすぎないとか、滑らかさは諦めるとか、色々と手はあるだろうと思います。一方、「ソシレ」のような長三和音を同時に鳴らすとき、12平均律の楽器では、第3音の「シ」がほんの少し高すぎて目立ちすぎる可能性があります。ここでは、「シ」を強く弾きすぎないなどの対策が必要になるかもしれません。ピアニストは、「12平均律という妥協」の後始末をつけなければならないのです。

 パイプオルガンの場合には、音の微妙な強弱がつけにくく、鍵盤を離した後もかなり長い残響が残りますから、このような後始末をつけよと言われても難しいはずです。そのうえ、パイプオルガンの豊富で正確で、しかも安定した倍音は、私たちの耳を、周波数の違いに対して大変敏感にします。その結果、パイプオルガンにおいては、「12平均律という妥協」が成立ちにくく、古典的な(昔の)音律が保存されていることが多いのです。この場合、演奏する楽曲の調によって独特の色彩が生じ、古風な魅力が出てきます。例えば、ニ長調のカデンツを弾いただけで、クリスマスのようなめでたい、ありがたい響きがします。しかし、「あちらを立てたから、こちらはだめ」と言うことになり、演奏できる楽曲の種類が限られてきます。

 1オクターブに12個しか鍵盤がないために、鍵盤楽器には必ず何らかの妥協や制約が生ずるわけで、鍵盤奏者はこのことを常に意識する必要があるでしょう。子供にピアノを教えるときにも、「ドレドシド」の「シ」が低すぎるかもしれないと言う問題点を知っているかどうかで、教えかたが変わってくるのではないでしょうか。

それでは、鍵盤楽器の鍵の数を1オクターブに12個よりもうんと増やしてみれば、と考えることもできそうです。そのような試みはいくつかあります。例えば、波動の研究において、イギリスのニュートンをも凌ぐところがあったと言われる、オランダの物理学者ホイヘンスは、1オクターブに31個の音を含む「31平均律」を提唱し、この音律を用いた鍵盤楽器まで開発しています。私も、コンピューターでこの音律を作ってみましたが、率直な感想は、これだけの数の音の高さを、演奏者が全部間違いなく聴き分けるのはまず無理だろうと言うことです。また、複雑な鍵盤に素早く指を置いてゆくのは至難の技でしょう。とは言っても、周波数の正確な測定もできず、もちろん電卓も使えなかった時代に、ここまでやったホイヘンスはさすがです。

8 音階の話

 12平均律を用いることの利点の一つは、2つの音の音程が半音いくつ分と言うことさえ決まれば、周波数の比率が決まってしまうことです。と言うことは、ある音楽を、鍵盤の上でそっくり半音上や半音下にずらしても、音と音との周波数の比率が、そっくりそのまま保たれ、基本的には同じ音楽が鳴り響くことになります。つまり、12平均律のもとでは、移調、転調を安心して行うことができます。ところが、純正律のもとでは、そうはゆきません。このような理由で、純正律を始めとする古い音律における、和音、重音のまとまりの良さ、澄みきった美しさを犠牲にしても、12平均律が広く用いられるようになったと言われています。

 純正律と12平均律との違いは、音階の音を順番に演奏するだけでは、それほどはっきりとは感じられませんが、長三和音を鳴らすとかなりはっきりと判ることがあります。ただし、このことを示すには、倍音を豊富に含み、周波数が安定している楽器を選ぶほうがよいでしょう(例えば電子楽器の「フル・オルガン」)。純正律の和音に比べると、平均律の和音は、どことなく濁っているように聴こえることが多いようです。その理由は、次回に詳しく御説明いたします。

 現在では電子楽器の製造技術が進み、純正律や古典的音律を手軽に体験できるようになりました。ところが、現代人の耳は、12平均律に合わせて訓練されてしまっているらしく、それ以外の音律はどこか間違っているように聴こえがちです。音楽家に、ヴァイオリンや声で、できる限り正しく音階を演奏することを求めると、12平均律に極めて近い音階が得られるということは、私も、人の研究を手伝っていて体験したことがあります。

 12平均律の歴史は、それほど古いものではありません。バッハの「平均律クラヴィーア曲集」の「平均律」が実は誤訳で、バッハは平均律を用いていなかったと言うことが、最近しきりに強調されています。これが本当なのか、そもそも当時の調律技術がどのくらい精密なものだったのか、私には判断できませんが、正しい音程と言うものが時代、文化によって、かなり簡単に変わるものであることは確かなようです。また、音楽的な文脈も無視できず、前回述べたように、主音の直前の導音は、純正律や12平均律において指定された周波数よりも、高い周波数になる傾向があります。このような演奏の傾向を近似的に捉えるには、「ピタゴラス音律」と言う音律が使えることもあるようです。この点について、現在、京都市立芸術大学で、大がかりな心理実験が進められています。

 以下に、純正律と12平均律とにおける、ト長調の各音の周波数を表にしておきます。ここでは、G(ド)の周波数が、ほぼ完全に一致するように純正律の基準となる周波数を選びました:

音名階名純正律における
周波数 [ヘルツ]
12平\ 均律における
周波数 [ヘルツ]
392.00392.00
441.00440.00
490.00493.88
ファ522.67523.25
588.00587.33
653.33659.26
F#735.00739.99
784.00783.99 *
(*ここで二つの値が一致しないのは計算誤差のためです。)

二つの音律の違いが目立つのは、B(ミ)、E(ラ)、F#(シ)の3つの音で、いずれも純正律のほうが低い周波数になっています。ただし、この周波数の違いは、平均的な耳の持ち主が二つの音を聴き比べたときに、辛うじて違いが判る、と言う程度の小さなものです。

9 唸りと不協和の話

ときどき間違える方がいらっしゃるのですが、「唸り」は「うなり」であって「うねり」ではありません。12平均律では、392.00 ヘルツの音と 493.88 ヘルツの音とが、G、Bと名付けられ、ト長調の主和音の根音、第3音になります。この二つの音を、ヴィブラートの全くないヴァイオリン、またはフル・オルガンによって同時に鳴らしたとしましょう。そうすると、それぞれの音にたくさんの倍音が生じます。ここで、Gの5倍音と、Bの4倍音とに着目します。どちらの倍音も、音名を当てはめればBになりますが、それぞれの周波数は、

 392.00 x 5 = 1960.00 ヘルツ、
 493.88 x 4 = 1975.52 ヘルツ

となり、15.5 ヘルツくらいの違いが生じます。この違いが曲者なのです。15.5 ヘルツの違いは、1秒間に15回半の「唸り」を生じます。つまり、ブルブルという音の強弱の周期的な変化が、1秒間に15回半の割合で起こります。この唸りが、私たちの耳には「粗さ」、「濁り」として聴こえ、G、Bが形作る長3度の澄んだ感じを損なってしまうのです。

 さて、ト長調の純正律ではどうなるでしょうか。音階の話で述べましたように、長三和音の根音と第3音との周波数は4:5の比率になるはずです。Gの周波数が 392.00 ヘルツであるならば、そのすぐ上のBの周波数は 392.00 x (5/4) = 490 ヘルツとなります。先ほど、12平均律について考えた時のように、Gの5倍音と、Bの4倍音とに着目いたしますと、それぞれの周波数は、

 392.00 x 5 = 1960.00 ヘルツ、  490.00 x 4 = 1960.00 ヘルツ

となり、等しい値になります。これは、計算の経過を見れば当り前のことです。周波数の差がありませんので、先ほどのような唸りは生じません。したがって、耳には「粗さ」、「濁り」が感じられず、長3度の澄んだ響きが保たれます。

 もっとも、12平均律を使いますと、唸りのせいで、和音に広がりや豊かさが感じられると言う一面もあるようで、唸りが汚いと一概には言いきれません。唸りが音楽的に重要な役割を果たすことも珍しくありません。電子楽器では、わざと唸りを出して、音に厚みや、柔らかさを与えることがよくあります。また、西部劇に出てくるピアノでは、一つの音に対して2本または3本の弦が使われている場合に、それらの弦がわずかに異なった周波数で振動する(つまり、基本音の周波数がわずかに異なる)ので、弦と弦とのあいだに唸りが生じて、独特のとぼけた音色を出しています。本物の西部劇の時代には、ろくに調律もしないピアノが、たまたま、と言うより当然の結果として、そのような音色を生みだしたのでしょうが、現在では、わざわざ少しずれた調律を施してとぼけた音色を作るようです。調律をわざとずらせて、唸りを出すと言うことは、インドネシアのガムラン音楽にも見られ、この場合には、端正なヴィブラートのような効果が得られます。

 私たちは、490.00 ヘルツと493.88 ヘルツのように、周波数が少しだけ違う二つの音を別々に聴かされても、音の高さの違いは、判るか判らないかと言うところです。ところが、この二つの音を同時に鳴らすと、はっきりと唸りが聴きとれます。つまり、音の高さの違いよりも、唸りのほうが耳にはよく判ることが多いのです。この唸りを音楽の味付けに使うわけです。

 ついでにヴァイブラフォンの話をしておきましょう。この楽器は、鉄琴の一つ一つの音板の下に共鳴管のついた楽器です。この共鳴管が周期的に開閉する仕組みになっているので、周期的な音の強弱がついて「フワウワンワンワン−−」という、クールで大人の魅力を秘めた音が出ます。ここでは、本物の唸りが生じているわけではありませんが、唸りと似たような現象が生じていると考えることができます。(このことをきちんと理解するには、高校程度の三角関数の知識が必要です。)ヴァイブラフォンは、人間がわざわざ唸りのような音を求めて巧妙な仕組みを発明した例です。

10 唸りと不協和の話

わずかに周波数の異なる二つの純音が同時に鳴らされると、唸りが生じます。唸りは、音色に変化を与えることで、音楽表現の世界を豊かにします。ところが、ピアノの調律の現場では、別の意味で唸りが重要です。調律師は、基本音や倍音のあいだに生ずる唸りの速さを聴きとって、周波数の差を調整します。ただ何となくうまく聴こえるように調律する、などと言うことは不可能なことで、調律師は、耳を精密な測定器として用いることによって、12平均律の音階を作ってゆかなければなりません。このとき、調律師が頼りにするのは、唸りの速さなのだそうです。

 唸りが毎秒20回程度を越す割合で生ずると、耳の中にざらざらした感じが生じます。これを「音の粗さ」と呼びます。前回御説明いたしました音の「濁り」も、音の粗さが出かかったときの感じです。このような音の粗さが、同時に鳴らされた、音と音とのあいだに「不協和」を生み出すとされています。

 例えば、12平均律において 440.00 ヘルツのAと622.25 ヘルツの D#とは、増4度と言う不協和音程をなしています。(完全4度も完全5度も不協和音程ではないのに、なぜ、そのまん中の増4度は不協和音程なのかと、私は子供のころ不思議に思っていました。皆様の中にも、同じ経験をお持ちの方が、きっといらっしゃるでしょう。)今取りあげたAの音と、D#の音とを、ヴィブラートの全くないヴァイオリン(またはフル・オルガン)で、同時に演奏したと仮定します。

 Aの3倍音は    440.00x3 = 1320.00 ヘルツとなり、
 D#の2倍音は   622.25x2 = 1244.50 ヘルツとなります。
 違いは               75.50 ヘルツですから、

毎秒 75 回半の唸りが生じます。1000ヘルツ以上の成分に対しては、毎秒70 回程度の唸りが生ずるときに、音の粗さが最大になることが、これまでの研究で知られていますが、ここではまさにそのような状況が生じています。AとD#とを同時に鳴らしたときには、これ以外の倍音についても唸りによって音の粗さが生じます。このような音の粗さが積み重なると、全体としてはかなり耳につくものになります。これが「不協和」の感じを生ずるのです。

 このようなわけですから、もし、3倍音以上の倍音がなければ、AとD#とのあいだに音の粗さはあまり感ぜられないはずです。AもD#も時報の音のような純音にすると、不協和が解消することになります。実際に、そのような音の組み合わせをコンピューターなどで合成して鳴らしてみると、増4度の不安定な感じが完全になくなるわけではありませんが、濁った響きはかなりの程度まで消えてしまいます。音の粗さによって不協和を説明することは、的外れではなさそうです。

 半音離れたAとBbとを同時に鳴らす場合には、今のように濁った響きから逃れることが難しくなります。仮に、この二つの音を純音で鳴らしても、440.00 ヘルツの純音と 466.16 ヘルツの純音とのあいだに、毎秒約 26 回の唸りが生じ、明白な音の粗さを生じてしまうのです。

 それでは、「協和」とは何でしょうか。いま御紹介した考えかたに従いますと、協和とは不協和の少ない状態のことになります。それでは、余りにも単純すぎると思われるかもしれませんが、目に見える理由のないかぎり、話を複雑にしないのが科学のルールです。このような単純化によって、和音や音律に関する議論は深まりました。なお、不協和に関する以上のような考えかたの妥当性を、数理的なモデルを用いて決定的に証明したのは、東芝の亀岡、廚川と言う方々です。バブル以前の日本の企業は、世界に誇りうる独創的な研究者、研究テーマを「飼っておく」ことができたようです。

 しかし、貧しいながらも夢があった時代はよかった、などと納得するのは考えものです。現在の日本の企業にも、すばらしい夢をもつ若い研究者が沢山いらっしゃいます。このような人々に、たっぷりと時間をさし上げれば、夢のいくつかは必ず実現するはずです。お金はそれほど要りません。「人件費のことを考えなさい。」と企業のお偉方に叱られそうですが、夢のある研究は、企業の評価を高めるわけですから、長い目で見れば充分採算が合うはずです。

11 音の常識と誤解

まだ、この前の話は続いているのですが、たまには道草を楽しむことにいたしましょう。このところ、倍音という言葉を盛んに使っていますが、倍音の話をしたときに、よく出てくる質問は、なぜ、ピアノの音などにはたくさんの倍音があるはずなのに、耳には一つの音しか聴こえないのか、と言うものです。ここでは、「聴こえる」という言葉の解釈に気をつけなければなりません。同じ 440 ヘルツの音であっても、時報の澄みきった音と、電子楽器によくあるフル・オルガンの華麗な音とでは、全く聴こえかたが違います。二倍音以上の倍音を殆ど含まない時報の音と、高い倍音までたっぷりと含むフル・オルガンの音とが、はっきり違って聴こえるのは、私たちの耳が、フル・オルガンの倍音を、きっちりと「聴きとって」いるからにほかなりません。つまり、倍音は聴こえているのです。

 ところで、ピアノの音も、人間の声も、猫の鳴き声も、フル・オルガンの音も、全て、基本音、2倍音、3倍音−−−という倍音関係(周波数が1:2:3:−−−という倍数の比率をなす関係)になった成分が集まってできています(大雑把な話ですが)。ここで、倍音関係にある成分をいちいち別の音として聴いてしまうと、日常生活ではかなり不便なことになるでしょう。猫の鳴き声は、一つの声として、まとめて聴いたほうが、猫を見つけるのに役立ちます。猫が1匹なのに、声が5匹と言うのでは、「不思議の国のアリス」に出てくるチェシャ猫も(顔が見えれば)顔負けの、不思議な猫になってしまいます。幸いなことに、私たちの聴覚システムは、倍音関係にある成分をひとまとめにすると言う働きを持っています。この働きが、人類の進化の過程で生じたのか、生まれて以来の学習によって生じたのか、はっきりしませんが、おそらく、進化と学習との両方が関わって、このような都合のよいシステムができあがったのでしょう。騒音の中で、誰かの話し声を聴きとろうとするとき、我々の聴覚システムは、騒音と、話し声とを分離しなければなりません。聖徳太子の場合には、何人もの声を分離しなければなりません。このときに、声を形作る成分の倍音関係が、重要な手がかりになるのです。つまり、倍音関係にある成分をひとまとめに捉えると言う聴覚の仕組みは、私たちの日常生活を大いに助けているのです。

 音楽で用いられる長3和音においては、ド、ミ、ソが、4倍音、5倍音、6倍音にあたり、一種の倍音関係になっています。この場合、ド、ミ、ソを別々の楽器で演奏すると、三つの音が鳴っているにもかかわらず、聴覚システムは、ひとまとまりの音として捉えようとします。このような理由で、長3和音は、まとまりよく聴こえるのではないかと考えられます。このまとまりの核となるのは、実際には存在しない基本音の成分であり、ドの音に当たります。これが、根音の起源ではないかと考えているのは、ミュンヘン工科大学のテルハルト先生です。

 ところで、ピアノの音の倍音を分離して聴きとることは、少し練習すればできます。たとえば、ヘ音記号の下第2線のCの音(チェロの一番低い開放弦に当たる)を鳴らし、それに含まれる3倍音を聴きとることを考えます。この3倍音は、1オクターブと5度上のGに相当します(ヴァイオリンの一番低い開放弦に当たる)。手順は次の通りです:


 1.Cの鍵を音を鳴らさずに一杯に押しさげる。ペダルは踏まない。

 2.スタッカートで、Gの鍵を思いきり叩く。Cの3倍音だけが残る

    (厳密には「3倍音とその倍音が残る」と言わなければなりませんが、

      ここではそこまで厳密に言うのはやめます。)

  3.この3倍音をしっかり耳に刻みこんでから、今度はCの鍵を普通に

      押しさげて、Cの音を鳴らして伸ばし、3倍音のGの音を「捜す」。

 いかがでしょうか、倍音が見つかったでしょうか。このようなやりかたで、倍音が存在することを確認し、私たちの耳が確かに倍音を聴いていることを確かめることができます。

 私は、学生時代に男声合唱をしていましたが、ミサ曲などを練習しているときに、ぴったりとハモると、いないはずの、アルトやソプラノの声が聴こえたような気がして、驚くことがありました。どうも、この「天使の声」を注意して聴きつづけると、美しいハーモニーが生まれるようなのですが、これも倍音のいたずらであろうと考えています。そのうちに自分で研究してみたいと考えていることの一つです。なお、私どもの歌をお聴きになった方々に、天使の声が聴こえたかどうかは、ご想像におまかせいたします。

12 唸りと不協和の話

このまえ、不協和の元凶は、唸りから生ずる「音の粗さ」であると申しあげました。このことに間違いはないのですが、同じように唸りを生ずるような2つの音を鳴らしても、そこからものすごい不協和が感ぜられたり、あまり不協和が感ぜられなかったりします。例えば、電子オルガンなどで、隣りあったEとFの鍵を同時に押したり離したりすることを繰りかえしますと、相当な不協和が感ぜられます。ところが、Eを鳴らし始めた一息後にFを鳴らし始め、Eを鳴らし終えた一息後にFを鳴らし終えるという具合いに、時間的なずれを与えますと、わずかにではありますが、不協和の感じが抑えられます。次に、Fを鳴らしっぱなしにして、それとは別に、すぐ下のC、D、Eを、CDEDCDED−−−とくり返して鳴らすと、今度は不協和の感じがかなり減小します。テンポが速めのときなどはEとFとのあいだに不協和の生ずることに気付かないことさえあります。いま挙げたどの場合にも、EとFとのあいだに、物理的には同じように唸りが生じているはずなのですが、我々がそれをどう知覚するかは、大きく変化します。

 モントリオールにある英語系大学として有名なマッギル大学の心理学科に、ブレグマン先生と言う聴覚研究の親方のような、賢くて元気な方がいらっしゃいます。この先生は、二つの音が同じように唸りを生ずる場合でも、不協和の感じが目立つ場合と、そうでない場合とがあることを指摘されました。二つの音が、同時に鳴り始め、同時に鳴り終わるとき、二つの音は、いわば二人三脚のように、二つでありながらひとまとまりになっています。二つの音がひとまとまりに知覚されると、その間の不協和も目立ちます。ところが、二つの音の鳴り始め、鳴り終わりが時間的にずれると、二つの音のまとまり具合いは、リレーのバトンタッチで二人の走者がしばらく一緒に走るくらいの感じになります。この場合、二つの音のあいだの不協和が、むき出しのまま感ぜられることは少なくなります。最後の例で、Fが続けて鳴っているあいだに、CDEDCDED−−−と反復する音列が鳴りつづける場合には、ジョギングをしている人の傍らで、一輪車の練習をしている人が近づいたり離れたりしているようなもので、二つの音の結びつきが弱すぎて、協和か不協和かと言うことが、そもそも問題になりにくくなります。二つの音のあいだに不協和が感ぜられる場合、唸りによって生じた音の粗さが確かに不協和の原因になりますが、同じように唸りが生じても、不協和がはっきりと感ぜられるためには、二つの音が(二人三脚のように)しっかりと結びついて知覚されることが必要です。音と音とが、しっかりと結びついて知覚されるか、別々に知覚されるかで、聴こえかたが大いに変わるような例は、他にも色々あり、ブレグマン先生の研究室では、このことに関連して大変面白い研究が行われています。

 作曲、編曲の際に、不協和を和らげたければ、不協和を生じうる音と音とがなるべくひとまとまりに聴こえないようにすればよいわけです。分かりやすい手段としては、EとFとを同時に鳴らすときに、それぞれの音を、音色が似ていない楽器に演奏させるという手があります。また、EとFとが異なる方向から聴こえてくる場合にも、不協和は和らげられます。この場合、ステレオ録音、ステレオ放送が威力を発揮します。ステレオの技術は、何も音の臨場感や迫力を増すためだけにあるのではないのです。

 ブレグマン先生は、パレストリーナからシェーンベルクにいたる西洋音楽の歴史の中で、不協和を和らげることが次第に少なくなり、むき出しの不協和が市民権を得てきた様子を、グラフのような図にまとめておられます。むき出しの不協和が強烈な印象を与える音楽と言えば、何と言ってもストラヴィンスキーのバレー音楽「春の祭典」でしょう。この曲には、不協和を生ずる関係にある音と音とが、ぴったり揃って変なリズムで鳴らされるところがあります。ここでは、音どうしが普通にはありえないくらいに強くまとまって知覚され、桁外れの不協和が生じています。この不協和が、どこかくい違ったようなリズムに鮮烈な力を与えるわけです。このようなむき出しの不協和は、近代、現代の音楽に多く見られますが、不協和をたて続けに用いて、緊張感を生みだすことは、モーツァルトなども行っています。美しい和声を「売り」にする楽曲において、一種のスパイスとして不協和が用いられることがあります。バッハの「平均律クラヴィーア曲集第1巻」の始まりにあるハ長調のプレリュードは、アルペジオで示された和声が余りにも美しいので、このままにしておくのはもったいないと思ったのかどうかは知りませんが、グノーがこのアルペジオを伴奏にして歌のメロディーを付け、名曲「アヴェ・マリア」に生まれ変わりました。バッハのアルペジオにおいては、不協和が思いきって用いられており、例えば第2小節目では、左手の方でCの音とDの音とが長2度の音程で鳴り続けています。

 心理屋は、不協和を音楽のどこに、どのくらい用いればよいかと言うことに口を挟むことはできません。しかし、作曲、編曲、演奏、録音に際して、不協和を和らげるには、あるいは強めるにはどうすればよいかと言うことについて、多少の意見を述べても無駄ではなさそうです。

13 オクターブの話

高い声の出ない人が歌を歌うとき、高い音をそのまま出さずに、1オクターブ低い音でごまかすのは、よくあることです。これは、特にその人が音楽理論のことを気にしているかどうかとかかわりなく見られる光景で、例えば、酔っぱらってカラオケでがなりたてている人が、苦しくなって1オクターブ下の声を出すのを御覧になった方も(ひょっとしたら自分で経験された方も)いらっしゃるのではないでしょうか。酔っぱらいのカラオケとは別の理由で、一つのつながったメロディーが、あちこちの音域を飛びまわりながら演奏されることが、古典的名曲にもしばしば見られます。面白い例としては、ベートーヴェンの「ハンマークラヴィーア・ソナタ」の冒頭があります。

 余談になりますが、ベートーヴェンの音楽は、聴覚心理学、音楽心理学の研究材料の宝庫と言えます。よくよく楽譜を見れば「何で、これがこの感じに聴こえるの?」と驚かされることがしょっちゅうあります。ものすごい例は、かの第5交響曲の冒頭「ダダダダーーン」(GGGEb)です。私はあるとき、これがなぜ運命的なハ短調に聴こえなければならないのか、どうして変ホ長調に聴こえてはいけないのか、気になってしかたがなくなったことがあります。色々な人に理由を尋ねてみたのですが、皆、首を傾げるばかりです。ただ一人慌てずに答えてくれたのは、和声学に詳しい音楽学者で、「それは、これを聴いた途端にこの曲だと判りますから−−−。」とのことでした。そうだとすると、初めてこの曲を聴いた人には、この冒頭の部分が変ホ長調に聴こえることもありうると言うことになります。このことを確かめるには、ベートーヴェンの第5交響曲を一度も聴いたことがなく、かつ、長調と短調との区別が判る、と言う被験者を捜しだす必要があります。実験心理学にも苦労が多いと言うことがお解りいただけるでしょうか。

 「ハンマークラヴィーア」の冒頭では、「ティラーンタタンティラタンタン」(BbDDDEbDDBb)と言うメロディーが聴きとれ、鼻唄で真似をすることもできます。しかし、このメロディーは、楽譜の上では数オクターブにわたって飛びまわっていて、とても鼻唄で追える代物ではありません。それでも、我々はこれを歌うことができるのです。この曲の、この後の部分でも同じようなことが見つかります。考えてみれば、ベートーヴェンも例のスケッチブックを持って散歩しながら、高貴なるメロディーを、鼻唄のごとく思いつき書きつけたのかもしれません。楽譜を書く段になって、鼻唄の音よりも、1オクターブ下のBbを使ったり、1オクターブ上のDやもっとずっと上のD、Ebを使ったりしたのかもしれません。ベートーヴェンが実際にどうしたのかはさておき、面白いのは、違うオクターブにある音でも、同じオクターブにあるかのように聴きとってしまう、我々の聴覚の働きです。

     (譜例:ベートーヴェン「ハンマークラヴィーア・ソナタ」、冒頭5小節)

14 オクターブの話

 酔っぱらいのカラオケで、1オクターブ下の音を使うことがあると言う話をいたしましたが、オクターブが違っていても、「音名」は同じなのだから、代わりにその音を使っても全然おかしくないのでは?と思われた方がいらっしゃるかもしれません。しかしながら、1オクターブ離れた音に、なぜ同じ音名が付いているのか、それこそが問題なのです。1オクターブ離れている音は、どこか似た感じに聴こえるから、同じ音名で呼ばれるようになったはずで、「もともと」同じ音名が付いていたわけはありません。音の高さは、例えば C、C#、D、D#−−−と半音ずつ進むにつれて、階段を登るように上がってゆきます。ところが、−−−Bb、B、C と1オクターブ進むと、出発点のCの近くに帰ってきたような感じがします。ちょうど、螺旋階段で一回り分登ると、出発点に残っている人に真上から「こっちだよ」と呼びかけることができると言う、そんな感じです。このように螺旋階段のような形になぞらえることを最初に考えついたのは、アメリカのリュックミックと言う学者で、1929 年のことです。

ある音の高さと、そこから1オクターブ離れている音の高さとに、似た感じの生ずることを「オクターブ類似性」と呼びます。1オクターブの場合だけでなく、2オクターブ離れているときにも、3オクターブ離れているときにも、似た感じがしますし、同じ音名が与えられます。これも「オクターブ類似性」です。

オクターブ類似性は、音階や和音を考える際の基礎となります。ところが、音階について考えるとき、多くの場合「1オクターブをどのように区切るか」と言うことがいきなり問題になり、「なぜ1オクターブが基本になるのか」と言うことは議論されません。このような、これ以上理屈がつきそうにもない、いかにも当り前であるようなことを、わざわざ問題にして、あれこれと理屈をつけ足すのは心理学者の大事な仕事です。なぜそのようなことで時間を潰すのかと言うと、それは面白いからです。このような当り前のことにも、人類が進化の過程で獲得した、聴覚の精密な仕組みが反映されているはずです。その秘密を探ることが面白いのです。

 オクターブ類似性は、生後3箇月の赤ん坊にも見られると言うことを、1984 年に、当時パリのルネ・デカルト大学で活躍されていたドゥマニー先生が報告されました。そうだとすると、音楽教育を受けているかどうかにかかわらず、オクターブは特別な音程であると結論づけることができます。もっとも、赤ん坊が、母親のお腹の中で何を聴いていたか、あるいは、生まれてから3箇月の間何を聴いていたか、と言うことは、多いに関係する可能性があります。

 お腹の中にいるとき、あるいは生まれた直後に、音を聴かせないと言う実験を人間に対して行うことは、技術的にも、人道的にも不可能ですが、鳥が卵の中にいるあいだに音を殆ど聴かせないという実験は可能です。卵の中のマガモの胚子(生まれる前の雛)は、ある段階で鳴くことができるようになりますが、これを手術で鳴くことができないようにして、自分の声も、他の胚子の声も聴こえない、静かな環境で孵化させると、生まれた子ガモは 825 ヘルツ以上の高い音の成分を聴きとりにくくなり、母鳥の声を聴き分けるにも問題が生ずると言うことが報告されています。ところが、自分で声を出せない胚子に、他の胚子の鳴き声を聴かせつづけることによって、このような障害を避けることができます。マガモの胚子が発達するさい、神経系の低い周波数を受けもつ部分がまずできあがり、生まれる前後に高い周波数を受けもつ部分ができあがるのですが、高い周波数成分を聴く能力を充分に伸ばすためには、高い周波数成分を含むような音を聴く必要があるらしいのです。少し脱線しましたが、人間の胎児、乳児についても、さまざまな音を聴かせることによって、聴く能力が育つ可能性が大いにあることを強調しておきたいと思います。ついでに申しあげておきますと、見る能力を育てるには、赤ん坊に色々なものを見せる必要がありますが、どうもこの場合には、自分であちこち這いまわったり、自分で物を触ったりしながら見ることが大事であるようです。(テレビはこの条件に当てはまらないので、要注意です。)

15 オクターブの話

前回の話で、赤ん坊や子ガモに対して、どのように実験を行うのか、不思議に思われた方がいらっしゃるかもしれません。赤ん坊は、「耳新しい」音のする方を見つめるので、赤ん坊の目を観察することによって、実験を行うことができます。また、子ガモは母鳥の鳴き声と、それ以外の(あるいは歪められた)鳴き声とを区別し、母鳥の鳴き声のする方に近づくので、二つのスピーカーから別々の音を出して、子ガモの行動を観察すれば、実験ができるのです。実験をするのも面倒ですが、結果の解釈はもっと面倒です。

 今回は、面倒ついでの話をしておきます。なぜオクターブ類似性が生ずるのか、と言う話題です。考えられる理由は少くとも二つあります。一つは倍音の存在に基づくものです。ヴァイオリンのGの開放弦は、196 ヘルツの基本音を含むと同時に、その1オクターブ上の 392 ヘルツ(= 196x2 ヘルツ)の成分を2倍音として含み、さらにその1オクターブ上の 784 ヘルツの成分を4倍音として含みます。このように、1オクターブないし2オクターブ離れた成分は、同時に出現することが多いので、1オクターブや2オクターブは「特別な関係」であることを我々の聴覚システムが学習している可能性があります。この種の考えかたを体系的にまとめられたのは、ビールの本場にあるミュンヘン工科大学のテルハルト先生です。先生の属しておられるのは電気音響学科ですが、これは私の勤めている九州芸術工科大学の音響設計学科と同じように、世界でも数少ない音響専門の教育研究組織の一つです。お国自慢になって恐縮ですが、食べ物や飲物が安くておいしい土地と音響の研究とは、相性が良いようです。(ミュンヘンも福岡も国粋主義の温床になったという、有難くない共通点もありますが。)

 オクターブ類似性についてのもう一つの考えかたは、初めのうち、ちょっと奇抜に見えるかもしれません。196 ヘルツの音というのは、1秒間に 196 回のくり返しをもつ音のことです。くり返しと言うのは、耳の中の気圧の変化のくり返しのことで、このような気圧の変化を、我々は「音」として聴くのです。(「気圧の変化」とは言っても、天気図に現れるような変化に比べればはるかに小さいものです。)この場合、我々の聴覚システムは、1/196 秒という気圧の変化の周期(くり返しの単位となる時間)を捉えます。ここで、1オクターブ上の 392 ヘルツの音について考えてみましょう。これは、1秒間に 392 回のくり返しをもつ音のことですから、周期は、1/392 秒です。我々の聴神経は、階段を普通に登るときのように、この周期の一回一回を捉えることもあれば、階段を一段抜かして登るように、一回分の周期を抜かして次の周期を捉えることもあります。一回分を抜かすと、階段の2段分をまとめて進んだことになり、周期が2倍に伸びたのと同じことになります。つまり 1/196 秒(= 1/392x2 秒)という周期が現れたのと同じことになり、聴こえのうえで、1オクターブ下の 196 ヘルツの音との類似性が現れるのです。実際には 1段抜かしだけではなく、2段抜かし、3段抜かしのこともあり、周期を抜かさずに進む場合も含めて、様々な進みかたが、現れます。例えば、「抜かさずに進んだあとは、3段抜かして、次は1段抜かして、また抜かさずに進む。」と言った感じです。196 ヘルツの音についても、1段抜かし、2段抜かしなどが生じます。このようなわけで、実際にはもう少し話が複雑になりますが、考えかたの基本は上に述べたことで充分でしょう。この種の考えかたを示されたのは、現在京都市立芸術大学で活躍しておられる大串健吾先生です。大串先生の思いつきは、世界中で高く評価されています。

ここに挙げた二つの考えかたのうちいずれが正しいのか、あるいはどちらも少しずつ当たっているのか、今のところよく分かりません。このような面倒な問題の研究に日夜とり組んでいる研究者が、世界のあちこちにいます。

16 音の常識と誤解

オクターブの話が続くので、少し息抜きをいたします。近ごろ流行るCDの話です。1982 年に、コンパクト・ディスク(略してCD)が商品化されました。当時は、音響の専門家のあいだに、かなり懐疑的な意見が目立ちました。「何百枚もの(ときには何千枚もの)レコードを収集したオーディオ・マニアが、そう簡単にCDにのり換えるとは考えられない。」、「扱いの手軽さでは、なんと言ってもカセット・テープが一番である。」などの声があり、「これからは、CDの世の中になる。」と断言した音響の専門家は、少なくとも私の周りにはいませんでした。

 わが家では、いち早くCDプレーヤーを購入いたしましたが、これは決して先見の明があったからではありません。わが家には、レコードの収集がもともとわずかしかなく、FM放送を、安売りで買ったカセット・テープに録音したりして音楽を楽しんでいました。あるとき、大学の研究室で新しいオーディオ技術の参考としてCDプレーヤーを購入したので、試しにCDからメタル・テープ(少し高級なテープ)のカセットに音楽(「ツァラトゥストラはかく語りき」でした)を録音し、わが家のラジカセで聴いてみたところ、楽器の音色が鮮明なことに驚いたのです。その直後に、10万円以上はすると思っていたCDプレーヤーが、家電製品量販店の店頭品処分と言うことで、6万円くらいで売り出されているのを見つけ、衝動買いをしてしまいました。その後時が経ちましたが、わが家のLPプレーヤーはいまやほこりをかぶり、その一方で、CDのコレクションは、数百枚になっています。家の中にCDプレーヤーとCDラジカセが合わせて何台あるのか、数えなければわからないくらいです。街中では、特別な場所を探さなければ、LPレコードを買うことが難しくなりました。学生時代に通った名曲喫茶では、「まっさらの(音質が劣化していない)レコード」を鑑賞できるレコード・コンサートの時間帯がありましたが、ここでも今はCDを使っているようです。ちなみに、「名曲喫茶」というのは、金のない学生がコーヒー一杯の値段で、試験勉強をしながらクラシック音楽を鑑賞できる場所でした−−−念のため。CDはいまや、世界各国の学生にとって、文庫本のようなものです。全世界を舞台としたCDの成功物語は、音響技術史の上でも特筆すべきものです。ご存じの方が多いと思いますが、CDのシステムを開発したのは、日本とオランダとの合同チームであり、両国の音響技術の水準の高さが解ります。このまえ、授業中に世界で初めてデジタル録音に成功した国はどこかと学生に尋ねたところ、アメリカとかドイツとか思っている人が多く、自信を持って日本と答えた人がいないので、少しショックを受けました。デジタル・オーディオは日本が世界に誇る技術分野です。成功の理由は、機械の設計から録音までこなすような優秀な研究者が、会社の枠を越えて協力したところにあるようです。

 このようなわけですが、LPを支持する声もいまだに根強く残っています。よくある議論は、「保存状態のよいアナログのレコード(LP)を、本当によい装置で聴けば、デジタル(CD)よりもずっと良い音がするのに、音響技術者はそのことを知らない。」と言うものです。これは誤解です−−−音響技術者は、場合によってはアナログのほうが良い音がすることを、よく知っています。私も、オーディオ店に勤める友人の好意によって、数百万円クラスのオーディオ・セットを使って、CDとLPとの聴きくらべを体験させてもらったことがあります。CDではところどころ目に見えないくらいの薄い雲がかかったように思えた音質が、LPでは、抜けるような青空になったのを思いだします。ところが、スピーカーやアンプの品質を少し落とすと、この違いは判らなくなってしまいました。先に紹介したわが家のような状況では、LPの本来のよさを引きだすことは、大変難しいと言わざるをえません。むしろ、扱いが楽で、何回聴いても、すり減らないCDのほうがお奨めと言うことになります。ベートーヴェンの「第九」をぶっ続けで聴ける、と言うことがCDを開発する際の一つの目標だったそうですが、「第九」を年末の大掃除をするたびにバック・グラウンド・ミュージックに流したいと言うような方には、CDがうってつけでしょう。

 音響技術者は、デジタルにしたおかげで音が根本的に良くなるなどとは考えていません。現段階でのデジタル技術の主な利点は、普通に買うことのできるオーディオ・セットを用いて、普通の聴きかたをするときに、必要な情報は間違いなく保存し、伝えるという点にあります。その代わり、あまり必要でない情報はばっさりと切り捨ててしまいます。最近では、「要らない情報を捨てる」技術がさらに発展し、MDやDCCを始めとする小型デジタル・オーディオを生み出しました。ところが、ある程度高級なアンプやスピーカーを用いて、耳を澄ませて違いを聴きわけるときには、切り捨てた情報も無視できないことがあるのです。それでは、情報を切り捨てずに、もっと沢山の情報を保存すればよいではないかと言う話になりそうですが、あまりに欲張ると、CDもCDプレーヤーも値段が跳ねあがり、そのうえ大きくて扱いにくいものになってしまいます。CDの最大の利点は、お金がなくて、しかもオーディオの扱いに無頓着であっても、そこそこ良い音質を確実に体験できると言うことなのです。(ただし、それでおしまいと言うわけではありません。)

17 脱線

 前回のCDの話には、現実問題として興味をお持ちの方が多いと思いますので、少し脱線を続けさせていただきます。これからCDプレーヤーを買う人がどのような機種を買えばよいかという、お買物情報です。

 とりあえず何かオーディオが欲しいと言う方は、大きなスピーカーのついたCDラジカセを安売りで買って、その気軽さを体験なさるとよいでしょう。まずよく知っている曲のCDを試聴用に買って、いくつかの機種を聴き比べてみることをお奨めいたします。ただし、派手に色づけされたポップスやロックなどは、少々問題のあるラジカセで鳴らしても、それなりにかっこよく聴こえてしまうので、要注意です。立派な生演奏で聴いたことのあるオーケストラ曲などが無難でしょう。ラジカセは、長年使うようには設計されていないので、5年くらいでお役御免にしても惜しくない程度の予算を設定する必要があります。ただし、修理に出さなければならないこともありえますので、少し値段が高めであっても、サービス網の充実したメーカーの製品が安全でしょう。

 少し予算に余裕をお持ちの方には、大安売りのCDプレーヤー(携帯用でもよい)を見つけ、格安のオーディオ・アンプにつなぎ、余ったお金を全部スピーカーにつぎこむ、と言う方針をお奨めいたします。スピーカーに関しては、左右合わせて3万円前後の予算でも、ラジカセのスピーカーよりはかなり良いものが買えます。いくつかのメーカーのものを試聴することが絶対に必要です。

 前回申しあげたように、安物でもそこそこの水準に達するのが、CDの良いところです。さしあたり、CDプレーヤーは安物を買えばよいのです。また、オーディオ・アンプは、電気信号を、より強い電気信号に変えるだけのものですから、安物を買ってもそれなりに(あくまでも「それなりに」ですが)健闘してくれます。ところが、スピーカーの役目は、電気信号を気圧の変化という全く異なったものに変換することですから、この場合には、様々な不都合の紛れこむ可能性がありますし、その一方で、職人芸の見せどころもあります。伝統あるメーカーが手間暇かけて作ったスピーカーは、生演奏の音楽とはまた別の美しい音を聴かせてくれます。完全に大量生産のラインに乗っているような製品にも、なんとなくメーカーの特色が現れるようです。

 予算を抑える話ばかりしてきましたが、CDプレーヤーに大金を投ずるのが馬鹿げていると申しあげるつもりはありません。LPプレーヤーにオーディオ・マニアが投じていたのと同じ程度のお金をCDプレーヤーにかけると、デジタル信号が、より忠実にアナログ信号(音になる寸前の電気信号)に変換されるようになり、何となく音質に余裕が出てきます。(この点は、聴覚心理学の研究テーマとしても面白そうなのですが、残念ながら、現在の実験技術では歯が立ちません。)私は自分では経験しておりませんが、高級CDプレーヤーについてもメーカーを選ぶことが大切であるそうです。CDプレーヤーの性能に見あうだけの、高級なアンプやスピーカーを揃えることも必要です。

最後に、関連するデジタル音響機器として、MD(ミニディスク)、DCC (デジタル・コンパクト・カセット)、DAT(デジタル・オーディオ・テープ)に触れておきます。MD、DCCはいずれも、CDに含まれる情報のうち、弱すぎて聴こえない音などの、我々の聴覚システムに関わりそうもない部分を捨ててしまうという発想により、情報量を数分の一にまで落とすシステムです。これは大変面白い考えかたで、音響を専門とする学生に授業でこの話をすると、眠りかけていた学生も目を覚ますくらいです。残念ながら現段階のMD、DCCには、CDの代わりになるほどの音質は望めないようですが、MDなどは、使いやすく編集に便利な録音装置として、魅力的な商品です。

 DATは、CDをしのぐ仕様を持っており、録音にも使えるので、スタジオや音響関係の研究所で、広く用いられています。ただ、根本的な設計に無理があるのか、せっかく録音したテープを破壊してしまうような事故、故障が起こりやすく、私の研究室では、数台しかないDATデッキのうち2台以上が同時に故障することがこれまでに2度起こりました。困ったことに、壊れたのは、デジタル技術において世界の最先端を行くメーカーの製品です。他の研究室、研究所と情報交換したところ、同じ悩みを抱えているところは多いようです。結論は明快で、家庭用にDATデッキを買ってはいけません。DATには今も泣かされており、声を大にしてメーカーに抗議したいと思います。この件について、被害を受けた経験をお持ちの方がいらっしゃれば、ぜひ情報をお寄せください。

18 オクターブの話

オクターブの話のまとめをいたします。1オクターブ、あるいは2オクターブ離れた音が、同じ音名ないし階名で呼ばれるなど、心理的に近い関係にあることを「オクターブ類似性」と言う用語で表します。

オクターブ類似性は、カラオケで、高い音が出ないときに、1オクターブ下の音ですませるといった場面にも現れますが、それ以外にも、音楽の中に様々な形で生かされています。ベートーヴェンの「ハンマークラヴィーア・ソナタ」では、もともとは鼻唄のようなメロディーが、数オクターブを存分に用いて示されているために、ピアノに秘められた様々な音色が見え隠れします。「偉大なる鼻歌」は、ベートーヴェンの得意技ですが、これをオクターブ類似性が支えています。

 もう一人、オクターブ類似性の活用という点で独自の境地に達しているのは、ムソルグスキーです。「展覧会の絵」のピアノ原曲の終曲では、「ティーンターンティーンタンティンターン」(CBbEbFBbG)と言う「プロムナード」のメロディーが最高音に現れますが、ほんの少しだけ遅れて1オクターブ下の音が鳴るので、まるで、ヨーロッパの古い街で教会の鐘のエコーが石畳に響きわたるような感じに聴こえます(譜例を御覧ください)。ここで、遅れて鳴る音を、1オクターブ下の音から同じオクターブの音に変えますと、単なる音符のくり返しとして聴こえてしまい、面白味がありません。1オクターブ下の音にすると、オクターブ類似性のおかげで、メロディーの音と関係があるように聴こえる一方、音色の感じなどがメロディーの音とは異なるので、メロディーの一部としてはつながらず、エコーのように聴こえるわけです。まことに心憎い隠し味と言うほかはありません。ラヴェルのオーケストラ編曲は、この曲の魅力を華麗に浮かびあがらせたものであると言われていますが、聴覚心理学の研究者としては、ピアノの限られた音を用いて、人間の聴覚の様々な可能性を徹底的に掘り起こした原曲のほうに、心を引かれます。

 音楽史の上でムソルグスキーのライバルに当たるチャイコフスキーも、オクターブ類似性の生みだす効果を「ヴァイオリン協奏曲」の独奏ヴァイオリン部にふんだんに用いています。こちらは、オーケストラと渡りあうヴァイオリンから火花が飛び散るような派手な効果です。

 オーケストラ曲などで、2種類以上の楽器、パートが1オクターブまたは2オクターブ離れて同じメロディーを奏することがよくあります。2種類以上の楽器、パートが、一つの楽器であるかのように新しい音色を作りだしていると見たほうがよい場合もありますが、そうではなく、異なる楽器、パートが、ある程度独立を保ちながら、同じメロディーを奏しているように聴こえる場合には、オクターブ類似性が働いていると見てよいと思います。この場合、メロディーに広がりや、高揚感が伴うことが多いようです。ブラームスの「交響曲第1番」2楽章には、天に向かって響きわたるようなヴァイオリン独奏のメロディーが現れますが、ここでは、同じメロディーを、1オクターブ下のオーボエと、2オクターブ下のホルンとが重ねて演奏しています。

 他にも、オクターブ類似性の面白い例が色々あります。ゲームのつもりで捜してみてください。(譜例:展覧会の絵、終曲「キエフの大門」、第95〜104小節))
19 音脈の話

 バッハの無伴奏チェロ・ソナタは、大変演奏が難しいと言うことですが、一体どこが難しいのでしょうか。譜例1を見てください。私は、チェロの演奏技法については殆ど何も知りませんが、この曲などは、ある程度整った音を出すことだけを目標にするのであれば、少し心得のある人には恐れるほどではないように思います。ところがあるとき、音楽専攻の学生が、このメロディーはつかみどころがなく、どこをどう弾いたらよいか解らなかったと、音楽心理学のレポートに書いているのに出会いました。確かに、始まりの部分<GGDG>などは、ここだけを見れば月並みな伴奏パートのようで、みずみずしさも爽快さもありません。ところが、これをピアノのために譜例2のように編曲し、右手を思いきり歌わせて演奏すると、バロックのスタイルから見れば少しおかしなものになるかもしれませんが、生き生きとした音楽が現れます。どこが違うかと言えば、元のチェロの曲が、基本的に単旋律であったのに対し、ピアノ編曲版は二声になっている点が大きいでしょう。実は、バッハの元の楽譜にも、このような二声が隠れていて、それを浮き出させるように演奏することが可能です。素人が何を言うかと怒られそうですが、現に、ヨーヨー・マなどの一流演奏家の演奏を聴けば、そうなっています。

 演奏のポイントを私なりに想像すると、ピアノ編曲の右手に相当するメロディーのつながりをしっかりと感じながら弾くこと、左手に相当する音符は、はっきりと刻むような音色で、右手のメロディーとは区別して弾くことではないかと思います。ただ、チェロ用の譜面では一つしかない音符が、ピアノ用の譜面では二つの声部の両方に必要とされることもあり、これをチェロ一本でどう表現するかは、一流の演奏家でも苦労されるのではないかと想像しています。

初めの4つの音は、これをつながったメロディーとして解釈すると、月並みな伴奏のようになってしまいますが、実は、最初の2音と、次の2音とは別の声部に属していると考えられ、滑らかな右手のメロディーと、それと掛けあうように刻まれる左手のリズムとの対照が面白いのです。ここを聴いた途端に面白いと感じられるような演奏が求められます。楽譜を見たところ一つの声部しかないのに、作曲と演奏の工夫によって、二つ以上の声部を聴かせることが可能となるわけです。(このように、「種も仕掛も見えているのに、ひっかかる」ようなマジックが、偉大な芸術に共通に見られる技法である、と言うのが、酒を飲んだときの私の持論です。)

 一つの声部が二つに聴こえるような知覚現象は、「音脈分凝(おんみゃくぶんぎょう)」と呼ばれ、聴覚心理学の世界で最近非常に注目されています。

(譜例1:バッハ 「無伴奏チェロ組曲第1番」から「クーラント」から冒頭8小節) (譜例2:譜例1をピアノ用に編曲したもの。最初の4小節では、小節の2番め、3番めの音符が、元の音高を保ち、「左手」に割り当てられる。小節ごとに「DG」、「DG」、「CC」、「DD」となる。小節の3番めの音符(「G」、「G」、「C」、「D」)は4分音符に伸ばされる。もちろん、その分だけ休符が短くなる。それ以外の音符は、メロディーとして1オクターブ持ち上げられ、「右手」に割り当てられる。第2小節の始まりまでは「GG・BCDCBAB」となる。小節の始まりの音符は、4分音符に伸ばされる。続く4小節では、同様に「左手」、「右手」の振り分けがなされ、「左手」は、小節ごとに「AAD」、「GGC」、「DBD」、「G」となり、右手は「CBCACBCA・CBA」、「BABGBABG・BAG」、「F#ADG-F#」、「G」

20 音脈の話

前回は、一つの声部が二つに聴こえてしまうような知覚現象を、「音脈分凝」と呼ぶ、と申しました。この言葉はまるで「祇園精舎の鐘の声−−」に続きそうな、古めかしい響きを持っていますが、英語の「auditory stream segregation」の訳語です。この訳語を決めるために(決めることを口実に?)、博多のさるインド料理店に、聴覚心理学の研究者が五人集まったのは、1980年代半ばのことです。できあがった訳語は、このインド料理の香りを残しているかもしれません。

 「音脈」と言うのは、音楽のメロディーのように時間的に一つながりになった音のかたまりのことです。一つながりの話し言葉、誰かの足音、近づく車のエンジン音、庭先のつくつくぼうしの声、これらはすべて音脈の例です。私たちは、日常の生活で、溢れる音に取り囲まれていますが、私たちの聴覚システムは、溢れる水を河や運河に分けて流すように、溢れる音を音脈に分けて聴きとります。そのおかげで、人の話を筋の通ったものとして理解したり、車のエンジン音から危険を察知したりすることが可能になるわけです。何かが二つ以上に分かれてまとまることを「分凝」と言う言葉で表しますが、溢れる音がいくつかの音脈に分かれて聴こえることが「音脈分凝」であると言うことになります。私たちの日常生活で、音脈分凝が起こらなければ、音が聴こえても「音の洪水」に過ぎず、全く意味がありません。

 面白いことに、同じところから同じように発せられる音でも、高い音Aと低い音Bとが、ABABAB−−と急速に交替する場合、AAA−−、BBB−−という二つの音脈が生ずることがあります。聴覚システムは、AとBとが別のところから発せられた全く異なる音であると、間違った解釈をしてしまうわけです。このような現象も「音脈分凝」と呼ばれます。AとBとが、音の高さ、音色などの点で異なっておれば、この現象が生じえます。聴覚システムは、間違いを犯したとは言え、いつもと同じように働いているだけですから、この現象は、上に述べた「音脈分凝」の一例とみなしてよいでしょう。聴覚研究者が「音脈分凝」と言う言葉からまず思い浮かべるのは、このような「狭い意味での音脈分凝」です。バッハの無伴奏チェロ・ソナタにおいては、この現象が生じやすいような演奏が求められます。

 これまでの研究成果から判断すると、一つの声部の音を二つの群に振り分けて、二つの声部があるような感じを与えるためには、作曲、演奏のうえで次のような手段が有効であると考えられます:


 1)二つの群の音に、離れた高さ、はっきり異なった音色を与える。
同じ群の音には、近い高さ、似た音色を与える。
 2)場合によっては、二つの群の音に、異なった大きさ(強度)を与える。
 3)二つの群のあいだの音の交替を、何度も繰り返す。
 4)テンポを遅くし過ぎない。
これで、音楽の現場に役立つでしょうか?

21 音脈の話

時間的に一つながりに聴こえる音のかたまりを「音脈」と言うわけですが、日常生活においては、一つの音脈が一つの音源(音の出どころ)に対応していることが頻繁に見られます。一つながりに聴こえる人の声は、一人の人の発する話し声ですし、一つながりに聴こえる鳥の歌は、一羽の鳥の鳴き声です。一つながりに聴こえる足音は、一人の人間が歩く音で、一つながりに聴こえる水の音は、一本の小川から発しています。たくさんの音脈を聴き分けると、楽しい「音の風景」の中に入ってゆくことができます。足音を立てたり人とおしゃべりをしたりしながら、山道を進み、鳥の歌(ときには合唱)や小川のせせらぎに心を和ませるとき、そこにはいくつもの「音脈」があります。

 もしも、いくつもの音脈が分かれて聴こえるという「広い意味での音脈分凝」が生じなければ、私たちは「音の洪水」に呑みこまれてしまうでしょう。幸いなことに、実際にはいくつかの音脈を別々に聴きとることのできる場合が多く、一つの音脈が、「一つ」あるいは「一まとまり」の対象、あるいはできごとに対応することが多いので、全体として、自分の置かれている環境に関連した、豊かな聴覚体験ができあがるわけです。ハイキングの場合には、これで楽しさが何倍にもなると言う次第ですが、我々の祖先が森や草原などで暮らしていたころには、もっと事情が差し迫っていたと考えられます。環境に即した聴覚体験を持つことは、変化や危険をすぐに察知し、仲間との素早いコミュニケーションによって適切な集団活動を行うために、不可欠であったと思われます。つまり、生き残るための重要な手段であったと言うことになります。

 話は逸れますが、現代では、昔に比べれば豊かで安全な社会が実現したおかげで、耳が不自由であることを克服して、人生を楽しむことが可能になっています。しかし、変化や危険の察知、他人とのコミュニケーションと言う基本的な点で、まだまだ難しい問題が残っているのです。我が国は、高度の技術と莫大な富を蓄積し、その一方では、人類始まって以来の高齢化社会を迎えつつあります。年をとれば避けて通ることのできない聴力障害の問題に対して、聴力障害者の環境への適応を総合的に助けると言う観点から取り組むことは、国民の責務であり、急務でもあります。

 音脈が成立する際には、さまざまな要因が絡まりあっていると考えられ、このことに関して世界各地で研究が進められています。多くの要因の中でも重要なのは「周波数近接の原理」と呼ばれるものです。昨年も年末の「第9」をお聴きになった方がいらっしゃるかと思いますが、4人の独唱者がそれぞれはっきりとした「音脈」を作っていることに気づかれたはずです。この場合、4人の声の基本音(最も低い成分)の周波数の離れていることが、それぞれの声を独立の音脈として浮き出させることに貢献していると考えられます。逆に言うと、周波数の近い成分は、一まとまりに聴こえやすいと言うことになります。もし「第9」の独唱部を編曲して、大人気のスーパー・テナー三人組にもう一人加えて、テノールばかりで固めたとすると、どんなに個性豊かな4人が揃っても、4つのはっきりとした音脈を作ることは難しいでしょう。

 二つのメロディーを、同時にはっきりと響かせたければ、離れた音域に置いたほうがよい、と言うのは作曲法の常識でしょう。フランクの「ヴァイオリン・ソナタ」終楽章では、ピアノとヴァイオリンとがカノンを演奏しますが、どちらのメロディーもはっきりと聴きとることができます。この場合、ピアノのメロディーに比べて、ヴァイオリンのメロディーが高い音域にあることが、大変効果的です。

 滑らかなメロディーのつながりを拒絶したかのように見えるウェーベルンの「ピアノのための変奏曲」においても、「周波数近接の原理」は働いています。作曲家が何をしようと、聴覚の基本原理が変わるはずはないのです。それゆえ、同じ音域の音符どうしが聴こえのうえで結びついて、メロディー「のようなもの」がふっと浮かびあがります(少なくとも私の聴きかたではそうです。)。ウェーベルンは、聴覚システムが音と音とを結びつける働きを信じていたからこそ、一見ばらばらな音符の並べかたを、思いきって試みることができたのではないでしょうか。

22 音脈の話

 音脈が生ずる際に「周波数近接の原理」が重要な役割を果たすことをお話しいたしました。もう一つ重要な役割を果たすのが、「共通運命の原理」です。「共通運命」などと言うといかにも大げさですが、元になる英語が「common fate」ですからしかたありません。八人の漕ぎ手が息を合わせてボートを漕いでいるとき、同じ側の四本のオールが一つにまとまって見えることがあります。また、一斉に同じ方向に泳ぐ水槽の中の鰯が、一つの生き物であるかのようにまとまって見えることがあります。一匹だけ逆方向に泳ぐ「自由な」鰯は、群れから外れているように見えます。このように、同時に同じような変化をするものがいくつかあるときに、ひとまとまりのものとして知覚される傾向を、共通運命の原理と言う言葉で表します。

 音楽において、二つの以上の声部が、いつも同時に鳴り始めたり、同時に鳴り終わったりするとき、声部と声部とが知覚の上ではっきりと分離されにくくなり、一体として聴こえやすくなります。例えば、シベリウスの「フィンランディア」の合唱の部分では、合唱団員の全ての声が一斉に鳴り始め、一斉に鳴り終わります。ある声だけが、またはある声部だけが先に聴こえたり、後に残ったりしないわけです。また、ある声部の動きだけが聴こえると言うこともありません(先に取り上げたベートーヴェンの「第九」において独唱者が競いあって歌う部分とは、この点が異なります。)。こう言うわけで、あたかも人間の声を超えた一つの偉大な声が響きわたるように聴こえます。この曲の場合、各声部がばらばらに聴こえてはまずいのです。演奏に当たっては、合唱団全員の音符の始まり、終わりがぴったりと揃うように、細心の注意が必要であると思われます。ところが、同じ合唱でも全く異なる場合があります。バッハの「マタイ受難曲」では、多くの声部が別々に始まったり、終わったりするところが多く、決して一枚岩ではない沢山の人間の声が響くように聴こえます。もっとも、バッハの場合にも、合唱団全員が揃うべきところは揃うと言うことが重要であることは申しあげるまでもありません。「フィンランディア」も「マタイ受難曲」も、強い祈りの気持ちがこもった名曲ですが、二つの曲のあいだで人間の声の響きかたは随分違っています。「フィンランディア」の合唱は、まさに「共通運命」の言葉にふさわしいものです。

 対位法の曲では、声部の独立性をはっきりさせるために、楽譜の上では同時に始まる異なった声部の音符に、演奏家が時間的なずれを与えることがあると言われています。ただし、この点に関してはデータを集めることが難しく、一般的な結論を出すのは大変です。とりあえず、面白い仮説として注目しておきたいと思います。

 二つ以上の声部が、同じように上昇したり、下降したりするときには、一体として知覚される度合が増します。同じ種類の木管楽器が三度の間隔を保ったまま、同時に上昇したり、下降したりすると、音色が似ていることも手伝って、一つのメロディーが、豊かな音色で演奏されているようにも聴こえます。この現象については、またの機会に詳しく触れるつもりです。

 考えてみれば、一人の人間の声は、たくさんの純音成分に分解することができ、これらの純音成分は、同じように始まり、終わります。また、同じように上昇し、下降します。このような、純音成分をまとめて「一つの声」として聞くことは、一人の声を一つの声として聞くことですから、環境への適応になっています。例えば、うるさい場所で誰かの話を聞く必要があるときに、役立つはずです。「共通運命の原理」は、最終的には適応を助けていると思われます。

 しかし、何十人分もの声をひとまとまりにして捉えることが適応と言えるでしょうか?我々の聴覚システムは騙されているのではないでしょうか?私は、この場合には騙されるのが適応であると思います。音楽は音の遊びですから、私たちの知覚システムを騙すことがあるのは当然です。

音は時間的に変化し、その変化の様子は、音を知覚するうえで極めて重要です。聴覚の世界で共通運命の原理が大きな役割を果たすのは、恐らくそのためでしょう。

23 音の常識と誤解

マルチ・メディアの時代になって、映像の重要性が増し、相対的に音の果たす役割が弱まった、と言う人が増えています。また、文学部の心理学科などでは伝統的に、視覚が日常生活を営むうえでの最も重要な感覚であり、聴覚は視覚の補佐をするにすぎない、と信じこんでいる人が多く、「知覚心理学」と言えば「視覚心理学」のことになってしまう場合が大部分です。聴覚の研究に携わる者にとって、これは生活の基盤を揺るがす大問題です。読者に、このような誤解を持つ方はいらっしゃらないと思いますが、どうしてこのような誤解が生ずるのかを、考えてみたいと思います。

 マルチ・メディアにおいては、映像に要する情報量が、音に要する情報量に比べて圧倒的に多いと言う厳然たる事実があります。オーディオがデジタル化しつつあることは、ご存じの通りですが、画像、映像をデジタル化することは、なかなか大変です。一例を挙げると、いまブームになりつつあるデジタル・カメラは、従来のカメラ(つまりアナログのカメラ)に比べて、画像の品質が明らかに劣り、CDがアナログのレコードを駆逐したのと同じように、デジタル・カメラが従来のカメラにとって替わると言うことは考えられません。従来のカメラに対抗しうるくらいの品質を得ようとするには、デジタル・カメラの情報量をもっと増やす必要があるのですが、そのようにすると、値段がとんでもなく高いものになってしまいます。技術の進展は信じられないくらいに速いので、十年後に、デジタル・カメラが主流になる可能性は充分にありますが、現段階では、高品質の画像に要する情報量の多さが、技術の壁となっています。

 このようなことから、多くの情報量を要する視覚のほうが、少ない情報量ですませている聴覚よりも、高級であり、重要であるとの考えかたが生ずるようです。しかし、少し考えてみれば、事実はそれほど単純でないことが解ります。例えば、私自身はテレビのニュースを、画面を見ずに音だけで済ませてしまうことがよくあるのですが、逆に、音を消して画面だけでニュースを見ることは、殆ど不可能です。ニュース番組に関する限り、画面よりも音のほうにはるかに重要な情報が含まれていると言うことになるわけですが、このような「情報の重要性」は「情報量」と言う概念では捉えきれないものです。

 深刻な例になり恐縮ですが、アメリカのスティーヴン・ヘンデルと言う先生が、1989年に出版された聴覚心理学の教科書の冒頭で「聴覚か視覚かのいずれかを失うとすればどちらを選ぶか?」と言う問いかけをしておられます。多くの人が、聴覚は失っても、視覚は失いたくない、と考えるのですが、実際には、聴覚を失うことは、他人とのコミュニケーションに大きな制限が生ずることになり、視覚を失うよりも、はるかに深刻な問題が生じます。ヘンデル先生はまた、稲妻よりも雷鳴のほうが、体験としては、はるかに恐いことを指摘しておられます。ピカッと光った後で、「恐い」と身をすくめても、現実には意味がないわけですが、これはよく見られる光景です。聴覚は、環境と自分との心理的な接触を保つうえでも、重要な役割を果たすことが解ります。

 ヘンデル先生の考察によれば、片方の眼には、約100万本の視神経の線維がつながっているのに対して、片方の耳には1万5千本の聴神経の線維しかつながっていません(それでも大変な数ですが)。ところが、情報が大脳皮質に達する段階では、大脳の片側(右側あるいは左側)において、直接視覚に関わる神経細胞の数が約1億個となるのに対して、直接聴覚に関わる神経細胞も約1億個と、殆ど同じ数になってしまいます。このような数えかたには異論もあろうかと思いますが、眼や耳に近い情報の入口の段階で、圧倒的に視覚システムのほうが多くの情報を得ているにもかかわらず、情報を加工し、伝える段階で、聴覚システムが巻き返しを図っていることは確かです。つまり、我々の聴覚システムは、限られた情報を、効率的に利用していることになります。実際に、耳から大脳に至る神経系の道筋はかなり複雑で、さまざまな情報の加工が行われていることが窺われます。一方、眼から大脳に至る道筋は、比較的単純で、網膜に映る物の形が、大脳における神経細胞の活動のパターンに、かなりはっきりと対応づけられます。

 それでは、聴覚システムにおける神経細胞の複雑なつながりは、どんな働きをしているのでしょうか?これが、意外に解っていないのです。おかげで、私もしばらくのあいだ飯の種に困らないと言う有難い話になります。

24 音の補完

最近は、コンピューターで様々な音を簡単に作ることができるようになり、音を使った楽しい遊びができるようになりました。その中でもすぐにできる遊びを紹介いたしますので、お好きな方は、是非お手持ちのコンピューターで、試してください。[GoldWave、CoolEdit 96 と言う、音で遊ぶための便利なシェアウェアもあります(Windows に対応しています)。MIDIのシーケンサーを用いることも可能でしょう。]

 まず、1000 ヘルツくらいの純音(時報のような音)を、400 ミリ秒間鳴らします(ミリ秒とは 1000 分の1秒を表す単位のことで、研究者はミリセカンドと呼ぶことが普通です。)。可能であれば、音の始まりや終わりを余り急激にせず、数ミリ秒くらいかかって音が出始め、同じく数ミリ秒くらいかかって出終わるようにします。これは、余り急激に純音が始まったり、終わったりすると、カッというような音が聴こえて、実験の邪魔になることがあるからです。この純音を、純音1と呼びます。純音1の直後に、次のような4つの純音を、同時に 150 ミリ秒間鳴らします:


   純音1より1音半低い純音、

   純音1より半音低い純音、

      純音1より半音高い純音、

   純音1より1音半高い純音。

一つ一つの純音の強さは、純音Aよりもかなり強めにします。この4つの純音を同時に鳴らしたものを、和音2と呼びます(和音と呼ぶのはおかしいかもしれませんが)。和音2は、1音間隔で並んだ4つの純音からできており、その音の高さの中心が純音1の位置に当たりますが、純音1そのものは含んでいません(近似的には、純音1が、ト音記号の上にはみ出したBの音に当たり、和音2は、そのまわりのAb、Bb、C、Dに当たります。)。和音2も、できれば数ミリ秒くらいかかって出始め、また出終わるようにします。和音2の直後に、再び純音1を 400 ミリ秒間鳴らします。結局、次のように音を出すことになります:


     (純音1) −(和音2) −(純音1)

            400 ミリ秒   150 ミリ秒   400 ミリ秒。

 このパターンを繰り返して聴いていると、面白いことに気づきます。純音1は、ほとんど始めから終わりまで鳴り続けており、まん中に 150 ミリ秒の中断を挟んでいるわけですが、多くの場合、この中断があるようには聴こえず、純音1がパターン全体の始めから終わりまで切れ目なく鳴り続けているように聴こえます。150 ミリ秒と言う時間が余りにも短いからだと思われるかもしれませんが、音楽ではもっと短い音符がいくらでも出てくるわけで、聴覚システムにとって、捉えきれないくらい短い時間ではありません。和音2を取り除いてしまうと、今度は、はっきりと中断したことが聴き取れます(聴き取れないときには、スピーカーに近づくか、ヘッドホンを使うかの、いずれかを試してください。)。この簡単な実験で、和音2が、純音1に中断のあることをおおい隠していたことが解ります。仮に、和音2のあるところで、純音1が本当につながっていたとしても、和音2がある程度強い場合には、純音1が聴覚上かき消されてしまい、「つながっているのか/いないのか」、よく判らなくなってしまいます。ところが、我々の聴覚システムは、充分な情報が与えられていないにもかかわらず、「つながっている」との判定を下すのです。

 考えてみれば、充分な情報が与えられないままに、私たちの聴覚システムや視覚システムが、素早い判定を下すことは、よくあります。毛布をかぶって寝ている人が突然浮き上がると言う手品がありますが、この種明かしをすると、寝ているはずの人が、自分の足の模型をもち上げながら、毛布の中で立ち上がるのです。私達の視覚システムは、頭と足とのどちらも同じ人の体の一部であるという判定を、不完全な情報を手がかりに下してしまい、おかげで、明らかにおかしいことが生じてしまうわけです。しかし、このような早呑み込みの判定は、日常生活においては、それほど支障を生じません。それどころか、環境に素早く適応するために必要ですらあります。純音1が、中断しているにもかかわらず、つながったものとして聴こえるのも、このような早呑み込みの例です。視覚システムや、聴覚システムが、欠けている情報を補うので、このような現象を「補完現象(補間現象)」と呼びます。

25 音の補完

聴覚の補完現象に関連の深い現象に「ロール効果」と呼ばれるものがあります。「ロール」と言うのは太鼓をドロドロと打ち続けることですが、ここではスネア・ドラム(小太鼓)が、速めのテンポのもとに一拍当たり4回の刻みで(四分音符を一拍とすると十六分音符の細かさで)「タカタカタカタカ−−−」と鳴り続けている状況を考えてください。一つ一つの音がほぼ等しい強さで鳴らされる場合、全体としてひとつながりの音に聴こえます。ここで、「タ」の音が「カ」の音よりもずっと強く鳴らされると、「タッタッタッタッ−−−」と言う具合に強い「タ」の音だけのつながりが聴こえます。ところが、弱いほうの「カ」の音は、それだけが「カッカッカッカッ−−−」とつながって聴こえるとは限らず、「タカタカタカタカ−−−」と細かい刻みのつながりに聴こえることが普通です。このつながりの中では、「タ」と「カ」とはほとんど同じ大きさに聴こえます。私たちの聴覚システムは、「タ」の音を、「タッタッタッタッ−−−」と「タカタカタカタカ−−−」との二つの音のつながり、つまり二つの音脈に組み込んで解釈するわけです。

 ジャズのドラム・ソロなどでは、「タカタカダカタカタカタカダカタカ−−−」と、「ダ」のところだけスネア・ドラムを抜かして、代わりにタムタム(スネア・ドラムよりも大きめのサイズをもち、「ダッ」とか「ドン」とか鳴る太鼓)を鳴らすことがあります。このとき、タムタムはかなり強く鳴らされます。私たちの耳にはまず「ダッ−−ダッ−−」と言うタムタムの切りこみが跳びこんできますが、面白いことに、スネア・ドラムは「タカタカタカタカタカタカタカタカ−−−」とずっと続いているように聴こえることが多く、「タカタカッカタカ−−−」と「ダ」のところが抜けているようにはなかなか聴こえません。この場合、実際には鳴らされていないスネア・ドラムの音が聴こえているわけで、聴覚システムは「早呑み込み」をしたことになります。仮に、「ダ」のところでスネア・ドラムが実際に「タ」と鳴らされたとしても、その音は、タムタムの大きな音に、聴覚上かき消されてしまい、はっきりとは聴き取れません。「ダ」のところでスネア・ドラムが「鳴っているのか/いないのか」について、聴覚システムには不充分な情報しか与えられていないことになります。ここで、聴覚システムは「鳴っている」との素早い判定を下すわけです。この現象は、前回に御紹介した「補完現象」に通ずるものです。聴覚システムが、不完全な情報に対して素早い判定を下し、早呑み込みとなるわけです。そして、ドラマーに腕が三本生えているかのような印象が生ずるわけです。

 今の例では、早呑み込みのおかげで、規則的なリズムを聴き取ることができるわけですから、早呑み込みが、音楽の構造を把握する上で役立っている面もあります。音楽を理解するために私たちの聴覚システムが進化したとは考えられませんが、このような聴覚の仕組みが、言語の理解などに役立っていることは、充分にありえます。

 「ロール効果」の話に戻りますが、ここで御紹介したような現象について厳密に調べるには、楽器の音ではなく、機械的に合成した音を用いることが必要です。合成音を用いて実験を行ったのは、オランダのファン・ノールデンさんと言う研究者です。その結果によれば、強い音Aと、弱い音Bとを、素早く交替させてABABAB−−−と鳴らすと、A・A・A・−−−と言う具合に強い音だけのつながりが聴こえますが、一方では、Aが鳴るところで弱い音Bも同時に鳴るように聴こえ、BBBBBB−−−というつながりが知覚されます。

 私は、ファン・ノールデンさんのお宅に伺ったことがありますが、この方の本職は電話、通信関係の技師で、心理学の研究は何と休日の趣味なのです。お宅の二階に、自作の実験装置が転がっているのが印象的でした。私はヨーロッパで仕事をすることが多く、面白いことも面倒なこともたくさん経験していますので、ヨーロッパ(厳密には西欧北部)の良い点と悪い点とをかなり冷静に評価しているつもりですが、このように純粋な好奇心から大がかりな研究を行う人が存在し、しかも尊敬されて(少なくとも尊重されて)いるのを見て、今でもヨーロッパは科学の先進地域である、との感を深くします。日本では、このような研究成果に対して「それでどのようなことに応用できるのですか?」と言う類の質問しか思いつかない人が、大学の教官、学生の中にも多いのです。日本を含む東アジア諸国が本当の意味での先進国になるには、まだまだヨーロッパから学ぶべき点が残っているようです。

26 音の常識と誤解

私は、伝統校とされる大学の文学部の心理学科で学びましたが、ここでは、人間にとって圧倒的に重要な感覚は視覚であり、聴覚はそれに次ぐ副次的なものであると言うことが「常識」になっていました。残念なことに、文学部、教育学部、人文学部と言った学部に属する心理学科(あるいは関連学科)では、この「常識」がまかり通っており、「知覚心理学」と言えば「視覚心理学」のことを指すことさえあります。「認知心理学」と言う言葉が盛んに使われるようになってからも、事情はそれほど改善されていません。私の出身学科の卒業生には、聴覚心理学の分野で研究活動を続けている人間が5名いますが、その全員が、聴覚、音響に関する知識の大部分を「独学」で身につけているはずです。一方では、全員が視覚に関するある程度の知識を大学で学ばされたはずで、今でも少しは視覚のことを考え、研究活動に役立てていると思います。聴覚に関する基本的な知識も、実験心理学を専攻する人間には不可欠であり、大学の授業に組みこまれる必要があると思うのですが、そのためには、教科書の種類も教官の数も不足気味で、なかなか大変です。今のところ、学生諸君に、独学で聴覚のことを学ぶと言う「伝統」を引き継いでいただく以外にありません。

 大学に限らず、世の中の人々によく考えていただきたいことは、我々の日常生活において、聴覚がどのような役割を果たしているかと言うことです。聴覚の役割の一つは、危険や変化を察知することでしょう。我々は、「何か来たぞ」とか「これはいかん」とか言う類の情報を、耳から仕入れることが実に多いのです。今から約2億年前、恐竜が活躍していたころ、哺乳類が出現しましたが、初期の哺乳類はネズミのように小さくて弱い動物で、夜行性であったと言われています。したがって、嗅覚と、聴覚とが、危険や変化を察知するうえで、大変重要になったことは間違いありません。我々人間は、臭いの溜まる地面に鼻を近づけることが少ないので、嗅覚は相当鈍くなったようですが、聴覚のこのような働きは、残しています。車が近づいたことをエンジン音で察知することは、その一例です。ちなみに、車の近づいてくる方向まで音で判るのは、生まれてからの学習による面が強いと考えられますので、子供には、方向を聴き当てる訓練をしたほうがよいように思います(絶対音感の訓練よりもよほど重要なはずです。)。

 両生類から哺乳類まで一貫して、大変強い音に対しては反射的な応答が生じます。このことには、神経生理学的な説明も可能であると聞いたことがあります。犬に突然吠えかけられてビクッとしたような経験をお持ちの方も多いのではないでしょうか。このことは、危険の回避に役立っていると考えられます。反射的な応答は眠りかけていても生ずるので、ハイドンの「びっくり交響曲」のようないたずらもできるわけです。

 眠っている間も、聴覚による変化の察知は可能です。おかげで、目覚まし時計で起きることもできます。一方では、僅かに目を覚ました時間を利用して、外は土砂降りであるといった情報を得ておくことも可能です。このように、聴覚は「24時間体制」を取っています。同時に、聴覚は「360度体制」を取っています。視覚が捉えることのできる情報は、目の前のわずかな部分に限られます。日常生活における我々の視野は、単に何かが見えると言うだけの範囲まで含めると、左右に180度を超えますが、物の形や色まで判るのは、せいぜい数十度の範囲です。これに対して、聴覚は、360度いずれの方向からも、さらに、壁の向こう側からさえ、情報を得ることができます。見えないものからも、耳を澄ませば、かなり詳しい情報の得られる場合があります。視覚が働かない時間帯、方向、場所を、聴覚は広くカバーしています。したがって、その場の「雰囲気」を感ずるには、聴覚の果たす役割が大きいでしょう。街の雰囲気をテープに録音して後で聴いてみると、写真を見る以上の臨場感があるのは、そのせいではないかと思います。聴覚と視覚との間には、最初に聴覚から大まかな情報を得て、必要があれば、後で視覚によって詳しく確かめると言った、分業が成立しているようです。つまり、聴覚は「見張り番」の役割を受け持っています。「聴き張り番」と言うのがよいかもしれませんが。

 ところで、聴覚の大事な役割が、まだ一つ残っています。それは、人と人とのコミュニケーションの手段を与えることです。これについては、次回にお話しいたします。

27 音の常識と誤解

聴覚の重要な役割として、人と人とのコミュニケーションの手段を与えると言うことがあります。いきなり話が飛びますが、現代のヒトとは系統の異なる「ネアンデルタール人(旧人)」のことを、どこかでお聞きになったことがあると思います。彼らは、死者に花を捧げると言った文化を有していたことが判っており、高度な知能と感情を持っていたと考えられます。食べ物には適しない花を価値のあるものとして認めること、死んだばかりの人と顔を合わせることを最後の貴重な機会として認識すること、などは、抽象的な思考、長い記憶の蓄積があって初めて可能です。また、豊かな感情がなければ、厳しい自然環境の中で花を集めることもありえないでしょう。生きてゆくうえで直接役に立たない、手の込んだ埋葬作業を協力して行いうるような、連帯感も芽生えていたにちがいありません。ところが、このネアンデルタール人は、現代人につながる新人(クロマニョン人など)との競争に敗れ、滅びてしまいました。(同じ環境に、異なった種や亜種が存在する場合、その環境に、より適切に適応した種や亜種が、多くの食物や住みかを確保して繁栄し、他の種や亜種が衰退すると言うのが、生物学で言う「競争」です。)

 ネアンデルタール人がなぜ滅びたかについては、現在盛んに研究が進められているようですが、一説に、新人に比べて、言葉を操るのが苦手であったためと言うのがあります。その説に従うと、ネアンデルタール人ののど(咽)は、新人ののどよりも短く、音響学的な分析によれば、そのような作りでは、声によってたくさんの種類の音を出し分けるには不向きであることが判ります。私たちは言葉を喋る際に、実に多くの音を使いわけることができます。そのおかげで、迅速な共同作業が可能となり、今日の人類の繁栄につながったと考えられます。ネアンデルタール人については、続々と新しい見解が出てくるようであり、「のど」の話については、疑問視する意見もあるようです。本当のところはどうであったのか、早く知りたいものです。

 ここでは、更に進化の歴史を辿り、類人猿の話に移ります。類人猿に言葉を教えようと言う数々の試みが、これまでになされています。チンパンジーなどは、さまざまな色と形を持つプラスチックの板きれを「単語」として、それを簡単な「文法」に従って並べた「文」によって、意思を伝えることができます。また、簡単な英語の文を聴いて理解する天才ボノボが、最近テレビなどで紹介され、話題になっています。ところが、チンパンジーもボノボも声を出して言葉を喋ることは殆どできません。類人猿ののど(咽)は、現代人成人ののどに比べて極端に短く、たくさんの音を巧みに出すことができないのです。

 私達の長いのどが、人類の繁栄に大いに貢献したことは明らかです。ところが、この長いのどには、生存に不利な面があります。長いのどが、空気と食べ物との共通の通り道になりますから、食べ物が気管に詰まると言う危険が生ずるのです。人類が、このような危険を冒してまで長いのどを進化させた理由としては、巧みに言葉を喋ると言うことが、生存に極めて有利であったと言うこと以外に考えられません。言葉を喋らない乳児の段階では、人間も類人猿のような短いのどを持っています。人間の赤ん坊は、気管におっぱいが詰まらないような安全策を採っているわけです。(おっぱいを吸いながら呼吸をすると言う大人にはできない芸当も可能です。)

 さて、言葉を巧みに発しても、それを聴きとる能力がなければ、効率のよいコミュニケーションは成立しません。脊椎動物が、陸上で生活するようになって以来、耳の働きは画期的な進化を遂げ、私達の耳および聴神経は、音を周波数分析したり、音の時間波形の繰り返しパターンを把握したりすることができるようになりました。私達の大脳皮質の左半球では(ごく稀には右半球で)聴覚を司る領域の隣に、言葉の理解に関係が深いと思われる広い領域があります。これは、私達の鋭い聴覚と、複雑な言葉を操る能力とが、手を携えあって進化してきたことを物語ります。

 ところで、音楽を聴く能力は、人類の生存に直接関係しないはずです。音楽に対する感動を呼び起こす仕組みが、音楽を聴くために進化したとは考えにくいと思います。言葉を聞くために進化した聴覚システムが、音楽に転用されている可能性もあるのではないかと思われます。この点については、また改めて論じたいと思います。

28 音の補完

前回に、言葉を話し、聴き取ることの重要性についてお話しいたしました。「音の補完」に関しても、言葉を聴き取ることの重要性に関連した現象があります。私が教室でよく使うのは、この現象の発見者であるアメリカのリチャード・ウォレン先生が公表された聴覚デモンストレーションです。「Try to tell which speech sound is missing in the sentence.」と男性が喋っている横で、誰かが「ゴホッ」と咳払いをしていると言う、一見何の変哲もない情景が録音されているのですが、ここに少し仕掛けがあります。咳払いは、「missing」の「m」が始まりかけたところから、「i」にかけて入っているのですが、この箇所では、言葉の音が録音から削られており、その代わりに咳払いが入っているのです。つまり、「which speech sound is mゴホsing in the sentence.」という感じになっています。ところが、教室でこのデモンストレーションを聴いた学生に、この文を黒板に書いて見せ、言葉の音が一部消えているのが判るかどうかを尋ねると、誰にも判りません。それどころか、咳払いが英文のどの箇所に入っているかと言うことすら、なかなか判らないのです。つまり、「missing」の一部が、録音の上ではなくなっている(つまり missing である)のに、私達の耳はその音を聴き取ってしまうのです。

もし、音を聴き取るのでなく前後の文脈から考えて、なくなった音を推測しているのであれば、苦労して推測したのがどの音であるかは、すぐに判るはずです。ところが実際には、それがどの箇所であるのかなかなか判らない−−−と言うことは、私達が考えて音を推測しているのではなく、その音を本当に聴いている、と言うことになるわけです。私達が考えるのではなく、私達の聴覚システムが考えてくれると言うこともできますが、聴覚システムの中に賢い小人がいるわけではなく、限られた仕組みを巧みに用いて、瞬時にこのような補完が行われるわけです。つまり、このような補完は自動的に生じます。この現象を「音韻修復」と呼びます。

 音韻修復は、日常生活で広く生じていると考えられています。今述べたデモンストレーションでは、言葉の音の一部が、物理的になくなっていたわけですが、物理的になくならなくても、咳払いの音が強いときには、聴覚システムの入口(末梢)のところで、それ以外の音がかき消されてしまい、言葉の音がなくなったのと同じことになります。咳払いに限らず、強い騒音は言葉をかき消してしまいます。例えば、航空機の離着陸のときにその近くにいると、強い騒音がべったりと続くので、喋っている言葉が聴こえなくなることを経験します。ところが、窓を開けた列車に乗っているときには、「ガタッガタッ、ガタッガタッ」という騒音が、言葉の一部をかき消しているはずですが、何とか隣の人と話を続けることができます。言葉の大半がかき消されずに残っているので、音韻修復が生じ、会話全体を聴き取ることができるわけです。

 音楽においても、似たような現象があります。例えば、テンポが速めで、メロディーのはっきりとしたピアノ曲を録音し、その録音から、メロディーの中の短い音符を一つ消してしまいます(同じ箇所の伴奏も消えます。)。そして、消した音符の箇所に、「ザッ」という強めの雑音を入れます。そうすると、雑音が確かに邪魔にはなりますが、メロディーがつながっているように聴こえます。また、雑音がどの音符の箇所に入っていたのか楽譜の上で当てようとしても、かなり難しいことが判ります。音楽におけるこのような補完現象を発見されたのは、宮城学院女子大学の佐々木隆之先生です。この現象が発表されたのは、日本国内でもあまり広く読まれていないローカルな学術雑誌でしたが、この佐々木先生の論文は、国境を越えて読まれています。(若い研究者には、英文で論文を書くことの重要性を強調したいと思います。雑誌がローカルであっても、英語さえ使っておけば、論文が広く読まれるチャンスがあるわけです。)

 音楽におけるこのような補完現象を体験することができるのは、古いレコード盤を聴くときです。「ガリガリ」とか「ゴッ」とかひどい雑音が入っていても、音楽はきっちりとつながって聴こえます。私達の音楽経験が、隠された音を聴き取るのに役立っているわけです。音韻修復や音楽における補完などの現象は、音をうまく聴くためには、聴くという体験が重要な役割を果たすことを示しています。かなり論理が飛躍しますが、音楽をうまく聴くためには、よい生演奏に触れる体験が重要なのだろうと思います。

 ところで、ウォレン先生のデモンストレーションから咳払いをなくして、そこを空白(無音の時間)にするとどのように聴こえるでしょうか。この場合には「m sing」という具合に、空白がはっきりとその箇所にあるように聴こえ、言葉がつながって聴こえることはありません。したがって、言葉を聴き取ることが難しくなります。この意味では、咳払いは言葉を聴き取りやすくすることに貢献していたことになります。このように、面白いことがたくさんあるので、いま世界中の研究者が、この現象の仕組みを解明するために研究を続けています。

29 日本語の歌

 音楽をうまく聴くためには、よい演奏に触れる体験が重要である可能性が高いわけですが、小さな子供がまず耳を傾けて聴く音楽は、自国語あるいは母語の歌ではないかと思います。日本語、英語、中国語、フランス語などのそれぞれの言語には、独特の音の特徴があり、歌もそれにしたがって、特徴のあるものになっています。ビートルズの名曲「イエスタデイ」は、ポール・マッカートニーの少し外したような(よく言えば飾り気のない)声で、「Yesterdayーーー」と、喋るでもなく歌うでもなく始まり、「Simple is the best.」のみずみずしい世界を作りあげています。これを日本語に訳して歌うとすると、始まりは「きのう」とか「あのとき」になりそうですが、「きのぉー」では「き」が高くなり関西方言のアクセントになるので、残りの部分も関西方言にしないと、つじつまがあわなくなってしまいます(それも面白いかとは思いますが。)。「あのときぃー」とすると、アクセントがおかしいだけでなく、「字余り」になってしまいます。このように、英語と日本語とでは音の作りが違うので、歌詞の翻訳は大変です。それぞれの国語には、それぞれ適したリズム、メロディーがあるはずです。

 ところが、現代の日本では、音楽のリズム、メロディーに欧米系のものが氾濫しているので、もともと日本で作られた曲であっても、日本語がしっくりと当てはまらないと言う問題が生じています。アトランタ・オリンピックの様子がNHKテレビで紹介されていたとき、ロック系のリズムにのせて女性ボーカルの威勢のよいテーマ曲が流されていました。ところが、日本語であるにもかかわらず、英語風の発音で歌が進行し、最後は「Here we go !」で一発決まりでした。いつからNHKが、駐留米軍放送局になったのかと思いましたが、考えてみれば、巷にあふれるロックのリズムに言葉をカッコよく乗せようとすると、こうなってしまうのでしょう。「Here we go !」を関西方言の「やったるでぇ」にすると少しはサマになるかもしれませんが、アクが強くなりすぎて、オリンピックには不向きのようです。江戸っ子には、「持ってけぇ泥棒」などと勇ましい言葉遣いがあるようですが、何となくなげやりな印象は拭えず、テーマ曲に使うと、そのあと番組が続かなくなってしまいそうです。ロック系の歌の盛り上がりを、日本語でビシリと決めるのは、どうも非常に難しいようです。いわゆる標準語は論外です。と言うわけで、とりあえず日本語で始めて、盛り上がると突然英語に早変わりする、と言うのが、常套手段になってしまいました。日本文化の一部が、英語圏の植民地と化しているのです。日本人自身の手で植民地化が着々と進められているのですから、目もあてられません。

 読者の皆様の多くは、クラシック音楽畑にいらっしゃるので、このような話は、御自分に関係がないと感じていらっしゃるかもしれませんが、そんなことはありません。クラシックの歌手は、立川清登氏のような例外を除き、日本語の歌まで、ドイツ語風や、イタリア語風に発音することが多いので、言葉が不自然に響いたり、聴き取れなくなったりすることがよくあります。私事になりますが、娘に初めて日本語の歌の名曲集のようなCDを買い与えたとき、評判のよいクラシックのソプラノ歌手が歌ったものを選んだところ、おそらく歌詞が聴き取れないために、全く相手にされませんでした。ちなみに、この歌手はドイツ語圏とつながりの深い日本人です。このことを、日本語音声や日本語歌唱音の研究をしている専門家に話したところ「安田祥子、由紀さおりのシリーズがいいですよ」と即座にアドバイスをいただきました。由紀さおりと言えば、私の世代では「夜明けのスキャット」などのヒット曲で名前を覚えており、失礼ながら日本の流行歌手にしては音程が正しいと言うくらいの印象しかなかったのですが、ともかくこの御二人のCDを買ってきたところ、娘が、喜んで日本語の歌を聴くようになりました。由紀さおりのお姉さんの安田祥子と言う、暖かい声の持ち主を知ったのも収穫でした。ともかく、この姉妹の御二人が歌う歌曲は、歌詞がよく聴き取れるので、言葉の意味が本当に理解できるかどうかにかかわらず、子供には楽しいらしいのです。初めに買ったCDでは、日本語がまるでドイツ語のように発音されているために、特に子供には歌詞が聴き取りにくくなるようです。

 この場合、日本歌曲の多くがドイツ・リートのように作曲されているので、ドイツ語風に歌うと何となくサマになるという問題を見逃せないと思います。子供には受けなかったソプラノ歌手の方も、意識的にその線を目指されたのかもしれませんが、ここに、日本文化の植民地化が進行する余地があるわけです。(本当に外国のスタイルに惚れこむのであれば、むしろ、始めから英語やドイツ語で日本歌曲を歌い、外国にうって出るのが、芸術家の務めではないかと思います。)

 次回から、日本語の音の作りの特徴について少し考えてみます。

30 日本語の歌

 北原白秋、山田耕筰のコンビは、数々の名曲を生み出したことで知られています。どちらも強くヨーロッパに憧れた芸術家であり、山田耕筰は日本歌曲のドイツ・リート化路線を押し進めた責任者の一人でもありますが、二人とも日本語の美しさを感ずる鋭い耳の持ち主であったため、言葉と音楽との絶妙な組合せを実現しました。明治以降の日本人は、欧米の様々な物を日本の風土に合わせて取り入れ、あんぱん、とんかつ、ラムネと言った、最高級ではないけれども、日本人なら誰でも郷愁をそそられるような食べ物や、飲物を発明しました。白秋、耕筰の歌曲はどうも、これに似ているようです(あんぱんが本物のクロワッサンほど上等なパンではないと文句を言うのが野暮であるように、白秋、耕筰のコンビが、ハイネ、シューマンのコンビほど偉大ではないとこぼすのも野暮と言うものでしょう。なお、白秋個人を見るならば、世界に誇るべき詩人です。)。

 「からたちの花」は、このコンビが作った曲の中でも人気が高い名曲です。この曲の素晴らしい点は、「からたちの花が咲いたよ/白い白い花が咲いたよ」と、お話をするようなリズム、抑揚が、そのまま美しいメロディーに生まれ変わっていることです。

 日本語のリズムは、モーラと呼ばれる基本的な時間の単位から成り立っています。モーラと言うのは、多くの場合仮名一文字に当ります。「鉄道唱歌」の歌詞を例にとると、「汽笛一声」が7モーラ、「新橋を」が5モーラ、「はや我汽車は」が7モーラ、「離れたり」が5モーラとなります。「汽車」の「しゃ」は仮名で書くと2文字ですが、時間の単位としては1モーラです。「一声(いっせい)」の小さな「っ」や、「新橋(しんばし)」の「ん」は、それだけを発音することが不可能であったり、難しかったりしますが、それでも一定の時間を取るので、1モーラに数えます。このように、はっきりとした時間の単位があるおかげで、「鉄道唱歌」の七五調などが可能になるわけです。七五調の日本語歌曲が多いことはご存じの通りで、「荒城の月」、「われは海の子」、「鳴呼玉杯に花うけて」、「戦友」と言ったぐあいに、さまざまなタイプの曲があります。「蛍の光」にいたっては、スコットランドのメロディーに七五調の歌詞が付いています。ただし、七五調の歌詞に付けられたメロディーは、七五調の詩を朗読するときのリズムを直接反映しているとは限りません。

 「からたちの花」の歌詞は、五七調に近いリズムです。五七調は、最近ではあまり人気がありませんが、万葉の時代には幅広い支持を集めたリズムです。「からたちの花」では、日本語を喋るときのモーラ単位のリズムが、そのままメロディーに生かされており、八分音符が各モーラに割り当てられています。歌詞の行の切れ目では、音符が伸ばされていますが、これは、詩を朗読するときにも、行の切れ目で余韻やポーズを入れることに対応しています。このようなリズムのおかげで、歌詞の内容がすんなりと伝わってきます。

 初めの2行の中では、「白い白い花が咲いたよ」の「花(はな)」の「な」が引き伸ばされているところだけが、モーラ単位から大きくはみ出しています。ここでは、「花」に対する素直な感動が伝わってきます。モーラの単位からはみ出すことによって感動、驚き、強調などを表すことは、日常の会話でもよくあります。「すっごく」、「ウッソー」などの女子大生用語がよく知られていますが、「お願いしまーす」、「なーーんもわからん」など、それ以外の例もたくさんあります。このような表現はもともと文字で表しにくいことにご注意ください。例えば「すっごく」は、「すぅーっごぉく」と書けるくらいに引き伸ばされることもあります。いずれにせよ、モーラと言う確固たる枠組みがあるおかげで、そこからはみ出す部分が、はっきりと強調されるわけです。「白い白い花」と言う表現では、「白い」が繰り返された直後に「花」が強調されるので、大変効果的です。

 モーラの単位をそのまま生かした日本語の歌には、「どんぐりころころ」、「夏の思い出」などの広く親しまれている曲がありますし、「愛の賛歌」のように、シャンソンに日本語のモーラがぴったりと当てはまり、訳詞で親しまれている例もあります。訳詞と言えば、カラオケで人気のある「マイ・ウェイ」にも日本語のモーラがよく当てはまっています。

 会話における、日本語のモーラは、0.09秒から0.25秒くらいの長さを持ちます。歌曲においては、メロディーを響かせ、音楽的なリズムを組み立てるために、どうしてもそれよりは長い時間が必要ですが、あまり長くなりすぎると、言葉の意味が解りにくくなってしまいます。この辺りのバランスのよく取れた歌曲が、皆に口ずさまれるのではないでしょうか。

 次回は、「からたちの花」について、もう少し考えてみます。
31 日本語の歌

 「からたちの花」の初めの4行は、次のようになっています:


 からたちの花が咲いたよ

 白い白い花が咲いたよ



 からたちのとげはいたいよ

 青い青い針のとげだよ

初めの2行と、次の2行とには、大変よく似たメロディーが付けられていて、「からたちの」から始まる歌詞に対応関係があることを反映しています。ところが、1行めの「咲いたよ」が階名で「ドレレミ」となるのに対して、4行めの「いたいよ」は「ドミレレ」となっています。もしも、「いたいよ」を1行めに合わせて「ドレレミ」と歌うと「いたいよ」か「ひたいよ」かが紛らわしくなり、無理に「いたいよ」と聴こうとすると、とって付けたようなメロディーに聴こえかねません。音楽のメロディーを言葉と切り離して扱うようなことが、極めて不自然であることを示す例です。

 日本語では、単語ごとに決まっている音の高さの変化が重要です。広島の名物は「柿」と「蛎」ですが、関西の人と関東の人が、駅の売店で発車直前におみやげを買おうとして、店員が混乱したと言う話を、どこかで読んだ覚えがあります。(ただし、実話ではないかもしれません。)「ドレ」というメロディーで「かき」と言えば、関西では蛎のことですが、関東では柿のことになります。英語やドイツ語でも、もちろん音の高さの変化は重要な役割を果たしますが、単語の意味にまで、決定的に影響するのは、日本語の特徴です。(私には知識がありませんが、中国語、タイ語などもそのような言語であるそうです。)「からたち」を東京方言で喋ると、「か」だけが低めの音で、後の3つの音は、だいたい同じ高さになります。「はな」では「は」よりも「な」のほうが高くなります。「からたちの花」では、全曲を通して、東京方言の持つ言葉のメロディーが重んじられています。「白い白い花が」の行では、その枠組みの中で「花」の「な」に特別高い音を当てはめることによって、強調がなされています。言葉の本来持っている抑揚に乗せて、音楽が羽ばたく瞬間です。

英語のミュージカルでは、台詞にだんだんと強い抑揚がつき、いつのまにか歌が始まっていると言うような場面があります。このような例を見ていただければ、言葉に乗せて音楽が羽ばたくと言うことの意味がお解りいただけると思います。盛り上がるところでいきなり英語に早変わりする、日本語のロックやポップスでは、英語の部分は意味を伝えると言うよりも、花火のように華やかな音響効果として使われていることが多いようです。そのままでは、言葉の抑揚やリズムがうまくつながらないので、日本語の部分も少し英語風に発音したりすることになります。これを、だらしないと見るか、おしゃれと見るか、趣味の違い、考えかたの違いもあると思いますが、本場の英語のポップスやロックとは全く異なったものであることは強調しておきたいと思います。(本場の英語のロックは確かにカッコよく響きますが、カッコいい部分だけを切り取ってきても、何となく外国っぽく響くだけで、ある程度英語のできる人には、まねごとのように聴こえる可能性が高いのではないでしょうか。)

それでは、日本語歌曲は「からたちの花」路線で決まりかと言うと、そう単純にはゆきません。モーラを単位とするリズム、単語ごとに決っている音の高低関係などは、作曲家に大変強い制約を課することになるからです。日本語そのもののリズム、メロディーを最大限に生かすということになると、それに付けることのできる音楽の種類が限られてしまい、英語のロックのようなおしゃれで強烈なリズムや、ラテン語の宗教音楽のような澄み切って、しかも深みのあるメロディーは、決して実現しないことになってしまいます。英語がうまく聴き取れないけれどもポリス(イギリスのロック・グループ)の切れのよい発音にしびれた人、キリスト教徒でもないのに、モーツァルト(外国語の達人)の「アヴェ・ヴェルム・コルプス」をラテン語で歌い幸せな気分に浸った人は、多いと思います。このような曲に、試しに日本語の訳詞を付けてみるのも、日本語の可能性を広げると言う点では、意味のあることかもしれません。ただし、この場合には、歌手に適切な歌いかたを工夫してもらうことが絶対に必要ではないかと思います。次回は訳詞の話をいたします。

32 日本語の歌

 前回には、訳詞の話を始めましたので、今回は、訳詞の難しさについて皆様と一緒に考えてみます。音楽心理学からは少し脱線いたしますが、大きな目で見れば、避けて通れない問題です。果たして音楽は「世界共通語」でありうるかと言う問題にもつながるでしょう。「屋根の上のバイオリン弾き」(Jerry Bock 作曲)から「サンライズ・サンセット Sunrise, Sunset」を取り上げます。楽譜は載せませんが、この曲を聴いたことのない方にも、この後のお話は充分に通ずると思います。

 手元の楽譜を参考に、この曲の途中までの原詞(Sheldon Harnick 作)と、訳詞(若谷和子・滝弘太郎訳)とを書いておきます。(行分け、漢字の用法などは、私の判断によりますので、間違いがあるかもしれません。)


     Sunrise, Sunset                       サンライズ・サンセット



Is this the little girl I carried ?               いつもおんぶしてた 

Is this the little boy at play ?                かわいい小さな子

I don't remember growing older,             いつか大きくなった

When did they ?                                二人



When did she get to be a beauty ?         こんなにきれいになって

When did he grow to be so tall ?            りっぱになったのか

Wasn't it yesterday when they were small  きのうまでは小さな子が



Sunrise, sunset,                                日は昇り

Sunrise, sunset,                                また沈み

Swiftly flow the days.                         時移る

Seedlings turn overnight to sunflowers,  やがて朝が来れば

Blossoming even as we gaze.               花もすぐ開く



−−−



筆者註)swiftly: すばやく; seedling: 苗(若い植物); overnight: 一夜のうちに; blossom: 花開く

 英語、日本語の両方の一行一行を、できれば声を出して読んでみてください。訳詞は、原詞の意味をよく保ち、日本語としても自然に歌えるようになっているように思います(登場人物であるユダヤ人に、訳詞1行目の「おんぶ」の習慣があるかどうかは知りませんが。)。しかし、英語と日本語との間には、どうしても埋めがたい溝が残ります。英語では、母音の前後に、子音がいくつもくっつくことができる上に、母音の種類が多いので、音符の一つ一つに変化があり、メロディーを面白くすることができます。また、音符の数が変わらなくても、日本語の場合よりも多くの意味を伝えることができます。

 英語版では、「Sunrise, sunset,/ Sunrise, susnset」と言う繰り返しによって、飽くことなく紡ぎ出され、過ぎ去ってゆく「時」が、言葉と音楽との両方で巧みに表現されています。ところが、日本語版では、「日は昇り/また沈み」と、発音が単純になるうえに、言葉の繰り返しがなくなってしまいます。時の流れが、「また」の一言に集約されているために、歌手はこの言葉をいかに表現するか、大きな課題を負わされるのではないでしょうか。「日は」と「また」とを、同じように歌うと、義務的に音符を消化しているような感じになりますが、一方、「また」を強調しすぎると、お涙頂戴の感じになりそうです。私は残念ながら美声の持ち主ではありませんので実演できませんが、もしこの曲を歌えるのであれば、「また」を語りかけるように少し弱めに歌うだろうと思います。皆様は、どんな歌いかたをされるでしょうか。

 英語版の、まん中付近の「beauty」、「tall」は、この歌詞を朗読するときにも、おそらく、強いアクセントをつけ、長く伸ばして発音する、意味の上で重要な言葉です。メロディーに割り当てられた長い音符は、それを強調しているに過ぎません。ところが、日本語版ではここに、「なって」、「か」と言う、それ自体では意味を持たない言葉がきてしまいます。短歌を読み上げるときには、「たごのぉうらゆぅーうちいでてぇみればぁー(田児の浦ゆうち出でて見れば)」と、余韻を引き伸ばすように読みます。日本語版の歌詞の「なって」、「か」が引き伸ばされるのは、この余韻のような感じで、意味の上で重要な言葉が強調されるのではありません。それをわきまえずに英語版のときと同じように歌うと、言葉が解りにくくなり、不自然になるでしょう。訳詞を成功させるには、翻訳者と歌手との緊密な協力が必要であることが解ります。(場合によっては、伴奏の手直し、強弱記号の付けかえなどの思い切った措置も許されるのではないかと私は思います。)

「続く」

音楽心理学のトップへもどる

音楽心理学への御招待1にもどる

トップページに戻る