耳と心 (聴覚心理学入門)

1999年6月

中島祥好

1 聴覚の役割

  人間は、呼吸をしたり、体温を調節したりすることができます。また、指先でものをつまんだり、二本足でしっかりと歩いたりすることができます。このような機能は、全体としては単純に見えるかもしれませんが、その仕組みを解明してゆくと、複雑で、巧妙であることにしばしば驚かされます。わたしたちの祖先は、厳しい環境の中で生きぬいてゆくために、長い進化の歴史を経て、複雑な機能を作りあげてきました。聴覚、視覚、嗅覚のような感覚も、進化の過程で作りあげられたものであり、生き物が環境にうまく適応するための情報を、確実に、効率よく取りいれるために役立っています。

  聴覚は、進化の歴史の中ではかなり新しい感覚であり、進化のもたらした精巧な仕掛けを駆使した働きです。聴覚器官は、魚の平衡器官から進化したと言われています。体の傾きや、体の運動の状態を把握する平衡器官は、水圧の変化や、水の振動を捉えるように進化し、音を感ずることにも使われるようになりました。音を感ずる機能、すなわち聴覚は、魚類が両生類に進化した時点で、平衡感覚から完全に独立しました。この際、水中から空気中へと、環境が大きく変化したことに伴い、新しい仕組みが導入されました。まず、空気の振動を捉えるために、鼓膜および中耳と言う、新しい器官が生じました。中耳は、この後更に進化を遂げ、哺乳類の段階では三つの小さな骨からできていますが、これには、魚の時代には顎の骨であったものが転用されています。この顎の骨は、そのまま残っていれば、食べることに役立つでしょうから、決して不要品を再利用したのではありません。多少の犠牲を払ってでも、中耳の機能を充実することが急務だったのではないでしょうか。両生類はさらに、声を出すための声帯を獲得しました。ここで、鳥類やヒトなどの聴覚コミュニケーションの基礎ができあがったのです。鳥類は、オスとメス、あるいは親と子との関係を強めたり、縄張りを確保したりするために、鳴き声を用います。人間の聴覚コミュニケーションにも、本質的にこれと似た面がありますが、複数の人間が協力する手順を決めたり、経験したことを伝えあったり、お互いに敵意がないことを示したりと、様々な目的が加わり、はるかに複雑な内容が関わるようになってきています。特に、人間を特徴づけるものとして、話し言葉が重要であり、音楽も見逃すわけにはゆきません。

  この後の進化の歴史において、聴覚が飛躍的な発展を遂げた時期は二つあります。一つは、2億年くらい前に哺乳類が出現したときです。このころの哺乳類は、小さく、弱かっため、大型の爬虫類が活動しない夜に、昆虫や植物などの食べ物を取るような、夜行性の動物でした。初期の哺乳類は、必要に迫られて、鋭い嗅覚と聴覚とを獲得したのではないかと考えられます。闇の中でも、敵、餌、仲間などを見つけるために、嗅覚と聴覚とは大変重要です。聴覚に関しては、暗がりで敵や異変に出会ったときに、どの方向で何が起こっているのかを素早く感知する能力が、今日の人間にとっても生死を決することがありえます。闇の中に限らず、危険や変化を察知することは、聴覚の重要な役割であり、哺乳類が出現したときに、この機能が飛躍的に発展したようです。

  今日の人間の場合、周りの環境を把握するうえでは、視覚のほうが、聴覚よりも重要であることが多いかもしれません。しかし、危険や変化の察知に関しては、明るいときでも、目で見ることのできる範囲は限られていますから、視覚の及ばないところを、聴覚が補う必要があります。ガソリン車に代わる電気自動車が、公害を減らす観点から注目されていますが、試運転を見学した人の中には、電気自動車が後ろから近づいてくるのに気付かず驚いた、との感想を持つ人もいるようです。何となくうるさいと感ずることも多いガソリン・エンジンの音には、危険防止のうえで重要な役割のあったことに気付かされます。目に見える範囲に異変が生ずる場合でも、素早い対応を迫るような警告としては、ともかく何かが起こったことを即座に伝える聴覚信号のほうが、視覚信号よりも有効です。急速に普及しつつあるパソコンの世界でも、人間の犯したエラーに対して、さまざまな警告音を鳴らすような工夫がなされています。また、ハードディスクや、フロッピーディスクの動作音は、コンピューターを使いこなすための重要な手掛かりです。人間は、眠っているときにも突発的な危険を察知する必要がありますが、ここでも聴覚が主役です。目覚し時計は、このことを利用したものです。

  人類が言葉を獲得したときにも、聴覚の飛躍的な進化があったと考えられます。この過程は数百万年前に人類が出現した段階で、既に始まっていた可能性があり、150 万年くらい前に現れた原人(北京原人など)の段階では、彼らが集団で移動しながら狩猟、採集に基づく共同生活を行っていたことから、言葉による基本的なコミュニケーションが確立していたのではないかと考えられます。もっとも、言葉は石器のように残るわけではありませんから、このようなことは、間接的に推測できるだけです。ここで注目されるのが、現代人の長い咽です。人類は、咽に食べ物が詰まって窒息する危険を侵してまでも、長い咽を進化させてきました。このことから得た最大の利益は、声によって様々な音を出し分けて、言葉を効率的に伝えられるようになったことです。共同作業によって厳しい環境にたち向かったわたしたちの祖先にとって、食べ物を得たり、危険から身を守ったりするために、話し言葉によって素早く意思や合図を伝えることは、極めて重要であったに違いありません。ちなみに、チンパンジーや乳児は、長い咽を持たず、食べ物や母乳が、呼吸の通り道を塞ぎにくいようになっています。その代わりに、声を巧みに用いることができず、このことが、チンパンジーに人間の言葉を喋らせることができない理由であるとみなされています。原人も、咽の長さでは新人(クロマニョン人、現代人など)にかないません。原人が進化して新人になるときに、言葉をより巧みに操るということが重要な要素であったと言うことでしょう。

  ヒトの脳を見ると、言語活動に深く関わる大脳皮質の領域が、大脳の左半球に少くとも3箇所存在します。そのうちの一つで、主として言葉を理解することに関わると推定される領域は、聴覚を司る領域に隣接しています。わたしたちが、音の複雑なパターンを知覚する能力は、言語を用いる能力とともに進化したのではないかと推測することができます。

  聴覚は、言語によって意思や合図を伝達する最も重要な感覚ですから、人間の知性、社会性を支えるうえで、視覚、嗅覚、味覚、体性感覚(触覚など)のような他の感覚に比べて格段に重要です。また、人と人との心の交流の基礎であることから、人の感情にも大きく関わっていると考えられます。「アポロ13」と言う映画では、宇宙空間で爆発によって酸素や電気を失い、絶体絶命の危機に陥った宇宙船が、宇宙飛行士と地上管制官との懸命の努力により、無事地球に帰還すると言う実話が描かれています。この映画を見て思うのは、「声」によるコミュニケーションの重要性です。危機の発生に関する緊急連絡、操作のタイミングを合わせるための秒読み、準備体制の確認など、全てにおいて、声を交わしあうことによって、素早く正確に意思伝達を行い、また、連帯感を形成していることが解ります。厳しい環境に立ち向かうとき、氷河期であっても宇宙時代であっても、声の重要性には変わりがないようです。

  大脳皮質の図を眺めると、視覚、聴覚、体性感覚(触覚など)を司る領域にとり囲まれた、広い領域があります。この領域は、言語の理解に関わる領域をも含み、いくつかの異なった感覚にまたがるような、パターンの知覚、知覚内容の意味づけ、などに関連している可能性が高いようです。このような部分が広いのは、ヒトの脳の特徴です。わたしたちが、種類の異なった感覚を総動員して意思伝達を図り、時には芸術表現にまで高めることができるのは、このような脳の構造のおかげでしょう。

  わたしたちが日常生活の中で耳にする音は、ただ鼓膜を物理的に震わせるだけでなく、様々な「意味」を担っています。人と人との対話、音楽、合図、警告信号などにおいて、音は重要な役割を果たしています。また、環境における大きな変化を察知したり、環境の雰囲気を味わったりするうえでも、音は重要です。しかし一方で、音は騒音という深刻な問題をひき起こします。わたしたちは、目を閉じることはできますが、耳を閉じることはできません。眠っているあいだも聴覚は活動しています。そして、聴覚が対人関係の基礎であることから、わたしたちは聴こえてくる音に感情を動かされやすく、このことが、騒音問題を深刻なものにしています。ある人にとっては音楽であるはずの音が、ある人にとっては耳を塞ぎたくなる騒音にもなりえます。最近は、携帯電話でところかまわず話をする人が多く、新たな騒音問題をひき起こしています。レストランなどで、隣のテーブルの人がお互いに話をしているのは気にならないのに、一人で携帯電話をかけている人の声が気になると言う、電話をかけている人の側からは理不尽にも見える現象が生じています。そのうちに、「喫煙席」の隣に「電話席」を設けるような措置が必要になるのかもしれません。

2 耳の働き

大太鼓を叩くと、太鼓の皮が振動しているのを見ることができます。音を出しているスピーカーのコーン紙に指先を軽く触れると、コーン紙の振動が感ぜられます。このように、音の出る元には、必ず何らかの振動があります。この振動が空気に伝わり、縦波となったものが、音です。初めから空気そのものが振動することもあります。大量の空気がまとまって一方向に流れるのは、「風」であって、音ではありません。風の音が聴こえるのは、空気の流れを妨げる電線や木の枝などがあって、そこで空気の振動が生じているからです。

空気に振動が伝わって音になると、部分的に空気が濃くなったり、薄くなったりします。つまり、気圧の高い部分と、低い部分とができます。この違いは、最大でも数パスカルないし数十パスカル程度であり、ヘクトパスカル(100 パスカル)を最小単位として表される天気予報における気圧の変化に比べれば、ごく僅かなものです。ある部分の空気が濃くなると、その濃い空気に圧されて、隣の空気が濃くなり、それに圧されてそのまた隣の空気が濃くなる、と言うように、濃さの変化が次々に空気の中を伝わります。空気は、ばねのように質量と弾性とを持っているために、このようなかたちで濃い薄いの変化が伝わってゆくのです。伝わる速度は、気温が摂氏 15 度のとき約 340 m/s で、気温が1度上がるごとに約 0.6 m/s だけ速くなることが知られています。音の通り道を遮るように膜や板を置くと、音は膜や板を振動させます。耳の中にある鼓膜も音によって振動させられ、その振動が音の知覚を生ずる第一段階となります。

  わたしたちが耳にする音の多くは、ただ一つの純音成分だけからなっているのではなく、いくつかの周波数成分に分かれています。そこで、音の物理的な性質を表すときに、スペクトルがよく用いられますが、これは、聴覚心理学の見地からも理にかなったことです。わたしたちは、いくつかの純音成分から合成された音を聴くとき、ある程度まで、一つ一つの成分を聴き分けることができます。鼓膜に伝わった空気の振動は、耳小骨と呼ばれる三つの小さな骨を伝わって、蝸牛と呼ばれる器官の中のリンパ液を振動させます。蝸牛は、その名前のとおり、かたつむりの殻のようなぐるぐる巻きの管になっていますが、その働きについて考えるときには、ぐるぐる巻きの管を、まっすぐに伸ばしたものとみなすことができます。この管は3 cm くらいの長さをもち、二階だてバスのように、上下の階に分かれています。各階はリンパ液で満たされており、上下の階は先端の小さな穴でつながっています。上下の階を隔てる床は「基底膜」と呼ばれます(解剖学においては、この床の一部が基底膜と名付けられていますが、耳の働きについて考えるときには、床全体を基底膜と呼ぶ習慣があります。)。この基底膜がリンパ液の振動によって変形し、基底膜の上に並んだ毛の生えた細胞(有毛細胞)が、この変形を感知することによって、音の感覚が生じます。管の入口の付近では、数千ヘルツ、あるいは一万ヘルツ以上といった、高い周波数の純音成分が感知され、管の先端の付近では、二・三百ヘルツ、あるいは数十ヘルツといった低い周波数の純音成分が感知されます。基底膜の精密な動作によって、蝸牛は一種の周波数分析を行っているわけです。このような耳の仕組みは、周波数の異なるいくつかの純音成分が同時に鳴っているときに、それを周波数ごとに分けて聴くことを助けています。

聴覚心理学の世界では、3 cm くらいの長さを持つ基底膜が、1 mm くらいの小さな単位に分かれていると考えれば、さまざまな現象をうまく説明できることが知られています。実際に、基底膜に境目が付いているわけではありませんし、想定される境目の位置が固定しているわけでもありませんが、このような考えかたが便利であることが多いので、この1 mm くらいの単位に相当する周波数の範囲を、聴覚システムの周波数分析の単位(フィルター)であると考え、「臨界帯域」と呼びます。

  この周波数分析はかなり粗いものです。各成分の音の高さや、成分どうしの音程関係が、ある程度正確に知覚されるのは、これとは別の仕組みが同時に働くからであると考えられることが多いようです。蝸牛の一つの部分に、振動が到達すると、振動の周期に合わせるように、蝸牛から脳に向かう神経、すなわち聴神経の信号が送りだされます。神経の構成単位である一つ一つのニューロンが発する信号は、インパルスと呼ばれ、ニューロンの外側に対する内側の電位が負から正に転ずる、千分の一秒程度の電気現象です。インパルスの持続時間と大きさとは、ほぼ一定であり、強い音を聴いたために電位がはねあがると言うようなことはありません。神経が情報を伝えるうえで重要なのは、どのニューロンが、どのくらいの頻度でインパルスを出しているかと言うこと、そして、インパルスがどのような時間パターンを持っているかと言うことなのです。周期的な振動が蝸牛に到達すると、その周期内のある一点(ある位相)の付近で、インパルスが発生しやすくなるので、鼓膜に到達した音の持つ周期性の情報が脳にまで伝わります。この情報は、音の高さを知覚するうえで重要な手がかりになるとされています。

わたしたちは、同じ楽器の音であっても、周波数が高い音は「高い」と感じ、周波数が低い音は「低い」と感じます。このような「音の高さ」の違いがどのように知覚されるのかは、前世紀以来、聴覚心理学の大問題でした。周波数によって、基底膜上の振動する場所が異なるからであるとする「場所説」と、振動の時間的なくり返しパターンを形作る時間間隔が手掛かりになっているとする「時間説」とのあいだに、大論争がくり広げられてきました。なかなか決着がつかないので、今日では、どちらの考えかたも必要であるとの認識が定着しつつあります。

3 知覚の原理

  耳から大脳に送られた情報は、そのままでは役立ちません。同時に鳴っているたくさんの音を、すっかり混ぜこぜにして聴くのではなく、一つ一つの音を区別して聴くのでなければ、騒がしい環境で人の話を理解したり、オーケストラの伴奏に囲まれたヴァイオリンのメロディーを聴き取ったりすることはできません。この様子をたとえ話で表現すると、静かな入江の中で、船、亀、鮫などが動いている様子を、入江の奥にある二本の水路に浮かぶハンカチの動きから推定するようなものです。二本の水路とは、もちろん耳のことです。ハンカチとは鼓膜のことです(Bregman, 1990)。

  聴覚システムの最も大事な役割は、言葉を聞きとり、話すための、基礎データを提供することです。つまり、言葉として発せられている音を、言葉として受けいれることです。言語音声の性質を調べるために、言語音声を時間軸と周波数軸とからなる平面における濃淡として表すことがよくあります。この濃淡は音エネルギーの密度を表すものです。このような図のことを、「スペクトログラム」、あるいは「ソナグラム」と呼びます。スペクトログラムを見なれた人は、喋っている言葉の内容まで読みとることができますが、これは決して簡単な作業ではありません。音声に雑音がかぶさると、スペクトログラムから元の言葉を読みとることが難しくなることがあります。このような場合について、コンピューター・プログラムによって、言葉と雑音とを分離する試みが、数多くなされていますが、現実の音声についてはなかなかうまくゆかないのが実情のようです。ところが、人間の聴覚システムは、相当な雑音がかぶさってもこのような作業を何とかこなしてくれるので、うるさい地下鉄の中や、市場の雑踏の中でも、何とか話をすることができます。

  スペクトログラムを眺める場合に比べて、実際に音を聴く場合に、決定的に不利な点が一つあります。それは、実際の音が、鳴らされた次の瞬間には消えてしまうので、音と音とのあいだを前後に行ったり来たりしながら、細部を確かめることができないことです。これは、視覚や、触覚に比べて、聴覚の不利な点です。また、音の研究の泣きどころであり、つい最近まで聴覚心理学の研究が視覚心理学の研究に比べてたち遅れていた主な原因でもあると思います。音をとり扱うことは厄介であり、聴覚システムに課せられた負担も重いと考えられますが、音の信号は、複雑な内容を、素早く四方八方に伝えることができますから、わたしたちは、言葉や音楽をコミュニケーションの大事な手段にしてきました。

  心に留めておかなくてはならないのは、聴覚に限らずわたしたちの知覚システムに入ってくる情報は、未整理であり、不完全であると言うことです。この情報に対して、知覚システムは、何らかの秩序を与え、足りない部分を補わなければなりません。その際に、二種類の原理が働きます。それは、「適応の原理」と「単純化の原理」です。この二つの原理は、共に働くことが多く、時には補いあっています。

  重なりあった二枚の木の葉から、視覚に与えられる情報は、二枚の完全な木の葉があると結論づけるには、論理的に不充分なものです。重なりあって見えない「ように見えている」部分には、実は、何もないのかもしれません。あるいは、ちぎれた木の葉をつぎはぎした部分が隠れているのかもしれません。しかし、わたしたちは多くの場合、完全な木の葉を知覚します。知覚システムは、不確定な情報に対して、環境に対するよりよい適応となる確率が高いような推測を与えるわけです。これが「適応の原理」です。適応の原理には学習が関わっている場合も多く、コンピューターなどの文字が粗悪な画面でつぶれていても、書いてある文章を読むことができるのはその例です。一方、適応の原理が外れる確率もゼロではありません。例えば、子供は、母国語を充分に学習していないために適応の原理を使い間違えることが多く、「トンネル」という言葉を「飛んでる」と聴き取ったりします。

  さて今度は、星型(☆)の一部が木の葉に隠れている場合について考えてみましょう。この場合、不確定な部分があるにもかかわらず、わたしたちは星型を知覚することが多いようです。漫画のような星型が実際の環境に現れることは少なく、このような知覚が環境に対するよい適応となっているかどうかは疑問です。わたしたちは、よりよい適応であるかどうかにかかわらず、より単純で、整った形を知覚する傾向があるようです。限られた能力しか持たない知覚システムは、限られた時間内に、次々に新しい情報を処理してゆかなければならないので、曖昧さが生じたところに、とりあえず単純なパターンを当てはめることは、実際的な方略です。これが「単純化の原理」です。

  「単純化の原理」は、環境への適応としては割り切りすぎたような知覚内容を導くことが多いので、「適応の原理」とは別の原理であると考えることにいたします。しかし、わたしたちが環境にうまく適応するためには、「少し間違いを犯しても素早く結論を出す」システムを持つことが重要であり、「単純化の原理」も、大局的に見れば適応に役立っていると考えられます。「単純化の原理」は、知覚システムの限界を端的に示しているので、知覚システムの仕組みについて研究するうえで面白い手掛かりを与えてくれます。

4 物理量と主観量

  聴覚システムは、物理測定器のように精密な動作を行うことはできませんが、独自のやりかたで、すばやく音を把握し、必要があれば意味付けを行います。「独自のやりかた」は、環境に対する精一杯の適応であり、聴覚システムの限界を示すものでもあります。この辺りの事情を詳しく調べるために、音の物理的な性質と、それに対応する主観的な性質とを、定量的に関係づけることが有益です。ここで言う「主観的な性質」とは、決して「つかみどころのない、曖昧な性質」のことではなく、知覚実験によって求めることのできる質や量のことです。

  典型的な例として、物理量である「音の強さ」と、主観量である「音の大きさ」との対応関係を取りあげてみます。音の強さは、音エネルギーに比例する物理量であり、1人が歌うのに比べて、同じような声の人が10 人で歌うと、音の強さは約10 倍になります。それでは、音の強さが10 倍になると、主観量である音の大きさも10 倍になるかと言うと、そうではありません。実験室の単純化された状況では、音の強さが10 倍になっても、音の大きさは2倍程度にしか聴こえないことが珍しくありません。耳に感ぜられる音の大きさは、音の強さに比例しないのです。1000 ヘルツの純音に関しては、ごく弱い音を除くと、主観量である音の大きさが、物理量である音の強さの0.3 乗に、ほぼ比例します(聴く人や聴く条件によって違いがあり、これはあくまでも平均的な結果です。)。このような、物理量と主観量とのくい違いは、わたしたちが環境に適応する上で一見不利であるかのように見えますが、この場合には有利な点があります。わたしたちがふだん耳にする大変弱い音と大変強い音とのあいだには、音の強さにして、軽く100万倍くらいの開きが生じますが、音の大きさとしては、数十倍から百倍程度の開きにしかなりません。もしも、これを100 万倍くらいの違いに感じなければならないとすると、言わば1グラムの重さと1トンの重さとを同じ秤で測るようなことになり、限界のある知覚システムは混乱してしまうでしょう。物理量が増しても、主観量がそれに比例して増すことがないおかげで、わたしたちは、広い範囲にまたがる音の強さの変化を、音の大きさと言う単一の物差しの上で感ずることができます。(音の強さをデシベルという尺度に乗せるのも、広い範囲の数値を手頃な範囲に収めるためですが、対数に基づくデシベルを用いることは便宜的な措置であり、心理学的な根拠があるわけではありません。)

  このような、物理量と主観量とのくい違いは、音の高さ、時間の長さなどの他の次元にも見られます。もともと、物理量と主観量とが比例しなければならない理由もないわけです。このようなくい違いは、わたしたちの知覚システムが、様々な制約条件の中で環境に適応するための情報を素早く取りいれる際に、どのような手段を取っているのかを知るための手がかりになります。

広い周波数範囲にわたって成分を持つような音の大きさが知覚される際には、先に述べた臨界帯域が重要な役割を果たしているようです。基底膜上の 1 mm くらいの単位に相当する一つひとつの臨界帯域は、それぞれ担当する周波数範囲を持っています。この周波数範囲ごとに音の大きさを計算し、その結果を全ての臨界帯域について足し合わせると、全体としての音の大きさを近似できることが判っています。

ただし、ある周波数成分が、それに近い周波数を持つ別の成分が存在することによって、音の大きさを減じたり、聴こえなくなったりすることがあります。これは、別の成分の周波数が近いほど、また強さが強いほど著しく生ずる現象で、「同時マスキング」と呼ばれます。飛行機や掃除機などの騒音がひどいときに、話し声が聴こえなくなったり、小さく聴こえたりするのは、同時マスキングの例です。上記のように臨界帯域ごとに音の大きさを計算する場合にも、ある臨界帯域における音の大きさは、付近の臨界帯域からの同時マスキングを受けて減ずることがあります。特に、周波数が低い側に隣接する臨界帯域から受ける同時マスキングの程度は大きくなることが多く、広い範囲の周波数成分からなる音の大きさを、計算によって推測する際に、問題となるところです。

主観量である「音の大きさ」は、「音の強さ」という物理量に強く結びつき、別の主観量である「音の高さ」は、「周波数」という物理量に強く結びついています。ところが、「音色」については話が複雑です。音のスペクトルの全体としての形や、時間的な強弱変化の様子は、いずれも音色に大きく影響します。そもそも音色は1次元の主観量ではありえず、我が国では3次元くらいの空間に音色を表すことがよくあります。さまざまな音の音色を形容語対の尺度を用いて評定することを被験者に求めるような実験において、「美的因子」、「迫力因子」、「金属性因子」の3つの因子が、音色の3つの次元として現れることは、よくあることです(このような結果を導くための実験の多くは、本学においてなされました)。それぞれの次元にどのような物理量が対応するのかは、明確でない場合もあります。また、楽器の音色について論ずる場合には、楽器ごとに特有の事情についても考慮する必要があり、一筋縄では行きません。しかし、コンピューター音楽や、電子楽器などに関連して、さまざまな音色の作りかたが発見されたことなどが刺激となって、音色の研究は急速に進んでいます。

音色について考えるときには、聴覚以外の感覚から得られた体験について考えることが重要です。「音の鋭さ」は音色の一つの側面ですが、高い周波数成分を含み、強い音は、鋭いと感ぜられます。このことは、鋭い刃物などを落としたときに、高い周波数成分を含んだ強い音がすることなどと関連づけられる可能性があります。また、鳴り始めからゆっくりと時間をかけて強くなる音は、柔らかく感ぜられたり、鈍く感ぜられたりします。これは、柔らかい物を触ったときに、圧される感じがゆっくりと強まってゆくことに関連づけられそうです。このようなことを実証するのは、恐らく大変ですが、少なくとも、音色が日常生活の広い体験に根ざすものであるらしいと見当はつくでしょう。

5 聴覚における錯覚現象

  物理的な世界と主観的な世界とのくい違いを鮮やかに示すのが、いわゆる「錯覚現象」です。視覚の世界では多くの錯覚現象が知られています。「ポンゾの錯覚」の場合、物理的な長さが等しい二本の水平な線分が、上下に並んでいますが、下に行くほど幅の広がる(漢字の”八”のような)二本の線分に左右から挟みこまれることによって、明らかに異なった長さをもつように見えます。すなわち、上側の水平線分のほうが長く見えます。このようなくい違いの生ずることは、一見、環境への適応に関して不利であるように思われます。ここで、左右から挟みこむ線分が、幅が一定の川や廊下を遠近法的に表したものであり、二本の水平な線分が、川や廊下に横たわる細長い岩や棒きれなどを表すとしましょう。細長い岩や棒きれの両端を見込む角度が同じであれば、遠くにある岩や棒きれのほうが物理的に長いはずです。つまり、ポンゾの錯覚をひき起こしたのと同じ知覚の仕組みが、現実の環境においては、適応に役立つ可能性があります。ただし、いつもこのように有利な知覚が生ずるわけではありませんから、「役立つ場合もある」と言うくらいに考えるほうがよいかもしれません。このような錯覚現象を調べてゆくと、わたしたちの知覚システムは、間違いや誤差を、いかなる条件においても最小限に抑えるように合理的に設計されたものではなく、ありあわせの不完全な機能をよせ集めたうえで、著しい不都合が生じないように少しずつ改良を加えたようなシステムではないかと推測されます。現実の環境においては、様々な機能の果たす役割が重なり、無駄な部分も生ずるはずですが、一見無駄な部分が、いざと言うときの安全対策になることもあるでしょうし、更なる進化の土台となる可能性もあるでしょう。錯覚現象について詳しく調べることによって、知覚システムがどのように設計されているかについて、多くのヒントが得られます。

  少し話がずれますが、鼓膜と蝸牛とをつなぐ耳小骨は、進化の過程を理解する上で面白い例です。脊椎動物が両生類となり陸上での生活を始めた頃、空気を伝わる音をうまく聴き取ることが、環境を適切に認知し、お互いのコミュニケーションを行うために、絶対に必要であったことは先に述べました。ところが、生物は工業製品ではありませんから、新しいモデルに、新しく開発した音センサーを取り付けるというわけにはゆきません。ありあわせの材料を最大限に活用するしか手はないのです。空気の振動を、蝸牛の中に詰まったリンパ液に伝えるために、鼓膜と耳小骨の一部(後にアブミ骨となる耳小柱)ができたわけですが、この際、魚類の時代には顎をつなぎとめていた骨(舌顎軟骨)が転用されています。音を聴くと言う目的のために、食物を得るために大切な顎の機能を犠牲にしかねないような変形を加えているわけです。このような進化はその後も続き、結局哺乳類の段階では、別の顎関節が形成されることになりました(倉谷, 1996)。音を効率的に聴き取ることが、陸上の脊椎動物にとって、いかに急を要する課題であったかが推測できます。

  話を元に戻しますが、聴覚に関して、錯覚現象はあまり多く見つかっていません。ここでは、二つの錯覚現象を紹介いたします。最初に取りあげる「音韻修復」と言うのは、音声信号から時間的に短い(例えば0.1 秒の)部分をとり除いて空白を作り、その空白に強い雑音など埋めこむと、途切れたはずの音声信号が、つながって聴こえると言う現象です(Warren, 1982)。このように、前後関係に導かれて、強い音のある部分に、もう一つの音が聴こえるようになる現象は「聴覚誘導」と呼ばれています。音声信号のかわりに純音や音楽を使っても、似たような現象が生じます(ただし、現象が似ていても、生ずる仕組みまで同じかどうかは分かりません。)。誰かがあまり強くない声で喋っているのを聴いているときに、自分の近くにいる人が強く咳ばらいをすると、喋っている声は、一瞬かき消されるのと同じことになります。蝸牛から聴神経に至る末梢の段階で、声に対応する信号が、咳払いに対応する信号に覆い隠されてしまうからです。それでも、音韻修復の仕組みがあるおかげで、喋っている声はつながって聴こえます。そうでなければ、話の途中に咳ばらいが入っただけで、文字通り話がつながらなくなってしまうでしょう。

  強い音が鳴っているときに、他の音が聴こえなくなったり、聴こえにくくなったりする現象は、先に触れた「同時マスキング」です。新しいオーディオ・システムとして注目されているミニ・ディスク(MD)や、そのライバルであるデジタル・コンパクト・カセット(DCC)は、同時マスキングによって聴こえなくなるスペクトル成分を、オーディオの信号から省いてしまうと言う考えかたによって、記録する情報の量を節約しています。強い音が鳴ると、時間的にその前後に鳴らされる音が聴こえにくくなると言う「継時マスキング」と呼ばれる現象も知られています。ごった返す空港でアナウンスを聴き取ったり、うるさい地下鉄の中で喋ったりできるのは、錯覚ではありませんが、驚異的なことです。

  ここで紹介するもう一つの錯覚現象は、私が共同研究者とともに発見したもので、時間の長さの知覚に関係があります(Nakajima, ten Hoopen and van der Wilk, 1991)。三つのごく短い音を次々に鳴らすと、音の始まりと始まりとに挟まれる二つの時間間隔を示すことができます。この二つの時間間隔の物理的な長さを、0.06 秒と0.12 秒とに設定すると、後の時間間隔が「過小評価」され、0.07〜0.08 秒くらいの時間間隔と同じくらいに感ぜられます。この錯覚現象が生ずることによって、隣接する二つの時間間隔は、お互いによく似た長さに感ぜられます。この現象は、時間のパターンを、単純で把握しやすいパターンとして取りこむことによって、知覚、記憶のシステムへの負荷を減らしている可能性があります。

  聴覚に関する錯覚現象の探求は、まだあまり進んでいません。ところが、工業技術の上では、普通のパソコンが一台あれば、色々な音を作ることが可能な時代になりました。根気さえあれば、専門の研究者でなくても新しい錯覚現象を発見できる可能性があります。最近、アマチュア天文学者の活躍が話題になっていますが、彗星のかわりに錯覚現象を見つけても、自分の名前を何百年も残すことができます。

6 音事象と音脈

 わたしたちの聴覚システムは、耳に入ってきた音の情報を、相当手の込んだやりかたで処理しています。そして、わたしたちの体験する音は、割合にはっきりといくつかの単位、まとまりに分かれて、秩序づけられていることが多いようです。その単位、まとまりがどのようなものであるのかが、最近の聴覚心理学の世界では大きな話題になっており、私もこのような研究に携わっています。柱時計の時報や、猫の鳴き声などのように1回、2回と数えられるような音の、一回分を「音事象」と呼びます。また、ある一匹の動物や、一つの機械から発せられているような、あるいはそのように聴こえる、一つながりの音を「音脈」と呼びます。わたしたちの日常の体験に照らして、「音事象」、「音脈」のような単位を考えることは、妥当であるように思われますが、この点について知覚実験による実証的な分析を行うことに、現場の研究者は苦労しています。

聴覚によって捉えられるパターンについて考えるとき、時間と周波数との2つの次元が重要です。聴覚や音声の研究にスペクトログラムが用いられるのは、この理由によります。時間の次元は、わたしたちの全ての経験を結びつけ、一人の人間として生きることを可能にする大切なものですが、時間の経過や、時間上のパターンであるリズムを、最も鮮明に捉える感覚は聴覚です。時間の経過を強く感ずるのは、時計の振り子や針が動くのを見るときよりも、コツコツと刻む時計の音を聴くときではないでしょうか。時計の本来の機能としては、コツコツという音は要らないはずですが、わたしたちの時間経験には、この音が欠かせないようです。周波数の次元は物理的なものであり、知覚経験に直接対応づけられるものではありません。わたしたちは、ある周波数の付近で鳴り続ける音に対して「音の高さ」を感じたり、いくつかの周波数の近辺に音エネルギーが集中している場合に「母音」を聴き取ったりするだけです。例えば、250 Hz と 2500 Hz とのあたりに音エネルギー分布の山がある音声を聴くと、母音の「い」を聴き取ることができます。このような「周波数」のことについては、教えてもらわなければ、一生知らずに過ごすこともありそうですが、聴覚の仕組みについて考えるときには重要な事柄です。左右、上下、前後の空間の次元も聴覚にとって重要ではありますが、本質的な意味において重要であるかどうかには、疑問が湧くかもしれません。スピーカーが一つしかないラジオでも、充分に音楽やドラマを楽しむことができるからです。しかし、音楽もドラマもステレオで聴くほうがずっと臨場感があることも事実です。最近の映画では、映像で示すことのできない方向で生じた出来事を、その方向から聴こえる音で示すことが行われており、音の果たす役割は、昔の映画とは比較にならないくらいに大きくなっています。この場合、音がどちらから聴こえるかは、本質的に重要です。実際の生活においても、危険や変化の察知に関しては、音の到来方向がすぐに判らなければ生命に関わることさえあります。聴覚が視覚などと協力して、環境を全体として把握するには、音の聴こえる場所を特定することが重要です。

  知覚のうえで音がはっきりとしたまとまりになり、さらに、まとまりとまとまりとの関係づけがなされることを、「聴覚の体制化」と呼びます。体制化に際しては、近いものどうしがまとまりを形成すると言う「近接の原理」や、同時に同じような変化、動きを示すものどうしがまとまりを形成すると言う「共通運命の原理」などが働きます。これらはいずれも、先に述べた「単純化の原理」の例です。「単純化の原理」のうち、聴覚に特有の原理として、倍音構造に並んだ周波数成分が、ひとまとまりに知覚されやすいと言う「調波性の原理」があります。また、聴覚において特に重要な原理として、時間的に規則正しく発生する事象が、ひとつながりにまとまって知覚されやすいと言う「時間的規則性の原理」があります。

7 神経系、脳の働き

  聴覚の研究は、究極的には人間の脳の研究に行きつく部分が多いでしょう。ただし、脳をとり扱っているからより科学的であると言うような誤解をしないでください。脳はあまりにも複雑な対象です。生理学的な手段を取らず、大まかに脳の働きの結果だけを捉える心理学的な手法の重要性が減ずることは、今後ともありえません。このことは、コンピューターの働きかたを知りたいときに、集積回路および組みこまれたソフトウェアの構造や機能を知るだけでなく、「ともかく動かしてみる」ことが有効であることと似ています。しかし、このようなことをわきまえたうえで、脳の働きについて調べることは、大変有益であり、何よりも、わたしたちの科学的好奇心をそそることです。

  耳の奥の蝸牛からは、聴神経を経て、音に関する情報が大脳にまで伝わります。この際の神経経路は、かなり複雑です。視覚においては、網膜から視神経に送られた情報が、その基本的な構造を保ったまま大脳皮質の視覚領に到達していると考えられています。ところが、聴覚においては、蝸牛から大脳皮質の聴覚領に到るあいだに、沢山の中継点があり、そこで情報が加工されるようです。特に、大脳からのフィードバックによって、情報の取捨選択が行われる点が重要です。大脳から末梢の蝸牛までのフィードバックも生じているのではないかと考えられていますが、その具体的な仕組みは殆ど解明されていません。

  大脳の聴覚領のいくつかの部分では、ニューロンが応答させられやすい周波数の順番に、低い方から高い方へと並んでいます。蝸牛において周波数分析がなされることを既に述べましたが、聴覚においては、末梢に近いレベルで見ても、大脳のレベルで見ても、周波数が重要な次元であることが解ります。その重要性は、視覚における上下や左右などの空間の次元に匹敵します。

  蝸牛から大脳に到るまでのニューロンの、音に対する応答を調べると、音の始まりから終わりまでの全ての部分に対して応答しつづけるようなニューロンもありますが、一方では、音の始まりにのみ応答するようなニューロンもあります。大脳のレベルでは、音の始まりと、音の終わりとにのみ応答し、音の鳴っている途中の部分には応答しないと言うニューロンもあります。このような、神経系の働きが、全体としてどのように関連づけられるのかは、あまりよく解っていません。音の始まりに応答するようなニューロンが、先に述べた音事象や音脈の知覚に関わっていることは疑いようもなく、この問題に関して、心理学と生理学との境界領域が注目されます。(私の属する研究グループでは、「音の始まり」と「音の終わり」とが独立に検出され、「近接の原理」によって結びつく場合があると考えています。)

8 おわりに

  以上、わたしたちがふだん音をどのように聴いているのかについて、基本的な事項を述べました。これでは、どのような音を聴くと楽しくなって、どのような音を聴くと悲しくなるのかが解らない、あるいは、音楽をどのように演奏するのか、音声をどのように合成するのかを考えるのに役立たない、などの感想が出てくるかもしれません。また、このような回りくどいやりかたで、いつかは聴覚システムの全貌が明らかにされるのであろうかと、疑問が生ずるかもしれません。しかし、新しく勉強を始める皆様に強く申しあげたいのは、まず基礎的なことをしっかりと学んだうえで、より複雑なことにとり組んでほしい、と言うことです。この場合、学ぶと言っても、ただ教科書を読んだり講義を聴いたりするだけを意味するのではありません。実際に音を聴く、できれば音をコンピューターやシンセサイザーなどで作る、と言うような作業をしてください。そうすれば、実際的な問題に関係がないように見える事柄が、実は日常生活にも深く関わることが実感できるはずです。

知覚心理学の世界においては、視覚の重要性が強調されるあまり、聴覚は殆ど無視されることがよくあります。しかし、聴覚が視覚と同じくらいに重要であることは、既にお解りいただけたのではないかと思います。それでは、なぜ聴覚の重要性が認識されにくいのでしょうか。私は、音が出た途端に消えてしまうこと、ちょっとした音を出すにも大がかりな道具が要ることが、主な原因ではないかと考えています。そこで、皆様には、「音がどのように聴こえたかを覚える訓練をすること」、「コンピューター、数式など、音を出すための道具を使いこなす訓練をすること」を求めたいと思います。

  残念なことに、聴覚心理学に関しては、学問的に充分確認されていないような事柄が、マスコミを賑わせたり、出版物になったりすることがよくあります。しかも、このような怪しい情報が、有名大学や一流放送局の権威によって、急速に世間に広まることも珍しくありません。このようにして広まった話は、キャッチフレーズが明快で、魅力的であることが多いようです。ところが、専門の研究者は、怪しいことを信じこんでいる相手に、まともにつきあうだけの時間も興味もなく、たまにつきあっても、自分が確実に知っていることだけを言おうとするために、どうしても歯切れが悪くなります。こうして、いつのまにか怪しい知識が市民権を得てしまうのです。怪しいかどうかを確かめるには、まず自分で原論文を探して読むことです。科学の世界において、何が信用でき、何が信用できないのかを見分けることは、各個人の責任です。大学では、ぜひ本物と偽物とを見分ける目を養い、最新の情報を適切に取捨選択することができるようになってください。さらに、疑問が解けない場合には、自分の手足と耳と目とを使って確かめることを厭わないようになっていただきたいと思います。必ず答が出てくる保証のある受験勉強やクイズの場合と違い、解らない部分をいつも心のどこかにしまっておくことが大事です。

聴覚心理学基本用語集へ

聴覚心理学関連事項へ

 

最前頁へ戻る