聴覚におけるゲシタルト原理



1 歴史的概観

 人間の知覚は、聴覚、視覚、味覚などの様々な感覚様相に基づいており、これらの感覚様相の、相互の関連を知ることが大変重要である。ところが、知覚心理学の研究は、視覚を中心として進められてきた。聴覚の研究は、心理学の本流から少し外れ、むしろ工学の分野と強く結びついて、独自の発展を遂げた。このような聴覚研究は、精密である反面、人間の知覚の本質を理解しようとする態度に乏しいこともあった。ところが、最近になって、Handel(1989)、Bregman (1991)が、聴覚に関する大部の著書(合計 1370頁)を相次いで出版し、心理学の側から聴覚研究の方向づけを行っている。これを機会に、心理学と工学との緊密な協力関係が進展することを期待したい。

 ここでは、そのための基礎作業として、聴覚研究においてゲシタルト心理学がどのような役割を果たしうるかを考察したい。ゲシタルト心理学は、歴史上の遺物とみなされることも多いが、現在の知覚心理学に欠かせない数々の概念を提供し、生態学的心理学や、認知心理学にも影響を及ぼしあうと言う点で、基本的な重要性を失っていない。視覚の研究においては、どのような立場で研究を進めるにせよ、ゲシタルト心理学に対して一定の知識と見解とを持つことが求められる。ところが、聴覚の研究においては必ずしもそうではない。Koffka(1935)がゲシタルト心理学の体系的な記述を試みた直後に、聴覚研究の体系化を試みたStevens & Davis (1938)は、感覚量の測定を中心とする精神物理学を重視し、ゲシタルト心理学に全く触れていない。この研究姿勢は、その後の聴覚研究を方向づけ、聴覚研究は、定量化において実験心理学のお手本となりうるような発展を遂げた。その著しい例はZwicker (1982)に見られる。臨界帯域説を核とする精密な理論体系は、画期的なものであるが、聴覚の定量化しにくい側面が蔭に隠されてしまったことは否めない。最近になって、Handel(1989)が聴覚におけるゲシタルト原理について、体系的に解説したわけであるが、彼は、ゲシタルト原理の導入に関して、聴覚研究が視覚研究に60年から70年の後れをとったことを指摘している。言い換えれば、聴覚に関しては、今がゲシタルト心理学の草創期に当る(Deutsch,1982;Fraisse,1982)。このような時代背景において、聴覚研究の流れを一気に決定づけたのがBregman(1990, 1993) である。ゲシタルト心理学が着実に浸透してきた原因として、我々の生活において重要な役割を果たす音声や音楽などを扱う際に、Stevensや Zwickerの手法では、どうしても限界が感じられること、技術の進歩により、ゲシタルト心理学の観点から見ても面白い音を、簡単に作成できるようになったこと、が挙げられる。筆者は、心理学に携わる学徒の一人として、このような流れの変化が、聴覚という狭い範囲を越えて、知覚、認知に対する一般的な理解の前進に貢献することを望んでいる。

 ゲシタルト心理学の基本的な立場は、「全体は部分の総和ではない。」との言葉によって知られる。メロディーを聴いて長調か短調かが判ると言う、日常のありふれた体験を理解するためには、一つ一つの音がどのように知覚されるかを、いくら詳しく調べても無駄である。メロディー全体の構造を、我々の知覚系がどのように捉え、その中で一つ一つの音がどのような役割を果たすかを知ることが重要である。このような考えかたのもとに膨大な研究がなされ、その成果は心理学全体に及んでいる。メロディー知覚に関する考察が、ゲシタルト心理学の生まれる重要なきっかけとなったにもかかわらず(Kohler,1972)、その後のゲシタルト心理学において聴覚が置き去りにされたのは、皮肉である。

 本来のゲシタルト心理学は、基本的に、対象を要素に分解して記述することを避ける傾向があるので、我々の知覚に見られる一般的な特徴を大まかに記述して分類することには成果を挙げたが、知覚の仕組みを分析的に捉えることには不向きである。また、知覚内容そのものの全体としてのまとまりを、法則として捉えようとするために、我々の知覚が環境への適応にどのように役立っているかを充分に議論しない傾向がある。ところが、Bregmanや Handelは、聴覚研究にゲシタルト原理を導入するにあたり、我々の知覚を、限られた情報から、環境について確度の高い推測を得る過程として記述している。彼らの記述する知覚過程は、Helmholtzが提唱したとされる無意識的推論 unconscious inferenceに極めて近いものであり、古いゲシタルト心理学からは排斥されたものである。Bregmanはさらに、我々の知覚が、要素的な性質の結合として捉えられる場合のあることを認めている。例えば、Deutsch(1982)の記述するオクターブ錯覚に関しては、音の高さと、音の位置とが別々に把握され、この二つの性質が組み合わされることによって、音の知覚が生ずるとの説明をしている。このような考えかたは、Russell (1912) の感覚与件説 sense-data theory に極めて近いものであり、やはり古いゲシタルト心理学には馴染まないものである。Handel と Bregman は、神秘的な衣をまといがちであったゲシタルト心理学の諸概念を、常識的に理解しやすい立場から整理しており、節操がないようにも見えるが、人間の複雑な心理や行動を理解するために、常識を基本にしつつ、さまざまな物の見かたを融合することは、むしろ健全であると思われる。もっとも彼らは、部分の知覚が、常に全体の知覚を反映していると言う点に関して、膨大な実例を挙げており、ゲシタルト心理学の基本精神を受け継いでいる。

2 聴覚におけるゲシタルト原理

 ゲシタルト心理学的の基本的な考えかたの多くは、視覚研究に発している。聴覚と視覚とは、その役割や制約条件が大きく異なっているので(寺西,1984)、視覚の分野におけるゲシタルト原理を、そのまま聴覚に適用するわけにはゆかない。視覚においては、空間の3次元と時間とが、さまざまなパターンの容れ物を構成する次元となるが、聴覚においては、周波数あるいは音の高さが重要な次元になるとともに、時間の重要性が増す。一方、空間の3次元は、視覚の場合ほど重要ではない。聴覚におけるパターン知覚を研究する際に、時間、周波数の座標上で様々な刺激パターンが構成されるのはこのためである。この際、自然の環境において、ある時点における単一の原因によって生じた音に相当する「音事象 auditory event」と、同一の音源から発し続けられる音のつながりに相当する「音脈 auditory stream」とが、どのように知覚されるのかが基礎的な問題となる。どのような音事象、音脈が知覚されているのかを知らなければ、音の大きさ、音の高さ、音色などの音の基本性質について論ずることもできないはずである。

 音事象、音脈の知覚について考える際には、時間、周波数の座標上で、どの成分とどの成分とが知覚的にまとまるのかが問題となる。近接の原理に従い、この座標上で近くにある成分は知覚的に結びつきやすい。また、共通運命の原理に従い、同時に始まったり終ったりする成分や、同時に同じような変化、例えば周波数変調や振幅変調、を示す成分は結びつきやすい。さらに、定常的な音が、突然の雑音によって一時的にマスクされても、つながったものとしてひとまとまりに知覚されるのは、よい連続の原理に従う現象である。このほか、音のスペクトルや時間包絡が似ている音どうしが、類同の原理に従って一つの音脈にまとまる現象も、時間、周波数の座標上に、ソナグラムのようなパターンを見ることによって理解できることが多い。このように、既製のゲシタルト原理をそのまま適用できる場合は少なくない。

 音事象の知覚と音脈の知覚とは密接に関連しており、双方を理解して、初めて聴覚における知覚的体制化を全体として把握することができる。Bregman (1990; Figure 1.16) が取りあげた例を借用し、二つの純音成分B、Cからなる複合音と、Bに極めて近い周波数を持つ純音Aとが、交互に呈示される場合を考えてみる。多くの場合Bのほうが、Cよりも高い周波数を持ち、Aがそれよりも僅かに高い、ないしは同じ周波数を持つ例が取り上げられる。適切な条件においては、純音Aが複合音の成分Bと知覚的に結びつき、もう一つの成分Cが孤立して、純音と同じ音色を持つように聴こえる。この場合、「複合音の成分BとCとが分離して二つの音事象に聴こえること」と、「A、Bが一つの音脈を形成すること」とは、同じ事柄の二つの側面であると考えられる。なぜなら、このような条件で、これらの現象のどちらか一方のみが成立することは考えにくいからである。

 先に述べたように、聴覚においては、時間、および周波数ないし音の高さの次元が重要であり、このことから、聴覚特有のゲシタルト原理が現れる。周波数の次元は、視覚における空間の一次元と同様に考えてよいことが多く、例えば周波数軸上の近接の原理が、音脈分凝の重要な要因であることは Bregman によって詳しく論じられている。音階の錯覚は、空間的な近接の原理よりも、周波数の近接の原理の方が聴覚にとって重要であることを示す例である。

 一方、周波数の次元は、空間の次元と大きく異なる側面をも有している。周波数の次元においては、対称性が知覚されにくいことが多い。同時にいくつかの周波数成分が鳴らされているときに、我々が何らかの対称性を知覚することは、殆どないのではなかろうか。また、周波数の次元は知覚の上で未分化なところがある。定常的な複合音を聴くとき、周波数の次元において別々のものとして知覚しうる成分、あるいは成分群の数は、せいぜい数個に留まるのではないかと思われる。我々は、奇数次倍音と偶数次倍音との両方を含んだ音と、そのうちの奇数次倍音のみを取りだした音との音色を、簡単に聴き分けることができるが、後者の音において、成分数が約半分に減っていると直接知覚することはまずない。このことに関連して、音のイメージを周波数軸上で操作することは、多くの場合難しい。母音の知覚において、二つないし三つのフォルマントが重要であることはよく知られているが、日常の体験で、二つないし三つの特別な周波数範囲を知覚することはまずない。したがって、母音を聴かされたあと、もし第二フォルマントがなければどうなるか、明確なイメージを持つことは極めて難しい。視覚における空間的なイメージは、もっと明確であり、例えば、一口かじった煎餅を見て、かじる前の煎餅のイメージを持つことは容易である。

 周波数の次元が未分化であることは、聴覚が周波数方向に鈍感であると言うことを意味するのではない。このことは、音の高さの弁別実験の結果を見れば明らかである。また、話し言葉を聴く際に音韻の識別が素早く行われること、音楽を聴く際に和声進行まで知覚されることなどは、スペクトルの複雑な変化に対しても、聴覚系が素早く応答していることを証明している。継時的に示される二つの非調波複合音において、スペクトルの各成分が、対数周波数軸上で同じ方向に同じ程度だけ移行する関係があるとき、全体として音の高さが上昇したり、下降したりするのが知覚される(Nakajima et al., 1991)。これは、聴覚系が、一つ一つのスペクトル成分の動きを敏感に捉えていることを示唆する。非調波複合音のうち、日本語母音のフォルマントに相当する成分を、レベルを高くしたうえで、対数周波数軸上を一定の速度で上昇させ、それ以外の成分を同じ速度で下降させると、母音が聴こえ、音声には聴こえないもう一つの音が、それにかぶさって知覚される(当研究室、中村紀子の修士研究による。)。ここで全ての成分を上昇させると、全体が一つの母音として知覚される。この観察結果は、同じ動きを示す成分が知覚的に統合されることを示しており、共通運命の原理によって解釈することができる。音韻の知覚に際しても、一つ一つのスペクトル成分の上昇、下降の動きが検出されていることが窺われる。聴覚系は、スペクトル成分の調波性に対しても敏感である。調波性を持ったいくつかの成分が同時に呈示されると、一つの音に聴こえると言う現象は、日常頻繁に見られる。Bregmanは、この傾向を「調波性の原理 principle of harmonicity」として、知覚的統合の要因の一つに数えている。この原理は、同時に鳴らされる成分の統合の要因としては、多くの場合、周波数の近接の原理よりも強力である。この原理によって知覚的に統合された成分は、しばしば知覚上の独立性を失って融合してしまい、統合された音が、全体として一つの高さを持つ。調波性の原理を時間領域で捉えてみると、波形の時間的な周期性が、知覚統合を助けると考えることも可能である。また、Warren (1982) が提唱しているように、臨界帯域ごとに時間周期が検出されるとの考えかたもありうる。この場合、類同の原理、あるいは共通運命の原理により、共通の時間的周期を示す臨界帯域が結びつけられると解釈される。調波性の原理を生ずる聴覚系の仕組みについては、音の高さの知覚において問題となる時間説と場所説との対立に似た、難しい問題が生ずるようである。

 音声や音楽においては、調波性を持った音が多用される結果、いくつかの成分が、明確な音の高さを持った一つの音に統合されることが多い。この場合、上に述べた共通運命の原理も働いている可能性が高い。音の高さの知覚が一旦生ずると、音の高さについての近接の原理が働く。音の高さの次元は、周波数の次元から分離しにくいことが多いが、近接の原理を導入する際にこの二つの次元を別々に考えなければならないことがある(Singh, 1989)。また、音楽において、音の高さの隔たりである音程が、単に量的なものではなく、知覚印象の質の違いを生じさせうるものである点も忘れてはならない。音程の中でも、1オクターブあるいはその整数倍の音程は、音楽において特別な意味を有しており、このような音程を挟む二つの音の高さは、音楽的に似た性質を持つものとされる。これは、音の高さの知覚に一般的に見られる傾向であり、オクターブ類似性と呼ばれる。1オクターブの隔たりを持った二つの音には、それらが同時に鳴らされるにせよ、継時的に鳴らされるにせよ、知覚的に統合されやすい。音の高さの近接の原理と、オクターブ類似性の原理とは、常に併せて考える必要がある。音の高さを、螺旋階段のような布置で表現することが古くから提唱されているが(Ruckmick, 1929)、この考えかたに従うならば、今述べた二つの原理を、螺旋階段における近接の原理と言う単一の原理にまとめることができるかもしれない。しかし、実際に音刺激パターンの知覚的統合に関連づけて、音の高さのモデルを構成した例は見当らない。

 聴覚は時間方向に対して鋭い感受性を持つ感覚様相であり、聴覚におけるゲシタルト原理について考察するには、聴覚を通した時間知覚について理解することが不可欠である。時間軸についても、空間の一次元と同じように近接の原理が働いているが、事情はやや複雑である。時間軸上でほぼ等間隔に並んだ音は、他の音から浮きだして一つの音脈を形成しやすいし、やや複雑な時間構造をもった音の系列に対しても、我々は等間隔の構造を当てはめて知覚することが多い(Povel, 1984; Handel, 1989)。我々の最近の研究では、物理的に等間隔でない音列に対して、知覚の上で等間隔の構造を実現するような錯覚現象さえ生じている(Nakajima et al., 1992)。このように、時間的に均等な単位を基本とした知覚のなされやすい傾向を、時間的規則性の原理 principle of temporal regularity と呼ぶことができよう。時間軸が空間の一次元と大きく異なる点として、我々の知覚系は時間軸上の対称性に対して鈍感であるということが挙げられる(Mach, 1918)。また、時間軸上に並んだいくつかの音が群化するさいには、しばしば、時間軸の異方性が現れる。例えば、音楽において強勢のおかれた音符は、知覚の上で、それ以前の音符と結びつかず、それ以降の音符と結びつく傾向がある(Cooper and Meyer, 1960)。Fraisse (1982) は、リズムが時間軸上のゲシタルトであるとの観点に立ち、リズム知覚におけるゲシタルト原理を体系的に記述しており、事象の群と群とを隔てつつ結びつけている「間 pause」や、群の構造を定める上で重要な要素である「アクセント accent」などの、時間知覚に特有の概念を導入している。

 空間の三次元に関しては、我々の聴覚系はあまり敏感ではないが、音の到来方向、あるいは音像位置が知覚されることにより、異なる音事象や音脈が、空間上の異なった方向、位置に割り当てられ、その区別の明確になることが多い。ただし、物理的な音源の方向、位置は、知覚される方向、位置に一致しないことも多く、刺激パターン全体の文脈の中で決まる。このことは、音階の錯覚、オクターブ錯覚、ハース効果、逆側誘導 contralateral induction などの興味深い現象に見られるとおりである。

 空間における丸や四角などの形を聴覚によって知覚することは、通常不可能である。しかし、音像の距離や広がりがかなり明確に知覚されることは多く、聴覚体験を豊かにしている。このような聴覚における空間知覚については、視覚から聴覚への影響も重要である。空間と時間の四つの次元は、聴覚、視覚、体性感覚に共通の次元であり、異なった感覚様相から得られた情報を統合する容れ物としての役割を果たしている。この意味で、聴覚においても、空間の役割を軽視するわけにはゆかない。

 いくつかの成分が知覚的に統合するということは、しばしば、それ以外の成分を統合から排除することを意味する。音の高さや音色が充分に異なる二つの音AとBとを、ある程度短い時間間隔で交互に呈示すると、Aの音ばかりの音脈と、Bの音ばかりの音脈とに分かれて知覚されることがある。この現象は音脈分凝 stream segregation として知られている。van Noorden (1975) は、この現象を分裂 fission と呼んで、ゲシタルト心理学に極めて近い立場から研究を進め、Bregman の思想に大きな影響を与えている。その研究の中で、ある条件のもとでは、聴取者の態度によって、音脈分凝が生じたり、生じなかったりすることが明らかにされている。このような条件において簡単に音脈分凝を生じさせるためには、AあるいはBのいずれか一方に注目するような聴きかたをすればよいようである。Aに注目すると言うことは、Aの音どうしの知覚的統合を強めることになるが、これは同時にBの音を統合から排除することになる。この場合、Bの音は別の音脈として統合されることが多い。Aの音の統合を強めるために、AとBとの交替呈示に先立って、Aのみを繰り返し呈示すると、音脈分凝が促進される(Rogers and Bregman, 1993)。

 ところで、Bregman をはじめ多くの研究者は、統合 integration、群化 grouping、融合 fusionと言う三つの用語を、あまり区別せずに用いている。群化と言う用語を、いくつかの対象、事象が、個別性 identity を失わずにまとまることを示すのに用い、構成要素の個別性が失われて一つの対象、事象が生ずることを、融合と言う用語で表すのが、正しいはずであるが、この点は、 Bregmanも他の研究者も、深く論じていない。群化であるか、融合であるか、はっきりしないときや、その両方を示す際には、統合と言うのが適切であろう。聴覚においては、群化であるのか、統合であるのかが、曖昧な場合がかなり多い。例えば、合奏において、ピアノが和音でリズムを刻んでいるとき、和音を構成する音の間に群化が生じているのか、融合が生じているのか微妙なことがある。何の和音が鳴っているかは判るのに、音が全部でいくつ鳴っているかは正確に判らないことが、筆者にはよくある。別の例として、日本語の「ささ」と言う言葉を聴くとき、子音の雑音部と母音部とが群化しているのか、融合しているのかも微妙である。雑音部と母音部とを聴き分けることは可能であるが、「ささ」が4つの音から成り立っているように聴くことは、極めて難しい。

 このような問題について考えるには、「音事象」、「音脈」の概念を明確に定義することが、急務ではないかと思われる。そして、先に述べたように、現時点でゲシタルト原理を導入するには、分析的な思考も必要である。音脈を、「音事象および空白時間の時間的な連鎖」であると考えることは妥当であろう。ここでは更に、基本単位としての音事象がどのようなものであるかを考えてみる。Handel (1989) は、知覚される事象には始まりと終りとがある、と言うちょっと見れば当り前のことを、わざわざ指摘している。これは、我々の日常体験の中で、一つの音として知覚される事象は、最小限の単位ではなく、時間的な構造を持っていることを気付かせてくれる点で、重要な指摘である。音事象が、「始まり onset」、「継続部 filling」、「終り offset」と言う三種類の要素の組合せからなると考えることは、日常の体験に即している。音脈が、音事象と「空白時間 silence」との連鎖であると考えることも、不自然ではなかろう。日常の体験から、音事象の大部分は、次のいずれか一つに当てはまっているように思われる:
   A)始まって、すぐに空白時間となる(拍手など)。
   B)始まって、継続し、終ったあと、空白時間となる
     (猫の鳴き声など)。
   C)始まって、継続し、そのまま次の音事象の始まりにつながる
     (救急車の警笛音など)。
日常経験する音脈は、A、B、Cの単位の連鎖として捉えることができる。このように、始まりと終わりとを、音事象の構成単位として考えることは、神経生理学的にはごく自然な考えかたであろう(Buser and Imbert, 1992)。知覚心理学的にも、音の始まりと終わりとが、半ば独立した単位として、知覚の上で組み換えられると思われる例があり(中島・佐々木, 1993)、この考えかたが支持される。ただし、始まり、継続部、終り、空白時間は、完全に独立しているわけではなく、上記のA、B、Cのようなパターンを通して現れることしかできない。例えば、継続部と、終りとからなり、始まりがないような音事象は考えにくい。実際に、継続部と終わりとがはっきりと示され、始まりの手がかりが先行する強い音によってマスクされているような音については、知覚の上で始まりが補われると考えられ、このことが持続時間の過大評価として現れる(佐々木ほか, 1993)。この話題と関連する現象に時間誘導 temporal induction がある(Warren, 1982)。ある程度の長さを持つ純音が、その周波数を含む強い雑音で中断されるとき、中断のないつながった音として聴こえるのが、その一例である。中断によって物理的には、純音の終りと始まりとが生ずるが、その手がかりが雑音にマスクされる場合、知覚の上で終りと始まりを補うか、始まりのみを補うか、終りも始まりも補わないか、の何れかを選ばなければ、上記のパターンのいずれかに当てはまるような知覚内容を生ずることができない。終りも始まりも補わないと言う選択肢が、最も努力を要しないものとして選ばれた結果、時間誘導が生ずると考えることができる。音事象および空白時間が時間方向につながって音脈となる際にも、上記のパターンに当てはまらないような知覚内容は排除される。難波ら(1993) は、ピアノでメロディーを演奏するとき、時間的に隣りあう音が、ごく短い時間だけを切り出して聴けばはっきり判るくらいに重なっていても、メロディーの流れにおいては、全く重なりの知覚されないような例を報告している。この現象は、聴覚系ができるだけ多くの音事象を音脈にまとめる傾向があり、そのために上記のCのパターンを当てはめたと考えれば説明できる。このような仕組みがなければ、残響時間の長い部屋で普通のメロディーを聴きとることは不可能であろう。物理的には同じ音に、2種類のパターンが当てはめられることもある。周波数が連続的に上昇する音を、くり返し呈示するとき、高さの上昇する音どうしが一つの音脈を作るとともに、音の始まりに対応するごく短い音からなるもう一つの音脈の生ずることがある(Bregman, 1990; Figure 2.19)。この場合、BまたはCのパターンと、Aのパターンとが、同時に生じたことになり、音の物理的な始まりが、知覚の上で二重に解釈されたことになる。このような一見簡潔でない知覚内容がわざわざ生ずることを説明するには、音の始まりが、半ば独立な知覚要素としてふるまい、周波数の近接に原理に従って音脈を形成したと考えなければならないであろう。以上示したように、思いきって分析的な思考法を導入することによって、音事象、音脈の概念を、様々な実験結果を統一的に説明するための道具とすることが可能となる。この点については、現在理論的な検討を進めている。

 以上論じてきたように、ゲシタルト心理学は、聴覚研究に新たな観点を導入しうる。しかし、この際、聴覚に特有の問題点も生ずる。積極的な見かたをすれば、聴覚研究を通じて、ゲシタルト心理学に新たな材料を提供することによって、その現代的意義を見出すことが可能である。

3 ゲシタルト原理とは何か

 Kohler (1969) は、知覚がゲシタルト原理に従うことを説明するために、我々の持つ知覚印象は、構造の上で脳内の物理過程に対応しており、物理過程には単純な形や、規則的な形が安定して現れやすいことから、我々の知覚系も、単純な形や、規則的な形を捉えやすい、との考えを取っている。この心理物理同型説 hypothesis of psychophysical isomorphism と呼ばれる仮説は、肝腎の脳内の物理過程をはっきりと捉えていないので、その後の知覚心理学に大きな影響を及ぼさなかったが、脳科学が急速に進歩しつつある現在、再評価されてよいと思われる。この点に関して筆者の見解を以下に述べる。単純な形、規則的な形は、自然界の物理過程として生じやすく、知覚に関わる神経系および受容器の物理過程としても実現しやすいので、この二つの物理過程を対応づけるような知覚過程が、動物の自然環境に対する適切で素早い適応過程として生じやすいのではなかろうか。脳を含む神経系の働きには自ずから限界があり、環境の目まぐるしい変化に次々と対応してゆくには、単純な形、規則的な形を、優先的に知覚することが、環境の構造を適切に反映する確率が高く、しかも脳を効率的に素早く機能させるような適応となるわけである。このような適応は、進化の結果としても、学習の結果としても生じうるであろう。進化の結果、ある種の知覚学習が生じやすくなると言うことも、このような適応過程の重要な要因であり、ゲシタルト原理の起源となりうる。古いゲシタルト心理学においては、知覚を環境に対する適応過程として捉える見かたが希薄であり、特に、学習が知覚に及ぼす影響はできる限り小さく見積ろうとする傾向があった。このような、やや独善的な物の見かたが、心理物理同型説の一般的な意味を見出す妨げになったのではないかと思われてならない。現代のゲシタルト心理学者と呼んでもよい、Handel、Bregman は、この点で古いゲシタルト心理学者とは異なっている。特に Bregman は、進化の果たした役割を全体として重視しつつ、進化と学習との協力関係についても深く考察を進めている。

 Terhardt (1991) は、ゲシタルト原理に基づく知覚が、環境への最適の適応にほかならないとしており、進化と学習との区別も、知覚について考える際には必要でないとしている。これは、古いゲシタルト心理学とは異なる、もう一つの極端な立場である。環境に対する適応方法は、いろいろありうる中でなぜ特定の方法が選ばれるのかについては、もう少し慎重な考察が必要であろう。進化の過程は、合理的な設計に基づくものではない。進化の過程における動物は、必要が生じたときに、ありあわせの道具立てによって特定の機能を実現する。その結果どうしても不完全な面が生ずるので、機能の重複する別の仕組みを発達させて不足を補い、そこで生じた余分な能力がさらに次の進化の道具立てとなる。このような「場当り的な進化」の筋書きは、一般論として概ね妥当であろう。この際、ありあわせの道具立てとして用いられた神経系は、必ずしも合理的な設計に基づいて構成されていないので、神経系に特有の制約条件を持つであろう。このような制約条件は、何らかのゲシタルト原理として現れるはずである。ゲシタルト原理(単純化の原理)が常に最適の適応を与えるわけではなく、それゆえにこそ、狭い意味での適応の原理とは別に、ゲシタルト原理の概念が必要になるのではなかろうか。

 ゲシタルト原理が、進化や学習のあらゆる段階で現れるものとすると、それには様々な異なった仕組みが関わっているはずである。心理物理同型の対応は、受容器から脳に至るまでの様々なレベルに並行して現れることもありうる。例えば、「ささ」を同じ音のくり返しとして聴く際には、基底膜から脳の言語野に至るまで、いくつもの段階で、近接ないし類同の対応が見られる可能性がある。以上のことを考え合わせると、現在明らかにされているようなゲシタルト原理は、特定の知覚現象の具体的な説明と言うよりは、様々な異なった知覚現象に適用しうる共通の説明方法と考えたほうがよい。ただし、具体的な仕組みが解らなくても、ゲシタルト原理を当てはめることは可能な現象が、数多くあり、このような現象に対しては、何も説明を与えないよりは、ゲシタルト原理による仮の説明を与えておくほうが、少なくとも事実の整理になって生産的である。

今述べたような心理物理同型説の解釈について、聴覚に関する例を取りあげてみよう。同じ音源から次々に発した音は、音源の発音機構に物理的な制約があるために、周波数の近いスペクトル成分を持つことが多い。これらの成分は、通常、聴覚神経系の近い位置を興奮させるはずであるが、近い位置に生じたいくつかの興奮は、神経系のその後の活動において互いに関係づけられる可能性が高い。実際、周波数の近い成分は知覚的に結びつくことが多いので、このような傾向を周波数の近接の原理と呼ぶわけである。この原理に従った知覚は、環境を適切に反映する可能性が高く、神経生理学的に実現しやすいため、進化、学習によっても強められる可能性がある。「遠隔の原理」は、自然環境の側にも、神経系の側にも生じにくいであろう。残念ながら、聴覚系に関しては、スペクトル成分の周波数の情報が、どのようにして末梢から脳に伝わってゆくかが必ずしも明確ではなく、このような考えかたの細部を詰めることはできない。しかし、一般論としては、近接の原理とよばれている知覚の傾向について、常に同様の考えかたが可能ではないかと思われる。

 先に述べた、時間的規則性の原理については、少し事情が複雑なようである。自然の環境において時間的な規則性を持った音として重要なものは、動物や人間の足音、動物の鳴き声、赤ん坊の泣き声、それに音楽、言葉、かけ声などである。いずれも動物や人間の活動に関するものであることが判る。現代では、乗り物や機械が、時間的規則性を持った音を発するが、この点は考察から省くことにする。特に重要なのは、言葉や音楽などの聴覚コミュニケーションに用いられる音であろう。これらの音のリズムは、音を発する人間の、脳の活動のリズムを反映しているはずである。これを聴く側も同じ人間であるから、同じような脳の活動のリズムを作りだして聴きとることが可能である。特に、脳の活動に規則的な時間パターンを生じさせることは、さほど困難でないように思われる。我々の言語は、多かれ少なかれ規則的な時間構造を基本としており、特に日本語はモーラと呼ばれる厳密な時間の単位に基づいているが、このような時間の単位は、話し手と聞き手との脳の活動を同期させ、メッセージを確実に伝えることに役立っているのではなかろうか。つまり、時間的規則性の原理は、言葉や合図を聴きとるための時間的枠組と、言葉や合図を発するための時間的枠組とを同時に提供している可能性がある。この二つの枠組は、脳の働きにリズムを与えるような、共通の仕組みによっているかもしれない。

 時間に関しては、規則性を考えるだけでなく、知覚される時間パターンの階層構造を考えることがよくある(Handel, 1989)。この点に関しては、音楽心理学の分野で数多くのモデルが提唱されているが、実際に階層的な知覚が存在すると言う確かな証拠はまだ多くない。しかし、時間軸上の音のつながりとして言葉や音楽を聴きとる場合、時間を単位に分け、数秒以上の長い時間にわたって予測をつける必要があると考えられ(Neisser, 1976)、ここに時間的規則性を伴った高度に階層的な知覚が発生する可能性がある。ここで体験される階層構造は、実際に鳴らされた音にある程度規定されつつも、ある程度独立したものであろう。つまり、Neisser の言う図式 schema が、時間構造として現れることになる。この考えかたは、音楽を聴く際に、拍節構造からのずれをシンコペーションとして知覚すると言うような日常体験に当てはまっている(Longuet-Higgins and Lee, 1984)。また、音楽においては、音の高さに関しても図式の働きが明瞭に示される(Krumhansl, 1990)。音は、一旦鳴らされると消えてしまうので、聴覚においては、それまでに知覚されたものに従って、次に生ずる知覚内容を予測し、予測の当否に応じてさらに次の予測を行うと言うことが不可欠である。それゆえ、図式の働きが、視覚の場合よりも見やすい形で示されている可能性がある。現代の聴覚研究にゲシタルト原理を導入する際には、このような認知心理学の考えかたをうまく取り入れることも必要であろう。

 ゲシタルト心理学の考えかたを、聴覚研究に導入することは、ようやく始まったばかりであり、今後多くの作業が必要である。現段階では、視覚研究の分野で提唱されたゲシタルト原理を、聴覚に一つ一つ当てはめる作業が進行中である。しかし、視覚におけるゲシタルト原理を、そのまま導入するわけにはゆかない。まず、音事象、音脈と言う概念を確立することが重要である。その際、古いゲシタルト心理学には反するが、思いきって分析的な思考法をとり入れることが、有効である。ゲシタルト原理そのものの説明方法としては、進化や学習による環境への適応として、心理物理同型的な対応が生ずるとの考えかたが有効である。ゲシタルト心理学を現代に移植する際には、認知心理学における図式の概念を取り入れることも必要であろう。

最前頁へ戻る