音の粗さ  roughness
臨界帯域を越えない程度の狭い周波数範囲で、唸りなどにより、音圧が毎秒数十回から100回余りくらいの変化を示す場合、音色に濁った感じ、ざらざらした感じが生ずる。これが、音の粗さである。音楽において、同時に鳴らした2つ以上の音のあいだに不協和が生ずるとき、音の粗さが大きな要因になっている。

音声合成  speech synthesis
機械やコンピューターを用いて、録音を単に再生するのではない方法で言語音声を発すること。人間の発する音声に含まれる情報の本質的な部分を抽出して合成が行われるので、音声合成を研究することは、音声がどのように生成され、知覚されるかを研究することにつながる。

音声認識  speech recognition
本来の意味は、音響刺激としての音声を、言葉として処理する過程のことであるが、多くの場合、音声の伝える言語情報、話者情報などを、機械やコンピューターを用いて、自動的に抽出することを指す。音声の音響波形から声道(声帯から唇までの空気の管)の周波数特性を推定し、一種のパターン認識として言語情報を抽出することが基本になる。

音脈分凝  auditory stream segregation
耳に入る音波が、二つ以上の時間的なつながりに分かれて聴こえること。異なる音源に発し、並行して耳に入ってきた音のつながりを、別々のものとして聴き分けることが、これに当たる。実験室において、音の高さや音色などのある程度異なった2種類の音AおよびBが、ABABAB−−と交替で呈示されるとき、AAA−−という音脈(音の知覚上のつながり)と、BBB−−という音脈とに分かれて聴こえることがある。これも、音脈分凝の一例であり、この用語が特にこのような現象を意味することも多い。音脈分凝に関しては、近接の原理、類同の原理などのゲシュタルト原理が働く。

進行波説  traveling wave theory
内耳の蝸牛の働きに関する学説。耳に入った音波は、鼓膜を振動させ、この振動は耳小骨を経て内耳の蝸牛に伝わる。蝸牛は、35 mm程度のごく細い管とみなすことができ、基底膜およびその周辺の組織によって、二階建てバスのように、長さの方向に沿って二つの階に仕切られていると考えてよい(蝸牛のふるまいを理解するために単純化した考えかたである。)。二つの階、すなわち前庭階、鼓室階はリンパ液で満たされており、蝸牛の先端(耳小骨から離れた側)の内側に、二つの階のリンパ液が行き来しうる穴がある。耳小骨の振動は、前庭階の入口側からリンパ液に伝わり、基底膜の振動をひきおこす。基底膜が複雑な機械的特性を持つため、その変形は定常波とならず、蝸牛の入口から先端へと、進行波の形で伝わる。純音を刺激とする場合、この進行波の振幅は、先端側へ進むある点まで増加しつづけ、その後急速に減小し、ゼロに近づく。振幅が最大に達する場所は、純音の周波数によって定まり、高い周波数に対しては入口側となり、低い周波数に対しては先端側となる。このことが、音の高さなどを知覚する際の手がかりの一つになる。以上がベケシーの提唱した進行波説であり、その基本となる考えかたは広く受け入れられている。

調音(構音)  articulation
言語音声を発する際に、唇、舌などを動かして、声帯より上の空洞の部分、すなわち声道の形を変化させることにより、音のスペクトルの特定部分を持ち上げたり(強めたり)、空気の流れを妨げて雑音を発生したりすること。多くの場合、声道の一部を狭めたり、一時的に閉じたりすることによって調音がなされる。声帯音源は、それだけでは多くの情報を伝えることができないが、それに調音が加えられることによって、言語的情報を担いうる音ができあがる。

聴覚の情景分析  auditory scene analysis
聴覚系が、音波として与えられている手掛かりを、すばやく体制化し、環境に何が生じているかを把握する過程のこと。我々が耳を使って直接体験するのは、「家族の話し声」、「車の警笛」、「蛙の鳴き声」などの具体的な音であり、「音の大きさ」、「音の高さ」、「音の到来方向」などの要素的な性質ではない。我々は、「どんな音が、どこで、どんな風に鳴っていて、他の音との関係はどうなっているのか」を瞬時に把握する。利用しうる物理的な手がかりの大部分が、左右の耳に与えられた気圧の時間的な変化にすぎないことを考えると、これは驚異的な働きである。聴覚系のこのような働きが、聴覚の情景分析である。耳に与えられる音響信号を、時間−周波数の座標における音エネルギー分布の濃淡(スペクトログラム)として表してみると、異なった音が混じりあっている場合にも、音と音との境目が常に明確に示されているわけではなく、音の存在する範囲が重なっていることすらある。聴覚系は、これを、人の話し声や、楽器の音などの具体的な音として体制化することになる。この際に、一つの音源から発している音の時間的なつながりに対応する「音脈 auditory stream」、および、一回の音発生に対応する「音事象 auditory event」などの主観的なまとまりの単位が生ずる。この際に、種々のゲシュタルト原理が働く。その中には、調波性(倍音関係)を持った成分がひとまとまりに聴こえやすいなどの、聴覚特有のゲシュタルト原理も含まれる。音韻知覚などにおいては、知覚学習も体制化に大きく影響する。1970 年代に始まった聴覚の情景分析の研究は、ゲシュタルト心理学の影響を強く受けている。ただし、さまざまな体制化の原理が、生物が環境に適応する過程である進化、学習によって生じた、との考えかたを重視する点で、それ以前のゲシュタルト心理学に対して一線を画する。

聴覚補完  auditory restoration
時間的に隙間なくつながった音から、ある時間幅(例えば 100ms )の部分を抜き去ると、時間的な空白が知覚されるが、ここに、抜き去った部分の周波数範囲の成分を含むような、充分に強い音をはめ込むと、はめ込まれた音が聴こえるとともに、空白を含むはずの音が、元の音と同じようにつながって聴こえることがある。このように、時間軸上に欠損部を持つ音が、他の音の存在によりあたかも修復されたかのように聴こえる現象が、聴覚補完である。元のつながった音は、純音や帯域雑音のように単純な音である場合もあり、言語音声や音楽などの複雑な音である場合もある。話し声に強い咳ばらいの音がかぶさったときなどは、聴覚末梢系において話し声に対するマスキングが生ずるので、話し声の一部を抜き去り、強い音をはめ込んだのと同じことになる。この場合に、話し声がつながって聴こえるのは、広義の聴覚補完である。

聴覚フィルター  auditory filter
聴覚末梢系の働きは、周波数軸上に、重なりあって並んだ一群の帯域通過フィルターを想定することによって、近似的に記述されうる場合がある。この仮想上のフィルターを聴覚フィルターと呼ぶ。例えば、ある純音に対して、雑音が(完全な)マスキングを及ぼしうるか否かを見るには、聴覚フィルターを、純音がどの程度通過し、雑音の成分がどの程度通過するかを、それぞれ計算し、両者のレベル差を見ればよい。ただし、純音の検出に最も有利なフィルターを選ぶ必要がある。聴覚フィルターの概念は、臨界帯域の概念に似ている。

オクターブ類似性 (「調性」の代わり) octave similarity
楽器などによって、ある音から始めて半音ずつ上昇するように音を鳴らしてゆくと、1オクターブ上がったところで、冒頭の音と共通する性質が知覚される。オクターブ、あるいはその整数倍の音程だけ離れた音は、知覚の上で近い関係にあると考えられ、この関係をオクターブ類似性と呼ぶ。1オクターブごとに戻ってくる主観的な性質のことを、「トーン・クローマ」または「調性」と呼ぶ  (「調性」と言う語の用法は、音楽理論における用法とは異なる。)。

部分音  partial tone
音を、いくつかの純音を合成したものとして表すことができるとき、その成分となる純音の一つ一つを部分音と呼ぶ。調波複合音 (倍音関係を有する複合音)の、基本音、倍音はいずれも部分音の例であるが、調波的でない(倍音関係を有しない)複合音に関しても、部分音と言う用語を用いうる。

スペクトル  spectrum
音響信号、振動、光などの、時間の関数として表される変化、あるいは波として伝わる変化を、正弦波成分を合成したものとして表すことにより、信号や波が伝わったり、別の信号や波に変換されたりする様子を理解しやすくなることが多い。このような正弦波成分の振幅、位相などを、周波数(または波長)の関数として表示したものをスペクトルと呼ぶ。特に、正弦波成分の振幅、あるいはレベル (一種の対数尺度であるデシベル尺度に変換した振幅)を、周波数の関数としてグラフに示したものはよく用いられ、このグラフを単にスペクトルと呼ぶことも多い。

フーリエ分析  Fourier analysis
与えられた関数を、正弦波成分(周波数、位相、振幅によって定まる)に分解する数学的な手法。分解して得られた正弦波成分を合成すると元の関数に戻る。振動、波、信号などが伝わったり、変換されたりする仕組みに関して、周波数ごとに別々の過程であると考えて処理、考察を進め、最後に、全ての周波数の成分をまとめるようにすると、考えかたが簡単になる場合がある。このような現象に関してフーリエ分析が有効である。

プローブ音法  probe tone technique
認知心理学における実験手法の一つ。音階や楽曲の一部などの文脈刺激を音で呈示した後、少し間をおいてトーン・クロマの明確な音を呈示し、この音、すなわち「プローブ音」が文脈にどの程度適合しているかの判断を被験者に求める。全てのトーン・クロマをプローブ音に用い、プローブ音によって適合度がどのように違うかを見ることによって、文脈刺激の性質が明らかになる。この手法を用いると、音階や楽曲の一部などに形成される調性的階層が示されるので、調性の概念を実験心理学の手法によって検討することができる。

変調音  modulated tone
定常的な音信号を材料にして、その周波数、振幅などを時間的に変化させることによって作り出された音。この変化させる操作のことを、変調という。変調は、一方向に掛けられる(例えば、周波数が、低い方から高い方へ変化する)場合、周期的に掛けられる(周波数が周期的に上昇、下降を繰り返す)場合、および、不規則に掛けられる(周波数が不規則に上下する)場合がある。単に変調音と言えば、周期的な変調を掛けられた音を指す場合がよくある。

マガーク効果  McGurk effect
音韻知覚に関する、聴覚的な手掛かりと、視覚的な手掛かりとを、くい違ったものにして、同時に呈示すると、二種類の手掛かりが引っ張りあうような知覚の生ずること。例えば、/ba/と発音した音を、聴覚刺激として与え、/ga/と発音した顔の動きを、視覚刺激として与えると、多くの場合、音声としては /ba/と/ga/との間に位置づけられる/da/が聴かれる。この場合、被験者は、手掛かりの一部を目で見たとは感じず、耳に/da/が聴こえたと感ずる。

モーラ  mora
一部の言語において音声の基礎となっている時間的な単位。日本語を特徴づけている。日本語においては、話し手も聴き手も、等時的な時間構造を枠組みとしている。その基本単位となるのがモーラであり、俳句、川柳が17文字からなると言うときの「文字」と呼ばれる単位がこれに当たる。会話において1モーラの占める時間長は 90〜250 ms くらいであり、160 ms 程度が典型的な値である。促音/っ/、撥音/ん/は、1モーラを占め、長母音を含む音節(例えば/もー/)は2モーラを占める。短母音を含む拗音の音節(例えば/みゃ/)は、1モーラを占める。

リズム  rhythm
時間上に生ずる主観的なまとまり、すなわちゲシュタルトであり、知覚または動作、もしくはその両者の時間的統合を支える。特に、話し言葉、音楽などの聴覚コミュニケーションの仕組みについて理解する上で重要な概念である。現れるや否や消え去ってしまう時間上のパターンの中に明確な秩序を把握するために、我々は、等間隔の時間の単位が反復されていることを手がかりにすることが多いので、このような反復のことをリズムと呼ぶことがある。また、音楽、詩歌に関しては、「タンゴのリズム」、「七五調のリズム」のような用例に見られるように、反復されるパターンのことを、リズムと呼ぶ場合もある。ゲシュタルトとしてのリズムの知覚に際しては、等間隔の、あるいはそれに近い枠組みの当てはめられることが多く、このような枠組みは、時間の格子 temporal grid と呼ばれる。次々に生ずる事象の、始まりから始まりまでの時間間隔や、持続時間、強度、質の違いがリズムの性質に影響する。話し言葉や音楽においては、音の高さの変化が重要な要素となる。リズムを構成する事象、あるいは事象群の中に、前後のものに比して、知覚、産出の際に強調されるものがあり、この強調のことをアクセントと呼ぶ。リズムを構成する事象や、時間の単位は、時間的に近いものどうしがまとまりをなし、さらに、いくつかのまとまりがつながってより大きいまとまりをなすことによって階層構造を形成すると考えられる。階層構造の各層を構成する単位にもアクセントのあるものと、ないものとがあり、アクセントの位置がリズムの性格に大きく影響する。

参考 テンポ、拍子

リズム障害  rhythmic disorder
言語障害の現れかたの一種。言語音声を発する際に、リズム、抑揚などに問題を生じて、コミュニケーションに支障を来すような障害。吃音(どもり)、病的な口ごもりや病的な早口などがその例である。精神的緊張、人間関係における感情的葛藤、中枢の障害、精神発達遅滞など、原因はさまざまであると考えられている。

両耳聴  binaural hearing
左右二つの耳で音を聴くこと。日常生活において、右耳と左耳とに入ってくる音は、似通っているものの、僅かなくい違いを含む場合が殆どである。聴覚系は、両耳に与えられた音信号を比較したり、両耳から別々に得られた情報を統合したりしながら、環境に何が生じたかを把握する。左右の耳から並行して情報を得ることが、最も役立っているのは、音源の方向ないし位置の知覚、音ないし音の鳴っている空間の広がりの知覚、および音源分離に関してである。音源が、聴取者の正面に対して右寄りにあるとき、音は、左耳よりも右耳に対して、より早く到達し、多くの場合より強くなる。このような左右の時間差(位相差を含む)、および強度差は、左右次元のどの方向から音が到来したかを把握する手掛かりになる。なお、実験室的には、左右の耳に大きく異なった音信号を呈示することも広く行われ、数々の興味深い現象が報告されている。

臨界帯域  critical band
各耳に対応する聴覚系の第一段階において、音の周波数成分が、狭い周波数範囲ごとに別々に処理されていると想定すると、多くの精神物理学的なデータが統一的に説明される。この一つ一つの周波数範囲の処理単位のことを臨界帯域と呼ぶ。臨界帯域の周波数幅は、中心周波数の関数として表され、500Hz 以下に対しては、常に約 100 Hz となり、500Hz以上に対しては、中心周波数の5分の1程度となる。純音成分に、同時マスキングを最も及ぼしやすいのは、その純音成分を中心とする臨界帯域に含まれる他の成分である。複合音や雑音の音の大きさの知覚に関しては、臨界帯域ごとに、音エネルギーが音の大きさ(ソーン値)に変換され、全ての臨界帯域にわたって音の大きさが加算されると考えれば、かなり良い近似が得られる。一つの臨界帯域は、蝸牛の基底膜における約1mmの長さに対応している。本来の意味における臨界帯域は、担当する全ての周波数の成分を均等に通過させ、可聴周波数範囲を、隙間も重なりもなく覆いつくす。この点で、特定の周波数の成分を最もよく通し、互いに重なりを許す聴覚フィルターとは区別される。ただし、この区別は絶対的なものではない。臨界帯域の中心周波数は、工学的なモデルに見られるように固定したものではなく、刺激に応じて変化しうると考えたほうがよい。

共変調マスキング解除  co-modulation masking release
純音などの信号が、不規則な振幅変調の掛かった雑音から同時マスキングを受けるとき、雑音の周波数範囲を、同じ振幅変調を掛けたまま広げたり、同じ振幅変調を掛けた雑音を離れた帯域に加えたりすると、信号以外の成分が増すにもかかわらず、マスキングの効果が弱まることがある。この現象を指す。新たに加わる雑音の帯域が、信号を中心とする聴覚フィルターの外部に与えられるときに、この効果が得られるとされており、聴覚フィルターを含むシステムの出力が、刺激パターン全体の時間変動に影響されることを示唆する。

二重知覚  duplex perception
一つの物理的手掛かりが、二つの対象ないし事象の知覚に関ること。主に聴覚に関して用いられる用語である。例えば、合成音声を基本として、第3フォルマントの立ち上がり付近の遷移の違いのみによって/da/と/ga/とが聴き分けられるような、刺激パターンの組を用意する。ここで、時間−周波数の座標における第3フォルマントの遷移部のみを分離して一方の耳に呈示し、残りの全ての部分をもう一方の耳に呈示すると、残りの部分を呈示された耳に、音節/da/、/ga/が聴き取られ、遷移部のみを呈示された耳にはチュッというような音が聴こえる。第3フォルマントの遷移部は、音節を聴き分ける手掛かりになると同時に、非音声的な音(チュッ)としても聴き取られるので、二重知覚を示したことになる。

周波数部位構成  tonotopic organization
聴神経から大脳皮質聴覚領に至る神経系の様々な段階に見られる解剖学的構造。ニューロンに対して、それぞれ最も応答をひき起こしやすい、純音の周波数(特徴周波数)が定まり、一群のニューロンがそれに従って低い周波数の側から高い周波数の側へと順番に並んでいる構造のこと。蝸牛における音の周波数分析を反映する。音の高さ、音色、音韻などの知覚と深い関係があると考えられる。なお、聴覚に関わるすべてのニューロンが、周波数部位構成を示すわけではない。また、大脳皮質においては、一見周波数部位構成が見られても、現実のニューロンのふるまいが単純に特徴周波数と対応しているとは限らない。

移調  transposition
楽曲やメロディーに含まれる全ての音符を、一定の音程だけ上または下にずらせて演奏すること、あるいは記譜すること。ただし、全ての音符を、1オクターブまたはその倍数だけずらせ、音名が変化しない場合、音楽理論の上では、この操作を移調と呼ばないことが普通である。心理学の分野では、これを移調と呼ぶこともありうる。平均律を用いる場合、移調によって、全ての音符が置き換えられても、楽曲あるいはメロディーは、移調する前のものと同じであると認知され、その主観的な性質は保たれる。知覚内容としてのメロディーが、移調によって消失しないことから、個々の音の高さについて調べることが、必ずしも、メロディー知覚の原理を理解するための手がかりとはなりえないことが解る。このことに対する疑問は、ゲシュタルト心理学が生まれる重要なきっかけとなった。なお、作曲、編曲、演奏などの音楽活動の現場においては、楽曲を演奏する際の技術的な制約を克服する手段として移調のなされることが多い。この場合、厳密に全ての音符が同じ方向に、同じ音程だけずれるとは限らない。

参考 転調

旋法  mode
楽曲やメロディーを形成する音の高さを、音名(トーン・クロマ)にしたがって1オクターブの範囲にまとめて示し、メロディーを終止させる音の音名などを指定することによって、それぞれの音名を持つ音の役割を示したもの。あるいは、そのような音名の表を想定することによって理解できるような、音の高さの秩序。広い意味では、長調や短調も旋法の一種と考えることができる。しかし、ピアノの白鍵をD音から1オクターブ上のD音まで並べて作られるドーリア旋法をはじめとする、中世以前の教会旋法を指すことが、実際には多い。この場合には、音域が1オクターブ、あるいはそれよりもやや広い範囲に限定されるなどの制約が加わる。

同義 モード

参考 音階

調性  tonality
音楽理論においては、主音や属音を中心とする、長調や短調の印象、あるいはそれに似た印象を伴うトーン・クロマの秩序のことを、調性と呼ぶことが多く、メロディーや和声を組み立てる上での指針を提供するものと考えられている。そのような秩序が破壊された状態を無調 atonality と呼ぶ。知覚心理学においては、調性の語が、トーン・クロマを意味することが、長いあいだ一般的であった。しかし最近では、以下に説明するような意味を持つことが増えている。楽曲において、あるいは音楽を模した文脈において、聴取者は、次にどのようなトーン・クロマを持つ音の来る可能性が高いかを時々刻々予測していると考えられ、現れる可能性が低いと予測されるトーン・クロマを持つ音が実際に現れると、文脈に適合しないように感じたり、意外であると言う印象を受けたりする。このような予測を与える文脈の性質のことを、調性と呼ぶ。典型的な長調、短調の文脈(例えばカデンツ)に対しては、次に主和音の構成要素である音が現れると、文脈に適合している印象の得られることが多く、音階に属しない音(長調においては臨時記号を要する場合がこれに当たる)が現れると、文脈に適合していない印象の得られることが多い。このような調性の下では、主音や属音を中心として、重要なトーン・クロマとそうでないトーン・クロマとのあいだに、階層秩序が形成されていると考えられ、これを調性的階層 tonal hierarchy と呼ぶ。重要なトーン・クロマは、階層の頂点の付近に位置づけられ、互いに近い関係にあると知覚される。調性的階層は、長調や短調の文脈以外にも現れる可能性がある。ハ長調の文脈と、ト長調の文脈とは、調性的階層の上で似ており、ハ長調の文脈と、嬰ヘ長調の文脈とは似ていない。これは、音楽理論のうえで、調と調との関係が近い場合と、遠い場合とに対応している。知覚実験の結果を説明するために導かれる概念である調性的階層と、楽曲の分析から得られる調と調との関係との間に、対応関係のある点が重要である。

聴能形成  technical listening training
音響に関連する部門の技術者を養成することを目的とした聴覚能力の訓練体系。異なる音を聴き分け、どのような物理特性の違いが、聴こえの違いとして現れるかを推定するような訓練が中心となる。例えば、録音された音楽を、そのまま再生した場合と、ある周波数範囲を強調して再生した場合とを聴き比べ、どの周波数範囲が強調されているかを当てるような課題が与えられる。この場合、どの周波数範囲も強調されていないような場合も選択肢に含まれる。このような訓練により、音に対する注意、弁別、特徴検出、記憶などの能力が向上すると考えられる。周波数特性のほか、継時的な音圧レベル差、パート間のレベル関係、変調周波数、歪み、残響時間などが取り上げられる。訓練に用いる音は、クラシックやポピュラーの音楽を素材として作成されることが多いが、音声、人工音も用いられる。また、訓練の初期においては、純音の周波数を識別させるなどの、単純な音を材料にした課題が用意されている。必要に応じて、音色を表現語対に関連付けたり、音の時間波形、スペクトルを見ながら音を聴いたりするような体験を織り交ぜ、音に対する技術的な感性の全般的な向上を図る。九州芸術工科大学音響設計学科における教育課程の一環として、音楽教育におけるソルフェージュなどを参考にして開発された訓練体系であり、現在では日本国内の大学、企業において広く採用されている。また、ポーランドのフレデリック・ショパン音楽大学においても、類似の訓練体系が独立に開発されている。

転調  modulation
ひとつながりの楽曲、あるいは楽曲を模したパターンの途中で、ある調から別の調への移行がなされること。

参考 移調

テンポ  tempo
時間的な繰り返しの、頻度もしくは速さ。音楽の拍に関して用いられることが多い。物理的な意味と、主観的な意味との、双方で用いられる。多くの楽曲においては、テンポが、「速く」、「遅めに」などの言葉で指示されたり、1分当たりの拍数や、総演奏時間によって指定されたりしており、このような楽曲を実際にどのようなテンポで演奏するかを決めることは、演奏家の重要な役割である。

トーン・クロマ  tone chroma
音の高さの一面を表す用語。音の高さを、例えば半音程度の細かい段階で上昇させてゆくと、あるいは下降させてゆくと、1オクターブ進んだところで、冒頭の音の高さと共通するような性質が知覚される。この性質のこと。「調性」と呼ばれることもあるが、この語は異なった意味を有することがあるので、注意を要する。同じトーン・クロマを有する音の集まりを、音高類 pitch classと呼ぶ。トーン・クロマは、音楽において、同じ音名が1オクターブごとに繰り返されることに反映されており、メロディーや和声の基本である。

参考 トーン・ハイト

トーン・ハイト  tone height
音の高さの一面を表す用語。音の高さを、少しずつ上昇させてゆくと、あるいは下降させてゆくと、出発点となる音の高さから一方向に遠ざかってゆくような性質が知覚される。この性質のこと。日常の環境においては、トーン・クロマがはっきりとしていなくても、トーン・ハイトは明瞭に弁別されることがよくある。例えば、手を叩いた音と、胸を拳で叩いた音とを聴き比べると、前者の方が、音の高さが高いように感ぜられるが、この場合には、トーン・クロマは殆ど関与しておらず、トーン・ハイトの違いが捉えられていると考えられる。

参考 トーン・クロマ

 beat
楽曲を演奏したり、聴取したりする際の、最も基本的な時間の単位。または、その単位の始まりの時刻。楽曲にあわせて「1、2、3」などと数えながらリズムを取るとき、あるいは指揮者が指揮棒や手で時間を刻むとき、多くの場合、拍に対応した動作がなされている。時間の単位としての拍は、等価の長さを有するが、音楽的に、あるいは知覚的には、強弱の別がある。強い拍と弱い拍とが、「強弱」、「強弱弱」のようなパターンを形成して反復されたものが拍子である。時間の単位としての拍の長さは、大部分の場合、0.2〜2秒程度の範囲に収まり、楽譜上では4分音符に対応することが比較的多い。

参考 拍子

ホモフォニー  homophony
複数の声部が、主役となるただ一つのメロディーを聴かせるために、統一的な動きを示すような音楽の様式。いわゆる「伴奏付きメロディー」が典型的な例である。

参考 ポリフォニーモノフォニー

ポリフォニー  polyphony
複数の声部のそれぞれが、自己を主張して一見独立に動きながら、全体としてはまとまりを感じさせるような、音楽の様式。声部から声部へと同じメロディーが、あるいはその変形パターンが受け渡されてゆく「フーガ」が典型的な例である。ポリフォニーの様式に従って作曲されているようでありながら、実際には、次々に交代する主役の声部に他の声部が伴奏を付けているように聴こえる場合や、たくさんある声部の一部だけに独立の動きが聴き取られる場合など、ポリフォニーかホモフォニーかを明確に決めることが難しい例もある。このような中間的な例が、便宜的にポリフォニー音楽と呼ばれる場合もある。

同義 多旋律
参考 ホモフォニーモノフォニー

ポリリズム  polyrhythm
異なった複数のリズムが、独自性を保ちながら同時に演奏されるような状況、あるいはパターン。一つの声部で3つの拍が鳴らされるあいだに、もう一つの声部で4つの拍が鳴らされるような状況が典型的な例である。このようなパターンを聴くとき、一つの声部のリズムのみがはっきりと聴き取られて、別の声部のリズムは背景に退いたように知覚される。しかし、どの声部がはっきりと聴き取られるかは、聴き続けているうちに突然変化することがある。

モノフォニー  monophony
ひとつながりのメロディーが唯一の構成要素であるような、音楽の様式。無伴 奏の斉唱が典型的な例である。

参考  ホモフォニーポリフォニー

オクターブ類似性  octave similarity
音楽に用いられるような音は、多くの場合楽譜に示しうるくらいに明確な音の高さを有している。このような音どうしが、1オクターブ(完全8度)、あるいはその整数倍の音程だけ離れているとき、共通の性質が感ぜられ、音楽においては同じ音名が与えられる。このような音は知覚のうえで類似していると考えられ、その類似関係のことをオクターブ類似性、またはオクターブ等価(octave equivalence)と呼ぶ。もっとも歴史的には順序が逆で、このような共通の性質を生ずる音程が発見されて音階の枠組みとなり、1オクターブと呼ばれるようになったわけである。音楽における1オクターブは、1:2の周波数比に対応するとされることが多いが、厳密には、それよりもわずかに広がる側にずれた周波数比に対応することが知られている。オクターブ類似性は、実際の音楽において、音域の制約などのために、旋律をなす音の一部が1オクターブ低い、あるいは高い音に置き換えられるような現象に端的に示される。音の高さが少しずつ上昇すると、1オクターブ上昇するたびに、同じ音名で表しうるような性質が還ってくるような感じがするので、これを螺旋階段を1回転分昇るたびに同じ向きに帰ってくることになぞらえるようなモデルが、理解を助けるために用いられる(音の釣鐘のモデルなど)。1オクターブごとに循環する主観的な性質のことをトーン・クロマと呼び、螺旋階段の平面図に相当する円環のうえに位置づけられる。

参考  音の高さ、トーン・クロマ

旋律  melody
さまざまな音の高さおよび時間長を持ついくつかの音が、時間方向にひとつながりになることによって生ずる形。メロディーともいう。旋律は必ず何らかのリズムを伴う。旋律を構成する音には、一つの音階に含まれる音が優先的に選ばれることが多い。このような音の持つトーン・クロマの相互関係、旋律輪郭、旋律のなすリズムなどが、旋律がどのように聴こえるかを規定する。旋律を構成する音を全て同じ音程だけ上または下にずらしても、同じ旋律であることが容易に判る。すなわち、旋律は絶対的な音の高さに依存せず、移調されても旋律の本質は失われない。この事実はゲシュタルト心理学が生まれるきっかけとなったものである。

参考  旋律輪郭、リズム

旋律輪郭  melodic contour
旋律を構成する音を初めから一つずつ順番に辿るときに現れる、音の高さの上昇、下降、無変化のパターン。旋律の違いを聴き分けたり、よく知っている旋律を認知したり、旋律を記憶したりする際に、重要な手掛かりになることが知られている。

参考 旋律

調性的階層  tonal hierarchy
調性のある音楽的文脈においては、半音階を構成する12のトーン・クロマが同等の重みを持つわけではなく、主音や属音のように、安定感を与え、音楽の枠組みを作るトーン・クロマもあれば、調の音階に属せず経過的にしか出現しないトーン・クロマもある。このようなトーン・クロマの階層関係を調性的階層と呼ぶ。例えばハ長調の文脈では、Cに一番の重みが与えられ、G、Eがそれに次ぐ。その次に、音階を構成するそれ以外のトーン・クロマが続き、音階に含まれないトーン・クロマが最後に残される。このように階層に分かれる様子は調によって異なるので、これを利用して24の長調、短調がお互いにどのような位置関係にあるかを地図のような形で表すことが可能になる。調性的階層において重みを持つトーン・クロマは、実際の音楽において、出現頻度が高く、総持続時間が長い傾向があり、旋律、リズムの重要な位置を占めることが多い。

参考 調性

聴覚の錯覚  auditory illusions
呈示された音の物理的な性質と主観的な性質とのあいだに、明らかなくい違いが相当な頻度で生じ、かつ、その知覚現象が、聴覚システムの能力に限界のあることや、物理量と主観量とが比例しないこと、などの理由では簡単に説明できないとき、これを聴覚の錯覚と呼ぶ。「オクターブ錯覚」が典型的な例である。また、音を聴いているうちに、現実にありえない音を聴いているような奇妙な印象を生ずるとき、この現象をも聴覚の錯覚ということが多い。「無限音階」の現象がその例である。しかし、後の場合に関して、視覚の分野において対応する概念を求めるならば、錯覚よりは不可能図形が適切であろう。聴覚の錯覚には、20世紀の後半以降に発見されたものが多く、現在も、鮮やかなものが発見されつつある。聴覚の錯覚が研究者の注目を集めるのは、視覚の錯覚(錯視)の場合と同じように、知覚システムが一見間違ったふるまいを見せる際に、その基本的な仕組みを探るうえで有用な情報が得られるからである。

オクターブ錯覚 octave illusion
1オクターブ離れた二つの音を、左右の耳に、位置を交替しながら分離呈示し続けるときに、音の高さと位置とが、呈示内容と体系的にくい違って知覚される現象。D.ドイチュ(D. Deutsch)が発見した。この錯覚を生ずるための音の呈示方法を以下に説明する。ある音の高さ(例えばG4)に対応する 200〜300 ミリ秒程度の音(多くの場合純音)をヘッドホンで左耳に呈示し、それと同時に1オクターブ上(例ではG5)に当たる周波数の高い音を右耳に呈示する。その直後に、左右の音を入れ替えて呈示し、以降、同様に左右交替の呈示を続ける。このような音を聴く際に、音の高さと方向とが、呈示された通りには聴こえないことが一般的である。かなり多くの聴取者が、「右側の高い音」と「左側の低い音」とがこの順で交替するような知覚内容を得る。知覚内容における音の高低が、右耳に呈示される音によって決定され、音の方向が、周波数の高いほうの音が左右いずれの耳に呈示されるかによって決定されると考えれば、この現象を理解することができる。

オクターブ伸長現象 octave stretch phenomenon
1オクターブであると感ぜられる音程は、物理的には、1オクターブであると定められる1:2の周波数比率よりも、わずかに広がった(1:1から離れた)周波数比率に対応づけられることが多い。この現象をいう。「オクターブ」という単位は、もともと音楽における音程(音の高さの距離)を表すもので、1オクターブ離れた音は同じ音名を持ち、音楽上の役割も似ている。1オクターブ、またはその整数倍だけ離れた音は、知覚のうえで類似した面を持っており、この類似性を担う主観的な性質はトーン・クロマと呼ばれる。一方、物理的な音の周波数に関しては、周波数が1:2の比率で離れているとき、その距離を1オクターブと定義する。このように、「オクターブ」という単位が異なった意味に用いられている。そのあいだのくい違いに気付かずにすむ場合も多いが、楽器の調律や精密な知覚実験においては、上述のような体系的なずれが見出されるので、これをオクターブ伸長現象という言葉で表す。

音階錯覚  scale illusion
音階の上昇形と下降形とを左右の耳に振り分け、一音符ごとに左右交替する形で呈示するときに、高い音どうし、低い音どうしがそれぞれ音脈をなし、音脈ごとに左右に分かれて聴こえる現象。D.ドイチュ(D. Deutsch)が発見した。典型的な例では、ハ長調の中央の1オクターブ分を用い、1秒あたり4音の割合で、ヘッドホンの左側から始めて左右交替の形で「ドレミファソラシド’」(「ド’」は「ド」の1オクターブ上の音を示す。)と音階の上昇形を呈示し、これと同時に、右側から始めて左右交替の形で「ド’シラソファミレド」と下降形を呈示する。そうすると、高い音からなる「ド’シラソ^ソラシド’」(「^」はタイを示す。)というメロディーが、例えば左側から聴こえ、低い音からなる「ドレミファ^ファミレド」というメロディーが逆の側から聴こえる。多くの聴取者について、このように高音部と低音部とのメロディーが左右に分かれて聴こえるような知覚内容が生ずる。左右のどちらに、高音部あるいは低音部が割り当てられるかは、聴取者によって異なるが、左右それぞれの耳に最初にどの音が呈示されるかにはよらない。音階錯覚は、周波数近接の原理の重要性を示すなど、音脈形成に関する理解を深める手がかりとなる現象である。

無限音階 circularity in relative pitch judgments; endlessly ascending/descending scale
ある種の複合音列を、くり返して呈示するとき、相当長いあいだ、トーン・ハイト(音色的高さ)が殆ど変わらないまま、音の高さが、上昇しつづけたり、下降しつづけたりするように聴こえることがある。この知覚現象、あるいはそれを生ずる刺激音の組み合わせのこと。シェパード(R. N. Shepard)が発表した。この現象を得るには、スペクトル包絡を固定したまま、多数の成分音を同時に上昇させるか、あるいは下降させる。このことにより、理髪店の縞模様の表示がいつまでも上昇するように知覚されることになぞらえられるような知覚が生ずる。このような知覚内容が、呈示の一周期分よりも充分に長いあいだ続くのでなければ、無限音階と呼ぶことはできない。多くの場合、トーン・ハイトがいつまでも元のあたりに留まっていることから、音の高さの上昇あるいは下降を長く聴き続けていると、不可能図形を見るときのような違和感が生じてくる。また、上昇しつづけていた音の高さが突然落ちこんだり、逆に下降しつづけていた音の高さが突然はね上がったりすることもある。無限音階は、音の高さが知覚される仕組みに関する理解を深めるものとして注目されている。

シェパード・トーン Shepard tones
無限音階を生ずる典型的な複合音の組、あるいはその組の構成要素である複合音。複合音のいずれも、低周波側と高周波側とが裾を引くように弱まるような、10 オクターブ程度にわたるスペクトル包絡を有する。このスペクトル包絡の全域にわたって、成分音が1オクターブ間隔で並ぶ。スペクトル包絡を固定したまま、成分音が同時に半音程度の幅で上昇/下降してゆくようにすると、上昇/下降の無限音階が生ずる。このときの複合音の組が、シェパード・トーンである。物理的には、成分音が1オクターブ上昇/下降すると、元の音に戻ってくるはずであるが、条件を整えれば、音の高さの上昇/下降が続くように知覚される。スペクトルの下端/上端における、成分音の出現、消失が検出されてしまうと、無限音階の印象を生じにくいので、スペクトル包絡の両端の形状を工夫する必要がある。なお、一組のシェパード・トーンについては、一つひとつの複合音が明確に異なったトーン・クロマを持ち、トーン・ハイトにおいてはあまり変わらないので、音の高さの二面であるトーン・ハイト、トーン・クロマのうち、後者のみを変化させるような実験に、好都合な素材が得られる。

3全音パラドックス  tritone paradox
シェパード・トーンにおいて、3全音(半オクターブ)離れた音のあいだに、比較的安定した形で、音の高さの違いが知覚される現象。D.ドイチュ(D. Deutsch)が発見した。半音間隔のシェパード・トーンにおいては、12のピッチ・クラス(トーン・クロマ)が、半音のサークル(ピッチ・クラスが半音ずつ変化する様子を示す円周)に位置づけられ、2つの音が継時的に呈示される場合には、ピッチ・クラスが半音のサークルを、どちらの向きに回転するかによって、音の高さが上昇するか、下降するかが決定されると、教科書的には考えられる。この考えかたのみによるならば、半音のサークルの反対側に位置づけられる2つの音、すなわち、3全音離れた2つの音の高低関係は、明確には決定されないことになる。ところが実際には、高低関係が安定して知覚されることが多い。ただし、どのような音の組み合わせに対して、どのような高低関係が知覚されるかは、聴取者によって異なることが報告されている。それぞれのピッチ・クラスが各聴取者において絶対的な高低を持っていると言うのがドイチュの解釈であり、例を挙げるならば、半音のサークルのGの側が高くなる場合や、その反対側のC#の側が高くなる場合などが生ずるとされる。

自発テンポ Spontaneous tempo
特にテンポを指定されず、テーブルを指先で叩くような動作を反復するとき、個人ごとにほぼ定まったテンポが現れる。このテンポのこと。指先で叩く動作の場合、そのテンポは、打叩間の(打叩によって指とテーブルなどが接触してから、再び離れて次に接触するまでの)時間間隔であらわすと、600 ms 程度になるが、相当な個人差がある。

嗜好テンポ  Preferred tempo
メトロノームなどで反復される音や光に対して、速すぎず、遅すぎず、自然であると感ずる際のテンポのこと。刺激間の(音や光の始まりから始まりまでの)時間間隔で表すと、500 ms 程度になるが、相当な個人差がある。

音脈分凝  Auditory stream segregation
広義には、音が2つ以上の時間的なつながり、すなわち音脈に分かれて聴こえること。打ち寄せる波の音と、漁船のエンジン音と、カモメの鳴き声とを、別々のつながりとして聴くことがその例である。音の高さや音色の異なる2つの音A、Bを、時間的に交替させて、ABABAB...と鳴らすと、A.A.A....というつながりと、B.B.B....というつながりとに分かれて聴こえることがある。狭義には、この現象、あるいは類似の現象を音脈分凝と言う。広義の音脈分凝は、聴覚における体制化の根本をなすものであり、視覚における図と地の分化になぞらえることができる。しかし、それまで背景にあった音が、「図」のように浮かび上がるような場合にも、「図地反転」の場合のように、それまでの知覚内容と相容れないような知覚内容が突然現れるのではなく、音脈の継続性の保たれることが多い。上記の例では、聴取者がカモメの鳴き声に注目しているあいだ、知覚のうえでは背景にあった漁船のエンジン音が、一転して前面に浮かび上がるような場合、それまで背景にあった漁船のエンジン音が引き続いて前面に聴こえるとの印象を得ることが多い。

音の同時的統合 Integration of simultaneous auditory components
同時に現れる音の成分が、統合されて一つの音として知覚されること。成分音の調波性、周波数の近接、始まり、終わりが同時であること、共通の振幅変調がかかっていること、などの要因により、このような知覚的統合が生ずる。一旦統合が生ずると、一つひとつの成分音が別個のものとして知覚されることはなくなることが多い。なお、「統合」の代わりに「群化」の語が用いられることも多いが、成分音が知覚的に融合して一つひとつが区別されないような場合にも、「群化」の語を用いるのは、適切ではない。

時間縮小錯覚  Time-shrinking
短音で示された2つの空虚時間P、Sがこの順で隣接し、Sのほうが物理的に長いとき、Sの長さが過小評価されることがある。この錯覚現象のこと。中島祥好とG・テン・ホーペン(G. ten Hoopen)が発見した。典型的な例として、数ミリ秒程度の短音によって、P、Sが示され、Pが 200 ms 以下で、SがPよりも 50〜90 ms 長い場合、Sが(単独で示された場合に比べて)数十ミリ秒程度過小評価される。類似の現象が、視覚においても報告されている。リズム知覚の仕組みを理解するための手がかりになりうる錯覚現象である。