ギャラリー

局部時間反転音声

音声を録音して,逆再生すると,ちんぷんかんぷんになります。
逆再生音声の例 クリックすると再生できます。原音声: 原音声を再生。

しかし,音声を短い区間に区切り,それぞれを逆再生する,つまり局部的に時間を反転させると聴き取れるようになります。これが局部時間反転音声です(区間長が長いとやはり聴き取れません)。
反転区間長を 170 ms とした例:ここをクリック, 70 ms とした例:ここをクリック, 20 ms とした例:ここをクリック

このようなことが起こるのは,我々の脳が常に「もっともらしい答え」を探しながら音声を聴いているためです。

原音声は NTT-AT 多言語音声データベース 2002 の一部を使用しています。

関連する業績

  • Ueda, K., and Matsuo, I. (2021). Intelligibility of chimeric locally time-reversed speech: Relative contribution of four frequency bands. JASA Express Letters 1(6), 065201, doi: 10.1121/10.0005439
  • Ueda, K., and Ciocca, V. (2021). Perceptual restoration of interrupted locally time-reversed speech: Effects of segment duration and noise levels. Attention, Perception, & Psychophysics, 1-7, doi: 10.3758/s13414-021-02292-3
  • Matsuo, I., Ueda, K., and Nakajima, Y. (2020). Intelligibility of chimeric locally time-reversed speech, The Journal of the Acoustical Society of America Express Letters, 147, EL523-EL528. https://doi.org/10.1121/10.0001414
  • Kazuo Ueda, Yoshitaka Nakajima, Wolfgang Ellermeier, and Florian Kattner. (2017). Intelligibility of locally time-reversed speech: A multilingual comparison, Scientific Reports, 7: 1782, doi:10.1038/s41598-017-01831-z.

雑音駆動音声

自然な音声には,比較的ゆっくりとした声帯音源のパワー変化および声道の動き(振幅包絡)の情報と,声帯の振動による速い動き(時間微細構造)の情報の両方が含まれています。雑音駆動音声は音源を雑音に置き換え,いくつかの周波数帯域の振幅包絡だけを保存した合成音声です。雑音駆動音声では,4 帯域以上の振幅包絡情報があれば,音声を知覚することができます。

4 帯域雑音駆動音声の例:ここをクリック; 20 帯域の例:ここをクリック; 原音声: ここをクリック.

原音声は NTT-AT 多言語音声データベース 2002 の一部を使用しています。

関連する業績

  • Ueda, K., Araki, T., and Nakajima, Y. (2018). Frequency specificity of amplitude envelope patterns in noise-vocoded speech, Hearing Research, 367, 169-181 https://doi.org/10.1016/j.heares.2018.06.005.
  • Nakajima, Y., Matsuda, M., Ueda, K., and Remijn, G. B. (2018). Temporal resolution needed for auditory communication: Measurement with mosaic speech, Frontiers in Human Neuroscience, 12(149). doi:10.3389/fnhum.2018.00149
  • Takuya Kishida, Yoshitaka Nakajima, Kazuo Ueda, and Gerard B. Remijn. (2016). Three factors are critical in order to synthesize intelligible noise-vocoded Japanese speech, Frontiers in Psychology, 7, 517; doi: 10.3389/fpsyg.2016.00517.
  • Wolfgang Ellermeier, Florian Kattner, Kazuo Ueda, Kana Doumoto, and Yoshitaka Nakajima. (2015). “Memory disruption by irrelevant noise-vocoded speech: Effects of native language and the number of frequency bands,” the Journal of the Acoustical Society of America, 138, 1561–1569 [http://dx.doi.org/10.1121/1.4928954].

多言語音声の多変量解析

自然な音声に含まれている比較的ゆっくりとした声道の動き(振幅包絡)の情報に注目し,音声が聴覚末梢系で周波数分析された後の音声のパワー変動を変量とした多変量解析(因子分析)を行うことができます。このような分析から,多言語に共通する 3 因子と 4 周波数帯域を導き出しました。

関連する業績

  • Ueda, K., and Matsuo, I. (2021). Intelligibility of chimeric locally time-reversed speech: Relative contribution of four frequency bands. JASA Express Letters 1(6), 065201, doi: 10.1121/10.0005439
  • Matsuo, I., Ueda, K., and Nakajima, Y. (2020). Intelligibility of chimeric locally time-reversed speech, The Journal of the Acoustical Society of America Express Letters, 147, EL523-EL528. https://doi.org/10.1121/10.0001414
  • Ueda, K., Araki, T., and Nakajima, Y. (2018). Frequency specificity of amplitude envelope patterns in noise-vocoded speech, Hearing Research, 367, 169-181 https://doi.org/10.1016/j.heares.2018.06.005.
  • Yoshitaka Nakajima, Kazuo Ueda, Shota Fujimaru, Hirotoshi Motomura, and Yuki Ohsaka. (2017). English phonology and an acoustic language universal, Scientific Reports, 7, 46049; doi: 10.1038/srep46049.
  • Kazuo Ueda and Yoshitaka Nakajima. (2017). An acoustic key to eight languages/dialects: Factor analyses of critical-band-filtered speech, Scientific Reports, 7, 42468; doi: 10.1038/srep42468.
  • Takuya Kishida, Yoshitaka Nakajima, Kazuo Ueda, and Gerard B. Remijn. (2016). “Three factors are critical in order to synthesize intelligible noise-vocoded Japanese speech,” Frontiers in Psychology, 7, 517; doi: 10.3389/fpsyg.2016.00517.
  • Wolfgang Ellermeier, Florian Kattner, Kazuo Ueda, Kana Doumoto, and Yoshitaka Nakajima. (2015). “Memory disruption by irrelevant noise-vocoded speech: Effects of native language and the number of frequency bands,” the Journal of the Acoustical Society of America, 138, 1561–1569 [http://dx.doi.org/10.1121/1.4928954].
  • Yuko Yamashita, Yoshitaka Nakajima, Kazuo Ueda, Yohko Shimada, David Hirsh, Takeharu Seno, and Benjamin Alexander Smith. (2013). Acoustic analyses of speech sounds and rhythms in Japanese- and English-learning infants. Frontiers in Psychology 4, 1–10 [https://doi.org/10.3389/fpsyg.2013.00057].

無関連音効果

視覚呈示された系列再生課題(たとえばランダムな数字の列を記憶し,再生する)を行うときに,課題とは無関係な音(特に音声)を呈示すると,「音は無視するように」教示されていても,大幅に成績が低下する現象が見られます。この効果が無関連音効果と呼ばれるものです。なぜ,音声がこのような顕著な妨害効果をもたらすのかを調べています。

関連する業績

  • Ueda, K., Nakajima, Y., Kattner, F., and Ellermeier, W. (2019). Irrelevant speech effects with locally time-reversed speech: Native vs. non-native language, the Journal of the Acoustical Soceity of America, 145, 3686-3694 [https://doi.org/10.1121/1.5112774]. [PDF]
  • Ellermeier, W., Kattner, F., Ueda, K., Doumoto, K., and Nakajima, Y.. (2015). “Memory disruption by irrelevant noise-vocoded speech: Effects of native language and the number of frequency bands,” the Journal of the Acoustical Society of America, 138, 1561–1569 [http://dx.doi.org/10.1121/1.4928954].

有用な情報

  • Ellermeier, W. and Zimmer, K. (2014). "The psychoacoustics of the irrelevant sound effect," Acoustical Science and Technology, 35, 10-16 [https://www.jstage.jst.go.jp/article/ast/35/1/35_E141002/_article].【邦訳】ヴォルフガング・エレマイアー,カリン・ツィマー 著,上田和夫 訳. (2013). "無関連音効果の音響心理学," 日本音響学会誌, 69, 638-648.
  • 日本音響学会 編. (2016). 音響キーワードブック, "無関連音効果," 上田和夫, 410-411(東京:コロナ社).

著書,資料

著書,訳書の一部

item20

perception beauty bioacoustics item9 item8 Owl Moore

資料

  • 心理学とは何か:「福祉社会と心理学」中瀬惇,上田和夫 (2000). [PDF] (129 kB)
  • 科学とは何か:「科学と疑似科学,心理学と疑似心理学,治療と疑似治療:音楽療法の評価」上田和夫 (1997). [PDF] (460 kB)