Nociones básicas de psicoacústica
Límites del campo de la audición humano:
Campo de la audición humano.
Pujol, R. (2018, 6 de junio). Campo auditivo humano. Viaje al mundo de la audición. http://cochlea.ligams.com/es/sonidos/campo-auditivo-humano
Presión sonora necesaria para que el oído perciba un sonido.
Depende de la frecuencia.
Mayor sensibilidad entre 1 000 – 2 000 y 5 000 Hz.
Referencia: umbral de una frecuencia de 1 000 Hz.
Umbral de la audición típico de un adulto joven.
Ainsworth, W. A. (1976). Mechanisms of speech recognition. Pergamon Press. https://doi.org/10.1016/C2013-0-02741-7
Evolución a lo largo de la vida del audiograma tonal.
Ruel, J., Trigueiros-Cunha, N. y Puel, J.-L. (2016, 27 de diciembre). Exploración funcional. Viaje al mundo de la audición. http://www.cochlea.eu/es/exploracion-funcional
Intensidad sonora a partir de la que se produce la sensación de dolor.
Escala de intensidades sonoras.
Camilleri, M. y Ducourneau, J. (2017, 6 de enero). Ruido ¡Atención peligro! Viaje al mundo de la audición. http://www.cochlea.org/es/ruido
Propuesta por Ernst Heinrich Weber (1795–1878) y elaborada por Gustav Theodor Fechner (1801–1887).
Formulación simplificada: cuando el estímulo crece en progresión aritmética, la sensación crece en progresión geométrica.
El correlato perceptivo de la frecuencia fundamental (f0) es la altura tonal, tono o tonía (en inglés, pitch).
En función de su altura tonal (tono, pitch) un sonido se percibe como más grave (frecuencia fundamental baja) o más agudo (frecuencia fundamental alta).
Octava: intervalo entre una frecuencia y el doble de ésta.
Mel: unidad no lineal que relaciona frecuencia y altura tonal.
Relación entre la frecuencia (en Hz) y la altura tonal (en Mels).
Ainsworth, W. A. (1976). Mechanisms of speech recognition. Pergamon Press. https://doi.org/10.1016/C2013-0-02741-7
El correlato perceptivo de la amplitud es la intensidad, sonía (en inglés, loudness) o intensidad sonora subjetiva.
En función de su intensidad un sonido se percibe como más fuerte (intensidad elevada) o más flojo (intensidad baja).
Presión acústica o presión sonora: milibara, dina/cm2, Pascal (Pa).
Potencia acústica o potencia sonora: energía por unidad de tiempo: Watt.
Intensidad acústica o intensidad sonora: potencia por unidad de superficie: Watt/cm2.
Decibelio (Decibel, dB): unidad logarítmica de medida de la intensidad.
Decibelios relativos: diferencia entre dos sonidos.
Decibelios absolutos (SL, sound level): diferencia respecto al umbral de audibilidad.
Intensidad de una onda sonora compuesta: resultado de la combinación de la intensidad sonora de cada uno de sus componentes.
Sonio (Sone): unidad de medida de la sonía definida con respecto a un tono de referencia. Un tono de referencia de 1000 Hz a una intensidad de 40 dB tiene una sonía de 1 sonio; un sonido que se perciba con una sonía (una intensidad subjetiva) dos veces mayor, tendrá una sonía de 2 sonios.
Fonio (Phon): unidad de medida del nivel de sonía para la comparación de la sonía de sonidos de frecuencia diferente. Un tono de referencia de 1000 Hz con una intensidad de 40 dB tiene un nivel de sonía de 40 fonios; un tono de cualquier otra frecuencia, pero que se perciba con el mismo nivel de sonía (de intensidad subjetiva) que el de referencia, tendrá también un nivel de sonía de 40 fonios.
Sociedad Española de Acústica. (2012). Glosario de términos acústicos. http://www.sea-acustica.es/fileadmin/Libros/Glosario_de_terminos_acusticos.pdf
Relación entre la sonía (en sonios) y la intensidad acústica en un tono de 1000 Hz.
Ainsworth, W. A. (1976). Mechanisms of speech recognition. Pergamon Press. https://doi.org/10.1016/C2013-0-02741-7
La percepción del timbre (en inglés, quality) de un sonido viene dada por las características de su espectro.
En función de su timbre un sonido se percibe como más claro (predominio de las frecuencias altas) o más oscuro (predominio de las frecuencias bajas).
❯ Clasificación de las vocales del español en función del timbre
❯ Clasificación de las consonantes del español en función del timbre
Enmascaramiento: proceso por el cual el umbral de audibilidad de un sonido se eleva debido a la presencia de otro sonido.
Banda crítica: distancia (amplitud de banda) que separa dos tonos en el interior de la cual se produce el enmascaramiento; cuando se pasa de una banda crítca a otra, se produce un cambio en la respuesta auditiva, por lo que las bandas críticas se relacionan con la resolución frecuencial del sistema auditivo.
Bark: unidad empleada para la división (del 1 al 24) en bandas críticas auditivas; a una distancia igual en Barks le corresponde una misma distancia perceptiva.
División en bandas críticas.
Zwicker, E. (1961). Subdivision of the audible frequency range into critical bands (Frequenzgruppen). The Journal of the Acoustical Society of America, 33(2), 248. https://doi.org/10.1121/1.1908630
La banda crítica depende de la frecuencia: mayor sensibilidad a los cambios frecuenciales en frecuencias bajas que en las altas.
1.000 Hz – Banda crítica de 200 Hz
10.000 Hz – Banda crítica de 1.000 Hz.
Bandas críticas en función de la frecuencia en el centro de la banda.
Lieberman, P. y Blumstein, S. E. (1988). Speech physiology, speech perception and acoustic phonetics. Cambridge University Press. https://doi.org/10.1017/CBO9781139165952
El correlato perceptivo del tiempo es la duración o cantidad (en inglés, length o quantity).
Según su duración un sonido se percibe como más largo o más breve.
❯ Correlatos acústicos, articulatorios y perceptivos de los elementos segmentales
El función de su altura tonal (en inglés, pitch) un sonido se percibe como más grave o más agudo.
Umbral diferencial: mínima diferencia de frecuencia que permite distinguir dos sonidos por su altura tonal.
En función de su intensidad (en inglés, loudness) un sonido se percibe como más fuerte o más flojo.
Umbral diferencial: mínimo cambio en la intensidad de un sonido que puede ser detectado por el oído.
En la gama 100 – 4 000 Hz:
En la gama 100 – 4 000 Hz:
En función de su duración un sonido se percibe como más largo o más breve.
Umbral diferencial: mínimo cambio de duración de un sonido que puede ser distinguido por el oído.
Normalización de las diferencias entre vocales producidas por dos hablantes de distinto sexo mediante un modelo auditivo.
Diferencias en las características acústicas de una misma vocal [y] producida por un hablante masculino y un hablante femenino.
Bladon, A. (1985). Acoustic phonetics, auditory phonetics, speaker sex and speech recognition: a thread. En F. Fallside y W. A. Woods (Eds.), Computer speech processing (pp. 29–40). Prentice Hall.
Transformación del espectro considerando que:
Conversión de Hz a Barks (anchura de una banda crítica auditiva).
Filtrado del espectro en Barks teniendo en cuenta factores psicoacústicos (enmascaramiento) y la curva de respuesta de las fibras del nervio auditivo.
Este filtrado produce la desaparición de los formantes altos enmascarados por F2.
Conversión de dB en Fonos mediante curvas isófonas y conversión a Sonos/Bark.
Obtención de espectros «pseudo-auditivos» que representan un modelo de los patrones de excitación del nervio auditivo.
Etapas en la transformación acústico-auditiva del espectro de una vocal.
Bladon, A. (1985). Acoustic phonetics, auditory phonetics, speaker sex and speech recognition: a thread. En F. Fallside y W. A. Woods (Eds.), Computer speech processing (pp. 29–40). Prentice Hall.
Desplazando 1 Bark el «espectro auditivo» de una vocal pronunciada por un hablante femenino se obtiene una coincidencia en el patrón de «formantes» con el espectro de la misma vocal pronunciada por un hablante masculino, con lo que se lleva a cabo una normalización.
Resultado de la normalización de las vocales.
Bladon, A. (1985). Acoustic phonetics, auditory phonetics, speaker sex and speech recognition: a thread. En F. Fallside y W. A. Woods (Eds.), Computer speech processing (pp. 29–40). Prentice Hall.