La comparación entre muestras de habla en el contexto judicial
Hablante conocido: grabación indubitada
El problema: ¿se trata de la misma voz en la grabación dubitada y en la grabación indubitada?
El resultado: el sospechoso se identifica como el culpable si se demuestra que las dos grabaciones corresponden a la misma voz
Implica el estudio de
❯ La variación fonética en el nivel acústico
La identificación del hablante requiere evaluar si las diferencias entre muestras de habla se deben a la variación intralocutor o a la variación interlocutorLa variación interlocutor debe ser mayor que la variación intralocutor
Parámetros fonéticos acústicos
Parámetros acústicos cuantificables automáticamenteParámetros lingüísticos
Variación geográfica, social y de estiloParámetros paralingüísticos
BATTANER, E.- GIL, J.- MARRERO, V.- LLISTERRI, J.- CARB, C.- MACHUCA, M.J.- de la MOTA, C. - ROS, A. (2003) "VILE: Estudio acústico de la variación inter e intralocutor en español", in SEAF 2003. Actas del II Congreso de la Sociedad Española de Acústica Forense. Barcelona, 10 y 11 de abril de 2003. Barcelona: SEAF, Sociedad Española de Acústica Forense. pp. 59-70.
VILE, Estudio acústico y perceptivo de la variación inter e intralocutor en español
Contorno tonal
Forma de la onda glotal
Fluctuación de la f0
LTAS (Long Term Averaged Spectrum)
Sonidos turbulentos y consonantes nasales
Efectos coarticulatorios (vocales, nasales y líquidas)
Proporción de habla y de silencios
Velocidad del habla
Prioridad del LTAS
Prioridad de la estructura espectral: frecuencias formánticas absolutas o trayectorias formánticas F1, F2 y F3, y distancias entre F1-F2 y F2-F3
Información localizada entre los 2.5 kHz y los 3.5 kHz
Misma prioridad para la f0 y la estructura formántica
Variables temporales
Contorno tonal
La importancia de cada parámetro puede diferir
Falta de resultados coincidentes y concluyentes sobre el parámetro más decisivo para el reconocimiento del hablante
Dificultad de establecer una jerarquía absoluta entre los parámetros
Interdependencia entre los índices
Prioridad relativa dependiente del hablante
Número muy variable de locutores en los experimentos realizados: entre 8 y 40 voces distintas
NOLAN, F. (1983) The Phonetic Bases of Speaker Recognition. Cambridge: Cambridge University Press. p. 11.
Elevada variabilidad entre locutores y baja variabilidad en el mismo locutorResistente a los intentos de imitación o de cambiar la voz
Elevada frecuencia de aparición en las muestras disponibles
Robusto frente a las distorsiones de la transmisión
Relativamente fácil de extraer y de medir
ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 52.
Cada parámetro debe de mantener la máxima independencia respecto a los demás parámetros
Valores medios de f0 en tres locutores
ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 11.
Valores medios de una dimensión acústica en tres locutores
ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 12.
Establecimiento de umbrales que permitan establecer probabilidadesProbabilidad de observar una diferencia entre los valores de un determinado parámetro si corresponden a un mismo locutor
Probabilidad de observar una diferencia entre los valores de un determinado parámetro si corresponden a dos locutores diferentes
Valores medios de una dimensión acústica en tres locutores
ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 12.
Locutor DM: 1399Hz - 1723 Hz
Locutor MD: 1351 Hz - 1799 Hz
Locutor RS: 1244 Hz - 1406 Hz
Umbral de 150 Hz
Diferencias de más de 150Hz: locutores diferentes
Diferencias de menos de 150Hz: mismo locutor
Diferencia entre el valor máximo y mínimo de RS: dos locutores diferentes!
Diferencia entre el valor máximo de RS y el mínimo de DM: mismo locutor!
El umbral de 150Hz permite discriminar correctamente un 60% de los pares de comparaciones de valores posibles entre locutores y en un mismo locutor
Si los valores difieren en menos de 150Hz hay un 60% (1,5 veces) de probabilidades de que correspondan al mismo locutor
Si los valores difieren en más de 150Hz hay un 60% (1,5 veces) de probabilidades de que correspondan a dos locutores diferentes
ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. pp. 12-14.
La comparación se lleva a cabo considerando diversos parámetros
Valores medios de dos dimensions acústicas en tres locutores
ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 15.
La introducción de un nuevo parámetro permite discriminar el 70% de los posibles pares de valores
ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 15.
Valores medios de tres dimensions acústicas en tres locutores
ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 17.
Multidimensionalidad en la comparación entre muestras de habla
ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 23.
Si los valores están correlacionados no aumenta la capacidad de discriminaciónNo todos los parámetros o dimensiones tienen la misma capacidad de discriminación
Los parámetros más relevantes son los que presentan mayor variación entre locutores que en un mismo locutor
Condicionantes de la situación en la que se producen las muestras
Reducción de los parámetros disponibles para la comparación
Canal de transmisión (teléfono)
Sistema de grabación de las muestras dubitadas y de las indubitadas
Número de parámetros que pueden compararse
Número de observaciones que pueden realizarse para cada parámetro
til en la selección de parámetros acústicos que se toman en consideración
Centrado en el análisis de la variación alofónica y de la cualidad de la voz (voice quality)
Efecto de la formación y del tiempo entre la toma de muestras del mismo locutor en la identificación de voces
HOLLIEN, H. (2002) Forensic Voice Identification. San Diego: Academic Press. p. 35.
Efecto del tiempo entre la toma de muestras (4 semanas) del mismo locutor en la identificación de voces similares
HOLLIEN, H. (2002) Forensic Voice Identification. San Diego: Academic Press. p. 35.
Factores que inciden en la identificación de voces
N: habla normal; S: habla producida en condiciones de estrés; D: habla intentando “disfrazar” la voz
A: sujetos que conocían muy bien al locutor
B: sujetos que no conocían al locutor pero entrenados para reconocer las voces
C: sujetos entrenados pero que no conocen ni el locutor ni la lengua
HOLLIEN, H. (2002) Forensic Voice Identification. San Diego: Academic Press. p. 35.
HOLLIEN, H. (2002) Forensic Voice Identification. San Diego: Academic Press. pp. 59 ss.
Tono: nivel general, variabilidad y patrones tonalesArticulación: producción idiosincrática de elementos segmentales
Cualidad general de la voz
Prosodia: velocidad de habla y fluidez melódica
Intensidad vocal: variabilidad
Carácterísticas del habla: variante geográfica, acento lingüístico, coarticulación, patologías
Requiere la normalización de valores
Centrado en los parámetros que presentan un menor grado de variación intralocutor
Basado en el conocimiento de los indicios acústicos de cada clase de sonidos
Dos voces pueden parecer auditivamente similares y presentar diferencias acústicas significativas
Dos hablantes con las mismas características acústicas pueden diferir en ciertos rasgos lingüísticos
En la mayoría de los casos se estima la probabilidad de observar las diferencias que se encuentran entre muestras de habla
ROSE, P. (2002) Forensic Speaker Identification. London: Taylor & Francis. p. 285.