La segmentación y el etiquetado de corpus mediante Praat



La segmentación y el etiquetado (o transcripción) de una señal de habla

La segmentación es un proceso mediante el que se determinan y marcan los límites entre las unidades en las que se analiza una señal de habla. En el etiquetado (o transcripción) se incorpora la descripción de cada unidad, habitualmente mediante símbolos del Alfabeto Fonético Internacional en el caso de los estudios fonéticos. En el programa Praat, la información sobre la segmentación y el etiquetado se almacenan en un documento de texto denominado TextGrid.

Un etiquetado (o transcripción) puede realizarse en distintos niveles, según la información que se desee representar. Cada nivel corresponde a un componente del TextGrid llamado Tier.

En el ejemplo que se presenta a continuación, se muestran la forma de onda, el espectrograma con la curva melódica y la curva de intensidad superpuestas, y un TextGrid con un único nivel de etiquetado (o transcripción), representado en un Tier denominado «segmentos», en el que se etiquetan (o transcriben) cada uno de los segmentos (vocales y consonantes) del enunciado.

Segmentación y etiquetado (transcripción) del enunciado pero cuanto más soplaba realizados mediante el programa Praat

Segmentación y etiquetado (transcripción) del enunciado pero cuanto más soplaba realizados mediante el programa Praat. En el Tier «segmentos» se transcriben cada uno de los segmentos (vocales y consonantes) del enunciado.

En el ejemplo siguiente se muestran la forma de onda, el espectrograma con la curva melódica y la curva de intensidad superpuestas, y un TextGrid con tres niveles de etiquetado (o transcripción) representados en tres Tier denominados «segmentos», «sílabas» y «palabras».

Segmentación y etiquetado (transcripción) del enunciado pero cuanto más soplaba realizados mediante el programa Praat

Segmentación y etiquetado (transcripción) del enunciado pero cuanto más soplaba realizados mediante el programa Praat. En el Tier «segmentos» se transcriben cada uno de los segmentos (vocales y consonantes) del enunciado, en el Tier «sílabas» se delimitan y transcriben las sílabas y en el Tier «palabras» se delimitan y transcriben las palabras.

tornar al principi

Creación de un TextGrid

Una vez abierto el fichero que se desea segmentar y etiquetar (o transcribir), se selecciona este fichero en la ventana Objects y se elige el menú Annotate.

Etiquetado Praat

En el menú Annotate se selecciona la opción To TextGrid…

Etiquetado Praat

Al seleccionar esta opción, se abre una nueva ventana Sound: To TextGrid.

Etiquetado Praat

En el recuadro correspondiente a All tier names se escriben los nombres de los niveles en los que se desee etiquetar (o transcribir) el enunciado, es decir, los nombres de los Tier (por ejemplo, «segmento», «palabra», etc.), reemplazando el texto «Mary John bell» que aparece por defecto.

En el recuadro Which of these are point tiers? se indican los niveles (Tiers) en los que se introducirá una etiqueta en un punto concreto en el tiempo (por ejemplo, un símbolo como H o L, correspondiente a la altura tonal). Si únicamente se introducirán etiquetas (símbolos fonéticos o una representación ortográfica) entre las fronteras que marcan el principio y el final de cada unidad —es decir, entre las marcas de segmentación—, debe dejarse este recuadro en blanco, borrando la palabra «bell».

Mediante el ejemplo que se muestra a continuación, se obtendría un TextGrid con un único nivel de etiquetado (o transcripción), es decir, un único Tier, denominado «segmentos», término que se ha introducido reemplazando el texto «Mary John bell» que aparece por defecto.

Etiquetado Praat

Con el ejemplo siguiente, se obtendría un TextGrid con tres niveles de etiquetado (o transcripción), es decir, tres Tier, denominados «alófono», «sílaba» y «palabra», términos que se han introducido reemplazando el texto «Mary John bell» que aparece por defecto.

Etiquetado Praat

Los TextGrid creados mediante el procedimiento que se acaba de describir mantienen el nombre del fichero de sonido que contiene la grabación. Los documentos sonoros aparecen en la ventana de objetos de Praat precedidos de Sound, mientras que los TextGrid se muestran precedidos de TextGrid.

La creación de un TextGrid también puede realizarse automáticamente para un conjunto de ficheros de sonido que se encuentren en un mismo directorio o carpeta.

❯ Creación automática de un TextGrid

Praat manual: TextGrid

tornar al principi

Segmentación de la señal de habla

Una vez creado el TextGrid, en la ventana de objetos de Praat, se selecciona conjuntamente el fichero con el sonido y el fichero con el TextGrid y se elige la opción View & Edit (Edit en versiones anteriores del programa) en el menú de la derecha.

Etiquetado Praat

El resultado es una nueva ventana, con la señal sonora y un TextGrid que contiene tres Tier correspondientes a los niveles de etiquetado o transcripción previamente definidos (en este caso «alófono», «sílaba» y «palabra»). En el TextGrid se marcan los límites entre unidades (Boundary) y se escriben los símbolos de transcripción fonética o la representación ortográfica.

Etiquetado Praat

Al situar el cursor en el lugar donde se desea marcar un límite (Boundary) entre unidades, aparece una línea vertical gris y un punto gris en cada uno de los niveles de etiquetado. El nivel (o Tier) en el que se está etiquetando o transcribiendo se muestra con el nombre en rojo a la derecha y una manecilla a la izquierda.

Etiquetado Praat

Con un clic sobre el punto gris se fija el límite que se desea marcar, que aparece, una vez marcado mediante un clic, en color rojo.

Etiquetado Praat

Con el mismo procedimiento se introducen las marcas de segmentación (Boundary o límites entre unidades) que se deseen en cada nivel o Tier. Una vez introducidas, las marcas de segmentación (límites entre unidades) aparecen en color azul.

Etiquetado Praat

Las marcas de segmentación pueden desplazarse seleccionando y arrastrando y también pueden editarse mediante los menús Interval y Boundary.

Etiquetado Praat

Etiquetado Praat

Praat manual: TextGrid Editor

tornar al principi

Etiquetado (transcripción) de la señal de habla

La etiqueta (símbolo de transcripción fonética o caracteres empleados en la representación ortográfica) se escribe en la ventana superior tras haber seleccionado el intervalo —que aparece señalado en color amarillo— entre dos marcas de segmentación (Boundary).

Etiquetado Praat

Para emplear símbolos fonéticos deben tenerse instaladas las fuentes Charis SIL o Doulos SIL, que pueden obtenerse desde la página de descarga de Praat o desde la página de SIL International.

Introducción de símbolos de transcripción mediante el menú Help del programa Praat

En la parte superior derecha de la ventana en la que se está realizando la segmentación y el etiquetado aparece el menú Help, en el que se encuentra un acceso directo a las tablas de símbolos fonéticos documentados en el manual de Praat: Phonetic symbols.

Símbolos fonéticos

Con ello, se abre la página correspondiente del manual de ayuda del programa y se puede seleccionar una de las tres tablas de símbolos: «Phonetic symbols: consonants», «Phonetic symbols: vowels» o «Phonetic symbols: diacritics».

Símbolos fonéticos

En las tablas, que siguen una disposición similar a la del Alfabeto Fonético Internacional, se encuentra la combinación que debe teclearse para obtener el símbolo fonético deseado; en la parte superior de cada casilla se muestra el símbolo del Alfabeto Fonético Internacional y en la inferior aparece el carácter o la combinación de caracteres necesaria para introducir este símbolo; las combinaciones de caracteres siempre van precedidas de una barra inclinada \.

Praat Help

Por ejemplo, tecleando en la ventana superior la combinación \nj se obtiene el símbolo correspondiente a la nasal palatal [ɲ].

Etiquetado Praat

Las combinaciones de caracteres correspondientes a los diacríticos se introducen después del símbolo; así, mediante la secuencia \dh\Tv se obtiene la transcripción [ð̞].

Como alternativa al menú de ayuda del programa, puede utilizarse el siguiente documento, en el que se recogen las combinaciones de caracteres empleadas en el programa Praat para introducir los símbolos del Alfabeto Fonético Internacional en un TextGrid:

Correa, J. A. (2013). Díptico de alfabetos fonéticos: Alfabeto Fonético Internacional (IPA), Alfabeto X-SAMPA y Alfabeto Fonético de la Revista de Filología Española (contiene comandos para implementar el IPA en Praat). Instituto Caro y Cuervo. http://www.bibliodigitalcaroycuervo.gov.co/id/eprint/962

Praat manual: Phonetic symbols

Introducción de símbolos de transcripción mediante la opción Show IPA Chart

En la versión 6.0.24 (23 de enero de 2017) de Praat se introdujo la posibilidad de insertar símbolos fonéticos haciendo clic sobre una tabla de símbolos del Alfabeto Fonético Internacional.

En la ventana de edición que se abre tras haber seleccionado conjuntamente el objeto con el sonido y el TextGrid, se elige la opción Preferences… en el menú File.

Etiquetado Praat

Con ello se abre la ventana de preferencias, en la que se selecciona la opción Show IPA Chart.

Etiquetado Praat

Tras cerrar la ventana de preferencias, se puede observar que en la ventana de edición aparece, a la derecha, una lista de símbolos del Alfabeto Fonético Internacional ordenada alfabéticamente.

Etiquetado Praat

Para introducir un símbolo, solamente es necesario situar el cursor en el intervalo que se desea etiquetar (entre las dos marcas azules que representan los límites entre unidades o Boundary) y hacer clic sobre el símbolo seleccionado; este aparecerá tanto en la parte superior izquierda de la ventana de edición como en el intervalo seleccionado (marcado en color amarillo) en el TextGrid.

Etiquetado Praat

Los diacríticos se encuentran en las dos últimas filas de la lista, acompañados de los caracteres z, y, o. Así, para emplear el diacrítico de dentalización, se introduciría en primer lugar el símbolo (por ejemplo, [t]) y, a continuación, se haría clic sobre en la tabla; con ello, se obtendría la transcripción [t̪].

Etiquetado Praat

Introducción de símbolos de transcripción mediante el sistema operativo del ordenador

Si el sistema operativo del ordenador con el que se trabaja lo permite, pueden introducirse directamente símbolos fonéticos en la ventana en la que se escribe la transcripción. Para ello, puede utilizarse una paleta de caracteres, un visor de caracteres o un mapa de caracteres, según el sistema operativo empleado.

Etiquetado Praat

Introducción de los símbolos que indican el grado de indeterminación

Para introducir los símbolos que indican el grado de indeterminación en una transcripción realizada mediante la ampliación del Alfabeto Fonético Internacional para la transcripción del habla con alteraciones (extIPA) puede emplearse la herramienta en línea Combining character adder.

Esta herramienta permite combinar el círculo (correspondiente al carácter en Unicode U+20DD, conocido como Combining enclosing circle) con cualquier otro carácter para obtener transcripciones como C⃝, V⃝ o p⃝.

En el apartado Combining character adder options se selecciona Enclosing circle en el menú del centro (Add this combining overlay mark to the middle of Unicode symbols) y Don’t use en el menú superior y el inferior.

Combinación de caracteres

En el apartado Unicode se teclea el carácter que se desea introducir dentro del círculo y en el apartado Combined unicode aparece el carácter dentro del círculo.

Combinación de caracteres

Mediante la opción Copy to clipboard se copia la combinación y puede pegarse en un TextGrid de Praat o en un documento de texto.

Combinación de caracteres

Browserling. (s. d.). Combining character adder. Online Unicode tools. https://onlineunicodetools.com/add-combining-characters

Conversión de un TextGrid al formato Unicode

Si se desea emplear el TextGrid en otros programas, puede ser necesario guardarlo en el formato Unicode. Para ello, en el menú Edit se selecciona la opción Convert entire TextGrid to Unicode.

Etiquetado Praat

Si existe una versión anterior del TextGrid ya guardada, debe volverse a guardar seleccionando la opción Save as text file… en el menú Save de la ventana de objetos, tal como se explica a continuación.

tornar al principi

Almacenamiento del TextGrid

Una vez finalizada la transcripción, en la ventana de objetos se selecciona el TextGrid y se guarda como un documento de texto, seleccionando la opción Save as text file… en el menú Save. En versiones anteriores de Praat en el menú de la ventana de objetos aparecía Write y Write to text file… en lugar de Save y Save as text file….

Etiquetado Praat

Etiquetado Praat

El fichero de texto creado mediante este procedimiento puede abrirse nuevamente con Praat mediante la opción Read from file… en el menú Open (o Read en versiones anteriores del programa).

Etiquetado Praat

Conviene recordar que en el programa Praat los TextGrid no se guardan automáticamente, de modo que es aconsejable guardarlos periódicamente mientras se realiza la segmentación y el etiquetado.

tornar al principi

Correa, J. A. (2014). Transcripción y etiquetado. Manual de análisis acústico del habla con Praat (pp. 63–92). Instituto Caro y Cuervo. http://www.bibliodigitalcaroycuervo.gov.co/id/eprint/998

Praat manual: Annotation

Praat manual: TextGrid Editor

Praat manual: TextGrid

tornar al principi

Introducción a Praat


La segmentación y el etiquetado de corpus mediante Praat
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

La pàgina va ser modificada per darrera vegada el