Models de producció de la parla


Models de producció de la parla


Models lingüístics

Peterson, G. E., i Shoup, J. E. (1966). A physiological theory of phonetics. Journal of Speech and Hearing Research, 9(1), 5–67. https://doi.org/10.1044/jshr.0901.05
 
Peterson, G. E., i Shoup, J. E. (1966). The elements of an acoustic phonetic theory. Journal of Speech and Hearing Research, 9(1), 68–99. https://doi.org/10.1044/jshr.0901.68
 
 
Gordon E. Peterson
Gordon E. Peterson (1913–1967)
(Font de la imatge: Faculty History Project. (2011). Gordon E. Peterson. University of Michigan, Millennium Project. http://faculty-history.dc.umich.edu/faculty/gordon-e-peterson)

La classificació de l’Alfabet Fonètic Internacional es pren com a referència per a la classificació dels sons de les llengües.

El component fisiològic del model es fonamenta en el mode d’articulació, el lloc d’articulació i els paràmetres fonètics secundaris.

El component acústic del model es basa en els tipus d’ones sonores, el paràmetres acústico-fonètics i els paràmetres prosòdics.

Es postula una relació entre les característiques articulatòries i les característiques acústiques, que es formula com un conjunt de transformacions entre ambdós tipus de característiques.

Models basats en trets distintius

❯ Els trets distintius de Jakobson i Halle (1956)

❯ Els trets distintius de Chomsky i Halle (1968)

tornar al principi

Models basats en objectius

Models basats en objectius espacials

MacNeilage, P. (1979). Motor control of serial ordering of speech. Psychological Review, 77(3), 182–196. https://doi.org/10.1037/h0029070
 
MacNeilage, P. (1991). Motor control of serial ordering of speech. A R. D. Kent, B. S. Atal i J. L. Miller (Ed.), Papers in speech communication: Speech production (p. 701–715). Acoustical Society of America.
 
 
(Font de la imatge: Department of Psychology. (s. d.). Peter F. Macneilage. The University of Texas at Austin. https://liberalarts.utexas.edu/psychology/faculty/pfm58)

El model es fonamenta en la idea de l’equivalència motora, és a dir, de la compensació articulatòria.

Es parteix del fet que diferents activitats musculars donen lloc al mateix resultat.

En la producció de la parla, el parlant no es limita a executar un conjunt d’ordres motores per a cada segment de la parla, sinó que té un objectiu (en anglès, target) de naturalesa espacial, que consisteix en una representació internalitzada de l’espai de la cavitat vocal.

El parlant realitza diverses operacions de reajustament de la posició dels articuladors per a arribar des de la configuració inicial a la posició que vol assolir en un determinat moment en el temps.

Models basats en objectius perceptius

Nooteboom, S. G. (1970). The target theory of speech production. IPO Annual Progress Report, 5, 51–55. https://www.researchgate.net/publication/254821548_The_target_theory_of_speech_production
 
 
(Font de la imatge: Prof. dr. Sieb Nooteboom. (s. d.). Universiteit Utrecht. https://www.siebnooteboom.nl)

En la producció de la parla, l’objectiu (en anglès, target) del parlant és de tipus perceptiu, ja que la finalitat principal de la parla és fer-se comprendre pel receptor.

❯ El caràcter teleològic de la parla

Amb objectius espacials diferents es pot aconseguir el mateix resultat acústic.

Es pot pensar que el parlant utilitza conjuntament representacions espacials i representacions perceptives.

En el moment de la producció de la parla intervé un conjunt de regles que relaciona les representacions espacials amb les perceptives, per tal de determinar el conjunt d’ordres motores que cal executar per a arribar a l’objectiu que es vol assolir en funció de la configuració en què es trobi el tracte vocal en cada moment.

tornar al principi

Models de codificació de la parla

«We will begin by describing how speech sounds are made. Most of them are the result of movements of the tongue and the lips. We can think of these movements as gestures forming particular sounds. We can convey information by gestures of our hands that people can see, but in making speech that people can hear, humans have found a marvelously efficient way to impart information. The gestures of the tongue and lips are made audible so that they can be heard and recognized» (p. 2).
 
Ladefoged, P., i Johnson, K. (2015). A course in phonetics (7a ed.). Cengage Learning. https://linguistics.berkeley.edu/acip/
 
 
Peter Ladefoged
Peter Ladefoged (1925–2006)
(Font de la imatge: Department of Linguistics. (2010, 6 de maig). Remembering Peter Ladefoged. University of California Los Angeles. https://linguistics.ucla.edu/people/ladefoge/Remember/Index.htm)
(Font de la imatge: Keith Johnson. (s. d.). University of California Berkeley, Department of Linguistics. https://linguistics.berkeley.edu/~kjohnson/)

La teoria motriu

Liberman, A. M., Cooper, F. S., Shankweiler, D. P., i Studdert-Kennedy, M. (1967). Perception of the speech code. Psychological Review, 74(6), 431–459. https://doi.org/10.1037/h0020279
 
Liberman, A. M., Cooper, F. S., Shankweiler, D. P., i Studdert-Kennedy, M. (1991). Perception of the speech code. A J. L. Miller, R. D. Kent i B. S. Atal (Ed.), Papers in speech communication: Speech perception (p. 75–106). The Acoustical Society of America. (Obra original publicada el 1967)
 
Liberman, A. M., Cooper, F. S., Shankweiler, D. P., i Studdert-Kennedy, M. (1972). Perception of the speech code. A E. E. David i P. B. Denes (Ed.), Human communication: A unified view (p. 13–50). McGraw-Hill. (Obra original publicada el 1967)
 
 
Alvin M. Liberman
Alvin M. Liberman (1917–2000)
(Font de la imatge: Whalen, D. H. (2000). Alvin M. Liberman 1917–2000. The Journal of the Acoustical Society of America, 108(6), 2693. https://doi.org/10.1121/1.1323456)
Franklin S. Cooper
Franklin S. Cooper (1908–1999)
(Font de la imatge: Haskins Laboratories. (s. d.). Franklin S. Cooper. https://haskinslabs.org/franklin-s-cooper)
(Font de la imatge: Department of Psychological Sciences. (s. d.). Donald Shankweiler. University of Connecticut. https://psychology.uconn.edu/person/donald-shankweiler/)
(Font de la imatge: Haskins Laboratories. (s. d.). Michael Studdert-Kennedy. https://haskinslabs.org/michael-studdert-kennedy)

Coneguda en anglès com a Motor Theory.

La teoria motriu es pot entendre com un model de les transformacions necessàries per a la codificació de la parla.

Esquema del procés de producció de la parla segons la teoria motriu

Esquema del procés de producció de la parla segons la teoria motriu.

Liberman, A. M., Cooper, F. S., Shankweiler, D. P., i Studdert-Kennedy, M. (1967). Perception of the speech code. Psychological Review, 74(6), 431–459. https://doi.org/10.1037/h0020279

Els estímuls nerviosos s’envien simultàniament a diversos músculs.

El gest produït per aquest moviment muscular crea variacions en el tracte vocal segons les regles articulatòries.

Aquestes variacions es converteixen en sons seguint els principis de la teoria acústica de la producció de la parla.

El fonema és una unitat que es veu modificada en el transcurs de la parla.

La superposició es produeix quan el parlant transmet simultàniament informació sobre més d’un fonema: coarticulació.

Conversió de fonemes en gests articulatoris

Organització dels fonemes en síŀlabes i superposició dels gests articulatoris.

Liberman, A. M. (1970). The grammars of speech and language. Cognitive Psychology, 1(4), 301–323. https://doi.org/10.1016/0010-0285(70)90018-6

Transmissió en paraŀlel de la informació corresponent als segments fonètics codificats a l’ona sonora

Transmissió en paraŀlel de la informació corresponent als segments fonètics codificats a l’ona sonora.

Liberman, A. M. (1970). The grammars of speech and language. Cognitive Psychology, 1(4), 301–323. https://doi.org/10.1016/0010-0285(70)90018-6

❯ La teoria motriu de la percepció de la parla

tornar al principi

Teories de l’acció

Les teories del control del moviment coordinat (conegudes, en anglès, amb la denominació d’Action Theory o ‘teories de l’acció’) pretenen explicar la invariància subjacent a la variabilitat articulatòria superficial.

Bernštein, N. A. (1967). The co-ordination and regulation of movements. Pergamon Press. https://archive.org/details/bernsteinthecoordinationandregulationofmovements
 
Greene, P. H. (1972). Problems of organization of motor systems. A R. Rosen i F. Snell (Ed.), Progress in theoretical biology (Vol. 2, p. 303–338). Academic Press. https://doi.org/10.1016/B978-0-12-543102-6.50013-3
 
Turvey, M. T. (1977). Preliminaries to a theory of action with reference to vision. A R. Shaw i J. Brandsford (Ed.), Perceiving, acting and knowing: Toward an ecological psychology (p. 211–266). Lawrence Erlbaum. https://doi.org/10.4324/9781315467931
 
 
Nikolai A. Bernštein
Nikolai A. Bernštein (1896–1966)
(Font de la imatge: Nikolai Bernstein. (2022, 11 d’abril). Alchetron. https://alchetron.com/Nikolai-Bernstein)
(Font de la imatge: Illinois Institute of Technology. (s. d.). Peter Greene. https://www.iit.edu/directory/people/peter-greene)
(Font de la imatge: Haskins Laboratories. (s. d.). Michael T. Turvey, Ph.D. https://haskinslabs.org/people/michael-t-turvey)

Per a explicar el comportament motor es fa sovint referència al concepte de ‘programació’.

Quan s’observen determinades característiques en un determinat comportament, aquestes característiques es poden atribuir a l’existència d’un programa.

La variabilitat contextual

En la producció de la parla no es dona una relació simple entre els trets distintius d’un segment i les contraccions de determinats músculs, ja que la realització física del segment depèn del context.

És probable que la variabilitat contextual sigui la causa de la manca de correlats electromiogràfics invariants en els segments fonètics.

El paper de les ordres que el sistema nerviós envia a la musculatura no queda exclòs, però cal pensar en un conjunt de forces musculars relacionat amb un conjunt de forces no musculars que actuen conjuntament per a assolir el moviment necessari en cada moment de la producció de la parla.

Les forces no musculars que es manifesten en la parla (que són el resultat de la massa i de les propietats elàstiques dels articuladors, juntament amb les que es deriven dels processos aerodinàmics al tracte vocal) no s’han de considerar com a fonts de variabilitat de caràcter negatiu que cal compensar o neutralitzar amb les ordres que arriben als músculs, sinó com a aspectes d’una organització molt flexible.

Els graus de llibertat

Per a un mateix moment en el temps existeixen molts graus de llibertat; si considerem l’evolució temporal, en la producció de la parla es dona un nombre excessivament alt de graus de llibertat com per a pensar en un mode de control global.

Cal pensar que molts graus de llibertat queden automàticament controlats quan se n’ajusta un nombre reduït.

L’aprenentatge d’una nova activitat motriu consistiria en adquirir una sinergia (acció combinada de diversos moviments), una estructura coordinativa adequada que faci que disminueixi el nombre de paràmetres que cal controlar de manera independent .

«The number of free parameters (separate muscle activations) that must be controlled in speech has been called a degrees of freedom problem because a flat control structure in which the tension of each muscle is separately controlled presents a control problem of exceeding complexity. The solution to the degrees of freedom problem that has been achieved in the speech motor control system (and most other motor control systems, like swallowing, walking, reaching, looking, etc.), is to organize the control system hierarchically in goal-oriented coordinative structures» (p. 279).
 
Ladefoged, P., i Johnson, K. (2015). A course in phonetics (7a ed.). Cengage Learning. https://linguistics.berkeley.edu/acip/
 
 
Peter Ladefoged
Peter Ladefoged (1925–2006)
(Font de la imatge: Department of Linguistics. (2010, 6 de maig). Remembering Peter Ladefoged. University of California Los Angeles. https://linguistics.ucla.edu/people/ladefoge/Remember/Index.htm)
(Font de la imatge: Keith Johnson. (s. d.). University of California Berkeley, Department of Linguistics. https://linguistics.berkeley.edu/~kjohnson/)

Els actes motors són el producte de les relacions organitzades entre els músculs.

Estructures coordinatives

Les estructures coordinatives són agrupacions funcionals de músculs que executen una determinada funció i que presenten una relació òptima entre la seva llibertat de moviment i les limitacions a aquest moviment per tal de permetre la realització coherent d’una activitat determinada.

Les estructures coordinatives es construeixen a partir dels anomenats ‘ajustaments’ (en anglès, tunings).

Hi ha una tendència o bé a la inhibició o bé a l’excitabilitat que determinen el tipus d’activitat que duran a terme les estructures coordinatives.

Cada acte motor està governat per estructures coordinatives que es troben funcionalment integrades les unes en les altres.

Cada nivell més alt d’integració defineix una classe de moviments més àmplia que la del nivell anterior.

Les estructures coordinatives de nivell més alt s’estableixen alterant les relacions entre les de nivell més baix i restringint el seu comportament.

El control de les estructures coordinatives és relativament simple, ja que cadascuna actua de manera autònoma.

El sistema motor té un mode de coordinació que es basa en mantenir les relacions temporals.

S’arriba a un sistema flexible ajustant el valors paramètrics de les variables menys essencials, sense alterar, però, la funció del sistema, que ve definida per les variables essencials.

Les estructures coordinatives en la producció de la parla

Els sistemes d’organització muscular que funcionen com una unitat es poden considerar conjunts d’osciŀladors acoblats, amb moviments interdependents.

Osciŀlador harmònic simple

Osciŀlador harmònic simple.

Oscillation. (2022, 31 de juliol). A Wikipedia. https://en.wikipedia.org/wiki/Oscillation

Coupled_oscillators.gif

Osciŀladors acoblats.

Oscillation. (2022, 31 de juliol). A Wikipedia. https://en.wikipedia.org/wiki/Oscillation

En un sistema complex com el de la producció de la parla no és possible estudiar el grau de llibertat de cadascun dels components.

Les aproximacions dinàmiques a la producció de la parla pretenen identificar els components macroscòpics, que operen en una escala temporal llarga, i relacionar-los amb els components articulatoris més petits, que operen en escales temporals curtes.

Port, R. F. (2007, 1 de novembre). Coordinative structures for the control of speech production. https://legacy.cs.indiana.edu/~port/teach/641/coord.strctr.html

Ladefoged_Johnson_2011_Estructura_coordinativa.jpg

Representació parcial de l’estructura coordinativa implicada en el tancament dels llavis.

Ladefoged, P., i Johnson, K. (2015). A course in phonetics (7a ed.). Cengage Learning. https://linguistics.berkeley.edu/acip/

«This structure specifies an overall task ‘close the lips’ at the top node, and subtasks such as ‘raise the lower lip’ and ‘lower the upper lip’ are coordinated with each other to accomplish the overall task. Some subtasks also require further reduction of the goal into smaller subtasks. For example, ‘raise the lower lip’ is present twice in the figure—first as a specification of the absolute position of the lower lip (which is coordinated with the upper lip in accomplishing the task ‘close the lips’) and second as a specification of the relative position of the lower lip (which is coordinated with the jaw in accomplishing the task ‘raise the (absolute position of) the lower lip’). The idea with coordinative structures is that each gesture is defined in terms of subtasks, and thus there is no direct control from a task like ‘close the lips’ to the muscles. Instead, the muscles have more limited goals and the degrees of freedom problem in coordination is solved by dividing the overall task into smaller, simpler coordination problems» (p. 279–280).
 
Ladefoged, P., i Johnson, K. (2015). A course in phonetics (7a ed.). Cengage Learning. https://linguistics.berkeley.edu/acip/
 
 
Peter Ladefoged
Peter Ladefoged (1925–2006)
(Font de la imatge: Department of Linguistics. (2010, 6 de maig). Remembering Peter Ladefoged. University of California Los Angeles. https://linguistics.ucla.edu/people/ladefoge/Remember/Index.htm)
(Font de la imatge: Keith Johnson. (s. d.). University of California Berkeley, Department of Linguistics. https://linguistics.berkeley.edu/~kjohnson/)

Les unitats lingüístiques

«Despite intensive research efforts, no one has sufficiently described either the acoustic or articulatory information that serves to specify a word in all its various contexts. Nor has anyone, to our knowledge, identified a canonical shape for a word and then transformed it, in a principled fashion, into the many shapes that it may take.
Along with colleagues at Haskins Laboratories (e.g. Browman, Goldstein, Kelso, Rubin & Saltzman, 1984) we are developing a solution to this problem by treating the units of language—conventionally described by linguists and phoneticians as, for example, phonemes, syllables and words—as the product of time-invariant control structures for a system of vocal tract articulators. We assume that it is from the properties of these dynamically specified control structures, … that the observed physical variations naturally arise» (p. 30).
 
Kelso, J. A. S., Saltzman, E. L., i Tuller, B. (1986). The dynamical perspective on speech production: Data and theory. Journal of Phonetics, 14, 29–59. https://doi.org/10.1016/S0095-4470(19)30608-4
 
 
(Font de la imatge: Department of Psychology. (s. d.). Scott Kelso. Florida Atlantic University. http://psy.fau.edu/people/kelso.php)
(Font de la imatge: College of Health & Rehabilitation Sciences. (s. d.). Elliot Lee Saltzman, PhD. Boston University. https://www.bu.edu/sargent/profile/elliot-lee-saltzman-phd/)
(Font de la imatge: Funding opportunities to build interdisciplinary neuroscience research for the future. (2018, 5 d’abril). Neuronline. https://neuronline.sfn.org/professional-development/funding-opportunities-to-build-interdisciplinary-neuroscience-research-for-the-future)

Aquest plantejament també permet explicar la invariància en els ajustaments temporals (en anglès, timing) dels moviments de la llengua, del vel del paladar i dels llavis quan es donen variacions en la velocitat d’elocució.

Si s’assumeix que es donen restriccions als graus de llibertat, ha d’existir una relació constant entre els elements d’una estructura coordinativa encara que variïn els valors de cada component.

Les relacions temporals (en anglès, timing) han de ser fixes, amb independència dels canvis en la velocitat dels moviments individuals de cada múscul.

Manteniment de la coordinació temporal amb independència de la velocitat d’elocució

Múscul orbicularis oris: controla el moviment labial per a l’articulació de la consonant [p].
Ventre anterior del múscul digàstric: controla el descens de la mandíbula per a l’articulació de la vocal [a].
Múscul genioglòs: controla l’avançament de la llengua per a l’articulació de la vocal [i].
L’inici de l’activitat necessària per a l’articulació de la consonant està relacionat amb l’inici de l’activitat relacionada amb l’articulació de les vocals adjacents; la coordinació temporal es manté amb independència de la velocitat d’elocució.

Tuller, B., Kelso, J. A. S., i Harris, K. S. (1982). Interarticulator phasing as an index of temporal regularity in speech. Journal of Experimental Psychology: Human Perception and Performance, 8(3), 460–472. https://doi.org/10.1037/0096-1523.8.3.460

❯ La fonologia articulatòria

tornar al principi

Etapes en la producció de la parla

Combinant un model de codificació de la parla amb un model lingüístic com la teoria dels trets distintius es pot descriure el procés de producció de la parla con un conjunt de nivells de representació.

El pas d’un nivell a un altre es realitza mitjançant una sèrie de regles de conversió entre nivells.

Raphael, L. J., Borden, G. J., i Harris, K. S. (2011). Speech science primer: Physiology, acoustics and perception of speech (6a ed.). Wolters Kluwer; Lippincott Williams & Wilkins.
 
 
(Font de la imatge: Raphael, L. (s. d.). Overview [Perfil a ResearchGate]. ResearchGate. Consultat el 5 d’octubre de 2021, a https://www.researchgate.net/profile/Lawrence-Raphael)
Gloria J. Borden
Gloria J. Borden (1930–2014)
(Font de la imatge: Gloria Jones Borden. (2014, 21 de maig). Town Topics. https://www.towntopics.com/wordpress/2014/05/21/obituaries-52114/)
(Font de la imatge: Haskins Laboratories. (s. d.). Katherine Harris, Ph.D. https://haskinslabs.org/people/katherine-harris)

Model de producció en etapes.

El model inclou la retroalimentació com a element regulador del procés de producció de la parla.

Etapes en la producció de la parla segons Raphael, Borden i Harris (2011

Etapes en la producció de la parla segons Raphael, Borden i Harris (2011).

Raphael, L. J., Borden, G. J., i Harris, K. S. (2011). Speech science primer: Physiology, acoustics and perception of speech (6a ed.). Wolters Kluwer; Lippincott Williams & Wilkins.

Catford, J. C. (1977). Fundamental problems in phonetics. Edinburgh University Press.
 
 
John C. Catford
John C. Catford (1917–2009)
(Font de la imatge: John C. (Ian) Catford. (2009). Legacy.com. https://obits.mlive.com/us/obituaries/annarbor/name/john-catford-obituary?id=23888853)

Programació neurolingüística.

Activitat central que organitza la selecció, l’ordenació i la coordinació temporal de l’activitat neurofisiològica.

Fase neuromuscular.

Fase neuromotora.

Les unitats motores entren en acció de manera simultània.

Fase miomotora.

Com a resultat de l’entrada en acció de les unitats motores es produeixen contraccions de músculs o de grups de músculs.

Fase orgànica.

Com a resultat de les contraccions de grups de músculs durant la fase neuromuscular, els òrgans relacionats amb aquests grups de músculs adopten posicions específiques o executen determinats moviments.

Fase aerodinàmica.

Les posicions successives i solapades en el temps dels òrgans de l’aparell fonador que s’originen durant la fase orgànica comprimeixen i dilaten l’aire contingut en el tracte vocal i el mantenen en moviment; aquest moviment varia constantment.

Fase acústica.

Els esdeveniment aerodinàmics que tenen lloc en el tracte vocal produeixen osciŀlacions de les molècules de l’aire i aquestes osciŀlacions són recollides per l’oïda.

Etapes en la producció de la parla segons Catford (1977)

Etapes en la producció de la parla segons Catford (1977).

Catford, J. C. (1977). Fundamental problems in phonetics. Edinburgh University Press.

tornar al principi

Models de producció de la parla


Models de producció de la parla
Joaquim Llisterri, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona

La pàgina va ser modificada per darrera vegada el