El estudio de la producción basado en corpus orales en español como LE/L2

Una de las primeras tareas que se plantean al estudiar los rasgos foneticos у fonologi- cos de la produccion de hablantes no nativos es el establecimiento de una tipologia de errores que permita, una vez etiquetado el corpus, obtener datos lingiiistica- mente pertinentes. En los trabajos de Blanco у Nogueroles (2013, 2014), basados en el corpus Fono.ele, se propone una clasificacion de errores fonicos en espanol сото LE/L2 realizada a partir de cuatro criterios: la naturaleza lingiiistica del error (fonologico, fonetico о fonico), el tipo de elemento afectado (segmental о prosodico), los procesos que subyacen al error (insercion, elision, sustitucion, modi- ficacion у desplazamiento) у el efecto comunicativo del error (impide, dificulta о no dificulta la comunicacion). En cambio, en los proyectos mas orientados a la creacion de corpus que permitan entrenar sistemas de reconocimiento automatico del habla para la ensenanza de la pronunciation suelen considerarse unicamente tres tipos de errores segmentales (insercion, elision у sustitucion), asi сото la naturaleza

FICURA 8.8 Variables consideradas en la busqueda de enunciados que contengan un determinado segmento en funcion del segmento precedente, del siguiente, del acento у de la position en la palabra en la Romance Phonetics Database.

de los segmentos que siguen у preceden al error (Carranza, Cucchiarini, Llisterri el al. 2014).

Cuando se dispone de un corpus en el que se han etiquetado los errores en el piano fonico es posible realizar, сото se ha explicado en el apartado 8.1.3.2, anali- sis estadisticos relativos a la frecuencia de aparicion de cada tipo de error teniendo en cuenta factores сото la LI del estudiante (Blanco у Nogueroles 2013, 2014), su nivel de conocimiento de la L2, el estilo de habla о el contexto fonetico en el que se produce el error (Carranza, Cucchiarini, Llisterri et til. 2014). Una muestra de este tipo de trabajo puede encontrarse en el estudio que Carranza, Cucchiarini, Llisterri et al. (2014) llevaron a cabo partiendo de las grabaciones de los examenes orales realizados cada seis meses durante los dos primeros cursos academicos por 20 estudiantes universitarios japoneses de espanol; el corpus contiene diferentes estilos de habla correspondientes a las distintas tareas llevadas a cabo durante las pruebas у los errores se anotaron mediante un procedimiento que permite conocer el segmento correcto, el incorrecto, el tipo de error у el contexto de aparicion. Asi, por ejemplo, en la figura 8.9 puede apreciarse un error de sustitucion (codi- ficado mediante la letra ‘a’) de [e] (codificado сото ‘02’) por [i] que se da entre |(3] (codificado сото ‘26’) у [s] (codificado сото ‘23’) en la segunda silaba de la palabra ilives.

En el etiquetado fonetico de los errores surge, en ocasiones, el problema de lo que puede describirse сото “realizaciones intermedias”. Uno de los ejemplos que se discuten en Carranza (2013) en el caso de estudiantes japoneses de espanol son las realizaciones de /г/ que presentan la estructura formantica tipica de una consonante lateral у la oclusion propia de una rotica simple. Cuando se dan estas situaciones, el investigador debe tomar decisiones apoyadas en la estructura aaistica de la serial о bien recurrir a una validation externa de la transcription realizada por hablantes nativos con conocimientos de fonetica (Carranza, Cucchiarini, Llisterri etal. 2014).

El tipo de analisis descrito permite, tomando сото referencia un corpus de 8,9 horas de duration que contiene 13 410 errores producidos por estudiantes japoneses de espanol, determinar, por ejemplo, que los errores de sustitucion aparecen con mayor frecuencia que los de insertion, mientras que los de elision son los menos habituales у que, entre las sustituciones, los tres errores mas frecuentes afectan a las consonantes [d], [1] у [(3], сото se muestra en la tabla 8.1, adaptada de Carranza, Cucchiarini, Llisterri et al. (2014).

Como es logico, los datos que puedan obtenerse dependeran de las decisiones que se hayan tornado en el momento de disenar у de etiquetar el corpus. Las variables que intervienen en la creation del corpus formaran parte de los metadatos que permiten realizar busquedas, сото se ha expuesto en el apartado 8.2.1, mientras que los niveles de etiquetado (segmental, suprasegmental, fonetico, fonologico, etc.), el detalle con el que se etiquetara cada nivel у el procedimiento mediante el cual se codifiquen los errores condicionaran la naturaleza de los resultados del analisis. Por ello, conviene insistir en que el diseno del corpus у la definition de los criterios de etiquetado constituyen una etapa de primordial importancia en cualquier investigation.

FICURA8.9 Etiquetado de un error de sustitucion de [e] por [i] en el contexto |(B_s] (transcrito сото [B_s] en SAMPA) realizado mediante el programa Praat. En la primera fila aparece la codification del error, en la segunda, la transcription de la realizacion canonica [i) y, en la tercera, la transcription de la realizacion erronea [e|.

Fuenle: Carranza 2013.

TABLA 8.1 Datos cuantitativos sobre los tres errores de sustitucion mas frecuentes en un corpus de estudiantes japoneses de espanol.

Numero de casos

Realization

correcta

Realization

incorrecta

Ftecuencia de aparition en %

Segmento precedents (ftecuencia de aparition en %)

Segmento siguiente (ftecuencia de aparition en %)

921

[S]

[d]

82

vocal (79)

vocal (89)

It]

16

vocal (49) Is] (40)

vocal (94)

815

[1]

и

66

vocal (68)

vocal (76)

silencio (8)

silencio (8)

806

[ft]

[b]

89

vocal (84)

vocal (87)

[p]

9

vocal (68)

Is] (16)

vocal (88)

Fuenle: adaptado de Carranza, Cucchiarini, Llisterri et a. (2014).

El estudio de la percepción basado en corpus orales en español como LE/L2

Conocer сото los hablantes nativos valoran perceptivamente las realizaciones no nativas resulta de interes tanto desde un punto de vista teorico сото en lo que respecta al establecimiento de prioridades en la ensenanza de la pronunciation. Las dimensiones que habitualmente se consideran son la inteligibilidad, la facilidad de comprension (comprehensibility) у el grado de acento extranjero (accentedness) (Munro у Derwing 1995), que pueden analizarse en funcion de la tipologia de errores fonicos empleada en el etiquetado del corpus.

Un estudio que ilustra la metodologia empleada en este tipo de investigation es el que, basado en el corpus de estudiantes japoneses de espanol al que se ha hecho referencia en el apartado 8.2.2, se describe en Carranza (2015). En este exper- imento se presentan muestras de realizaciones no nativas, tanto erroneas сото correctas, a un grupo de hispanohablantes para que transcriban ortograficamente los enunciados —lo que permite evaluar la inteligibilidad— у valoren en una escala numerica el grado de dificultad para entenderlos, asi сото el grado de acento extranjero percibido. Los resultados muestran, por ejemplo, que las valoraciones mas negativas se encuentran en los errores consistentes en la epentesis de una vocal, puesto que se altera la estructura silabica, seguidos por los errores fonologicos deri- vados de la confusion entre |1| у [r|; en cambio, los errores de naturaleza fonetica сото las sustituciones de [x] о de [r] parecen incidir en menor medida en las tres dimensiones analizadas.

El estudio de la percepción por parte de hablantes no nativos de español

Asi сото es posible crear recursos para estudiar la production de hablantes no nativos, resulta tambien factible recoger de forma sistematica datos que reflejen su percepcion fonica. Una muestra del tipo de analisis que puede llevarse a cabo se encuentra en los trabajos de Blanco (2016, 2017), en los que se presenta la vertiente perceptiva del corpus Fono.ele. La primera etapa consiste en el diseno de una prueba de percepcion en la que se incluyen un total de 10 ejercicios centrados en los siguientes aspectos: contrastes de sonidos en pares minimos, identification de sonidos en palabras, identification de la position del acento en pares minimos acentuales, del numero de silabas, de la silaba tonica у del patron acentual de la palabra, identification del patron entonativo en pares у en listas de oraciones, identification del tonema final сото ascendente о descendente e identification de la modalidad oracional сото afirmativa, interrogativa о exclamativa. Esta prueba, con la que se obtienen 300 respuestas por participante, se aplico a 204 estudiantes de espanol сото LE/L2, hablantes de 10 lenguas maternas diferentes, con un nivel de conocimiento del espanol que se situa entre el A2 у el Cl, con distintos grados de contacto con el espanol у con diferentes experiencias de aprendizaje en lo que se refiere al trabajo sobre los aspectos fonicos en el aula.

El corpus de respuestas (61 200 en total) permite realizar una amplia diversidad de estudios, tanto en lo que se refiere a los items de la prueba que plantean mas difi- cultades сото relacionando los resultados con las variables relativas a los hablantes. Asi, por ejemplo, se constata que “a nuestros estudiantes de espanol, independi- entemente de su lengua materna, solo les plantea dificultad notoria la percepcion de las oposiciones r/r, d/d, ji/n + j/n у diptongo/vocal” (Blanco 2016, 10), ele- mentos a los que cabe anadir “el computo de silabas. . . diferenciar tipos de palabras segun la posicion de la sllaba tonica y, por ultimo, identificar el esquema entonativo cuando entre las opciones aparece la suspension tonal” (Blanco 2017, 80).

 
Source
< Prev   CONTENTS   Source   Next >