La variación en el léxico: los ejes diastrático y diafásico

Hemos dedicado los dos apartados anteriores a analizar algunos fenomenos en los que la utilizacion de corpus textuales resulta de utilidad para comprender la forma en que el espa- nol diverge en los dos ejes estudiados tradicionalmente: el diacronico (en el tiempo) у el diatopico (en el espacio). A esas dos dimensiones, objeto de, respectivamente, la lingiifstica historica у la dialectologia, se ha unido en los tiltimos anos el estudio de la variacion vinca- lada a la estratificacion sociocultural por una parte у a las diferentes situaciones comunicati- vas, que constituyen el terreno en que se mueven los estudios sociolingufsticos por otra. En esa zona se centra el presente apartado.

Como ya he senalado en el apartado 4-3, durante la mayor parte del siglo xx, la lingiifstica se movio en la li'nea de dar prioridad casi absoluta a lo general, lo abstracto. En una presen- tacion muy general, eso es lo que se deduce tanto de la conocida dicotomfa saussureana entre langue у parole сото de la propuesta inicialmente por Chomsky entre competence у perform mance. En ambos casos, la idea es que la lingiifstica debe fijar sus objetivos у centrar sus esfuerzos en estudiar el sistema, la lengua, la competencia lingiifstica у relegar a un lugar muy secundario о no tomar en cuenta lo relativo al habla, a la realizacion en el discurso, conside- rados producto de la actuacion de factores especfficos у momentaneos sin intervencion en el sistema lingiifstico, que es lo que deberfa ser estudiado. En una lfnea paralela, bay que tener en cuenta tambien el peso que ha tenido la necesidad de encontrar un objeto de estudio estable, no sometido a oscilaciones сото las producidas por las circunstancias especfficas que pesan sobre un hablante determinado о una situacion especffica. A pesar de ello, la realidad es que la mayor parte de los estudios lingiifsticos desarrollados durante la primera parte del siglo xx se situaban en la lingiifstica historica о bien en la dialectologfa, con lo que se pro- ducfa un notable desajuste entre lo que senalaban los enfoques mas teoricos у las lfneas mas programaticas con respecto a la practice habitual de la mayor parte de los lingiiistas.

Aunque, por supuesto, siempre se ha sabido que la variacion en las lenguas responde no solo a los aspectos mencionados, sino tambien a otros, igualmente importantes, tambien es cierto que solo a partir de la decada de los sesenta del siglo pasado se adquiere conciencia de su peso especffico у se desarrollan los instrumentos metodologicos necesarios para su estudio. Simplificando mucho la cuestion, es el nacimiento у desarrollo de los estudios sociolingtifsti- cos lo que produce la gran reconfiguracion de problemas, metodos у objetivos que caracteriza a la lingiifstica actual frente a la que se practicaba a mediados del siglo xx. La sociolingufstica88 se centra en el analisis de la relacion existente entre los fenomenos lingiifsticos у la estructura social, tal сото se presenta en, por ejemplo, los distintos modos en que algunos fenomenos lingiifsticos se manifiestan en diferentes grupos sociales (sexo, edad у nivel sociocultural son los rasgos considerados habitualmente) о bien en las diferentes circunstancias comunicativas en las que se puede encontrar el mismo hablante. La utilizacion de determinadas palabras о locuciones, la forma en que se pronuncia la s final о la d de palabras сото llegado, el uso de artfculos ante nombres propios, el sistema pronominal, etc. varfa no solo en el tiempo у en el espacio, sino que se presenta en formas о frecuencias distintas en la misma localidad о incluso en los mismos hablantes.

La comprension de lo mencionado en el parrafo anterior ha tenido dos consecuencias de gran importancia en los estudios lingiifsticos. Por una parte, la variacion ha dejado de ser considerada сото un fenomeno inevitable, con el que la lingiifstica tenfa que convivir, pero que estorbaba y, en consecuencia, debfa ser restringido al maximo posible, у ha pasado a estar situada en el centra mismo de la concepcion de las lenguas у su funcionamiento. Esto es, la variacion es consustancial a las lenguas, es necesario no solo dar cuenta de su existeiv cia, sino tambien considerar que es un factor estructural. En segundo lugar, ya en un nivel mas bajo, la sociolingufstica estudia los cambios lingufsticos en el mismo momento en que se producen, у esa caracterfstica ha cambiado considerablemente la forma en que se concibe у se analiza el cambio historico.89 La plasmacion del modo en que estas dos perspectivas se integran se produce en las continues referencias a los fenomenos de variacion у cambio en las lenguas considerados сото la manifestacion del mismo fenomeno general en diferentes ambitos.

Naturalmente, los corpus constituyen un recurso especialmente util para el analisis de la forma en que se manifiesta la variacion tambien en estos dos ultimos parametros. Como es logico, resulta imprescindible que ese objetivo se haya tenido presente en las fases de diseno у construccion del corpus у que, сото consecuencia de ello, los rasgos pertinentes figuren entre los que aparecen en la codificacion de los textos, en los metadatos. En la practica habitual, todas estas caracterfsticas se encadenan у jerarquizan de diferentes modos. Asf, para construir un corpus de lengua coloquial es logico partir de que debe estar formado por textos orales у que en la caracterizacion de cada uno de ellos deben figurar tambien los rasgos nor- malmente presentes en los estudios sociolingiifsticos, es decir, la edad, el sexo у el nivel educativo de cada hablante. Algo muy parecido, con los ajustes necesarios, se puede pensar de, por ejemplo, los corpus de habla juvenil. Sin embargo, es preciso tener en cuenta que la distincion entre lengua oral у lengua escrita se refiere al medio y, en consecuencia, resulta bastante mas compleja: un ensayo academico у una carta particular son lengua escrita, pero es altamente probable que presenten caracterfsticas lingufsticas muy diferentes; una clase universitaria, una intervencion en una tertulia televisiva у una charla de cafe con unos amigos son todos ellos lengua oral, pero sin duda mostraran divergencies en muchos puntos importantes. Por otro lado, esta situacion se ha complicado en los ultimos tiempos con la aparicion de nuevos generos vinculados a los cambios en las comunicaciones у la existencia de internet. Los blogs, los mensajes electronicos, los tuits, wasaps, etc. son todos ellos lengua escrita, pero es evidente que tienen diferencias muy marcadas tanto entre sf сото con respecto a lo que se entiende habitualmente por “lengua escrita”.

Los corpus de referencia pueden contener tambien textos de todas estas procedencias, con lo que es posible hacer la comparacion directa entre los diferentes tipos. Es importante notar que la insercion de textos pertenecientes a tipos tan variados tiene importantes consecuencias en la codificacion у la recuperacion de la informacion. Introducir el pafs de origen о de instalacion del autor de una novela о una noticia periodfstica puede llegar a requerir una investigacion cuidadosa, proxima a un estudio biografico,90 pero resulta mucho mas complicado el trabajo que hay que realizar en la codificacion de, por ejemplo, una tertulia radiofonica. Las dihcultades para identificar los rasgos de los intervinientes son las mismas, pero en este caso la caracterizacion no se puede hacer de una vez para todo el texto, puesto que puede haber hablantes de diferentes procedencias, edades, etc. Por tanto, el rasgo no se asocia globalmente al texto, sino a cada uno de los hablantes у tiene que ser conectado con cada una de sus intervenciones.91

Es claro que son los corpus orales (o que contienen textos orales), preferiblemente de habla espontanea, los mas adecuados en principio para investigar la relacion entre el modo en que se manifiestan ciertos fenomenos lingfifsticos у las caracterfsticas individuals de los hablantes, generalmente edad, sexo у nivel educativo alcanzado. En lo que se refiere al lexico, es previsible que la frecuencia de utilizacion de ciertas palabras este relacionada con la perte- nencia a alguno de los grupos considerados habitualmente, aunque el analisis de los datos puede mostrar resultados diferentes a los esperados. Asf, Hoffmann (2008, 9) muestra, por ejemplo, que el uso de la palabra cars es bastante mas frecuente entre las mujeres que entre los hombres en el bloque textos orales incluido en el BNC. Algo parecido sucede entre los informantes del corpus ESLORA, donde la frecuencia normalizada de la palabra coche es de 846 casos por millon entre las mujeres у de 603 entre los hombres. Puede ponerse en relacion con los grupos de edad у se aprecia entonces que el uso de la palabra es mas intenso en el grupo mas joven (822 por millon), desciende en el intermedio (695) у se reduce mas en el de mas edad (722). Como se indica en el apartado 1.2.5, en el corpus ESLORA la palabra fiitbol presenta una frecuencia normalizada de 458 casos por millon en los textos producidos por hombres у de solo noventa у nueve casos por millon entre los producidos por mujeres. Evidentemente, lo que sucede en estos dos casos es que unos grupos hablan mas de coches о de fatbol que otros, de modo que estamos ante una cuestion de habitos, de costumbres, que, сото es logico, tiene repercusiones sobre el lexico empleado.

Algo diferente es lo que sucede con ciertas palabras que no estan relacionadas con los temas tratados, sino que resultan caracterfsticas de un cierto grupo de hablantes. Es el caso de, por ejemplo, genial. Se trata de una palabra de frecuencia relativamente baja (su frecuen- eta normalizada en el CORPES, constituido mayoritariamente por textos escritos, es de 13,11 cpm). En sus usos tradicionales, es una palabra culta, el adjetivo correspondiente a genio, pero en los ultimos anos ha adquirido un valor que el DLE23 incluye сото tercera acepcion у define сото “magnffico, estupendo” e indica que se emplea tambien сото adverbio. Es este valor, naturalmente, el que nos interesa aquf у el que es previsible que se pueda encontrar en la lengua conversacional. En PRESEEA (marzo de 2020) encontramos cincuenta у un casos de genial92 procedentes de Espana (uno en Alcala de Henares, uno en Madrid, dos en Valencia, tres en Granada, dos en Malaga у veinte en Santiago de Compostela), Mexico (uno en Monterrey, uno en Ciudad de Mexico, uno en Guadalajara, dos en Mexicali), Chile (diez en Santiago de Chile), Uruguay (cuatro en Montevideo), Peru (dos en Lima) у Colombia (uno en Barranquilla). La distribucion por sexos muestra una diferencia muy clara: nueve pro- ceden de hombres у cuarenta de mujeres.93 En cuanto a la distribucion por edades, treinta у dos corresponden al grupo 1, trece al grupo 2 у dos al grupo 3.94 El cruce de los dos rasgos revela que veintitres de los casos (el 46,9 % de los que llevan ambas caracterizaciones) corresponden a mujeres del grupo 1 de edad.

Los datos conjuntos pueden ocultar algunos fenomenos particulares que conviene estudiar con mas detalle. Por ejemplo, los diez casos de Santiago de Chile, todos ellos de mujeres, vienen de unicamente tres encuestas, una de las cuales aporta seis ejemplos. El detalle necesario para entender у valorar adecuadamente lo que sucede en este punto puede lograrse en el corpus ESLORA, que tiene una aplicacion de consulta mucho mas amigable у con mas posibilidades de recuperacion. Seleccionando la opcion Elemento gramatical en la ventana Busqueda > Tipo, Frecuencia simple en Resultado>Tipo у escribiendo genial en la ventana Lema obtenemos la indicacion de que hay sesenta у cinco casos de esta palabra. Seleccionando la opcion de Frecuencia completa se obtiene una pantalla en la que figura la distribucion de los casos por cada uno de los parametros considerados en la construccion del corpus. ESLORA contiene transcripciones de entrevistas semidirigidas у conversaciones, de modo que, para hacer mas congruente la comparacion con los datos de PRESEEA, podemos reducir la busqueda a las entrevistas, lo que se consigue seleccionando este tipo de texto en la ventana Corpus. Ademas, dado que las transcripciones contienen tambien interveneiones de las personas que han hecho las entrevistas, podemos reducir la busqueda a las producciones de los informantes. Esto ultimo se consigue haciendo la seleccion correspondiente en la ventana Papel. Final- mente, para limitar la posibilidad de apariciones de usos que no nos interesan para esta busqueda, podemos reducirla a los casos de singular. Esto se consigue escribiendo genial en el lema у genial en el elemento gramatical о bien en la forma ortografica. Con todas esas indicaciones, lanzamos la busqueda de nuevo (сото frecuencia simple) у nos devuelve la indicacion de que hay cuarenta у seis casos. En el paso siguiente, pasando a frecuencia completa, se ve que es mucho mas frecuente entre mujeres (treinta у cinco de cuarenta у seis casos, con una frecuencia normalizada de 116 casos por millon), en el grupo de edad mas joven (veintisiete, con una FN de 161) у entre personas con estudios universitarios (dieciocho, con una FN de 184 por millon). La conclusion parece clara, pero podemos obtener mas detalles haciendo las busquedas correspondientes a cruces de valores en los parametros seleccionando las que interesen en la ventana de Filtro. A las mujeres mas jovenes corresponden diecinueve de los treinta у cinco casos registrados (el 54,29 %). Las frecuencias relativas por sexos у edades son las que figuran en la tabla 4.27.

Uso preferente entre las mujeres que componen la muestra se observa tambien en expre- siones del tipo Me encanta, le encanto у similares. La forma de construir la consulta es, сото hemos visto ya, partir de la opcion Elementos gramaticales, seleccionar en la ventana de Etiqueta la clase Pronombre primero у personal despues, pulsar la opcion + que apa- rece a la derecha у escribir luego encantar en la casilla del lema. La frecuencia completa muestra que en ESLORA aparecen 256 casos, lo cual supone una FN de 341 por millon. De ellos, doscientos veinte (85,93 %) se dan en mujeres. Como muestra la tabla 4.28, la frecuen- cia es superior en las mujeres у en el grupo de edad mas joven.

La version 2.0. del corpus Val.Es.Co ha sido anotada morfosintacticamente,95 gracias a lo cual es posible obtener, aunque con ciertas complicaciones en la formulacion de la btisqueda, resultados del estilo de los que hemos observado en ESLORA. Por ejemplo, utilizando la btisqueda por palabras, que es la opcion mas general, у escribiendo encantar en la ventana Lema, se obtiene la informacion de que hay trece casos en el conjunto de las conversaciones incluidas en esta version. En la tabla de resultados aparecen el ntimero de casos obtenidos, la forma, las referencias de conversacion, intervencion у ntimero de la palabra en la intervencion, la indicacion de si hay о no alargamiento, un texto corto que enmarca la forma que ha sido objeto de la btisqueda у la posibilidad de ampliar el contexto. En el caso que nos ocupa (el lema encantar), la respuesta es que aparece en diecisiete ocasiones.96 Esta btisqueda se puede refinar en varios aspectos. En primer lugar, para tratar de acercarnos a las que hemos visto en ESLORA, podemos intentar recuperar expresiones del tipo me encanta, le encantaba, etc. utilizando un operador de distancia. Por tanto, podemos repetir la indicacion anterior (lema encantar) у marcar, en la pestana Distancia lexica, la forma me a distancia -l,97 con lo que recuperamos trece casos. Empleando ahora, en sus diferentes combinaciones, las variables de sexo у edad, obtenemos que la expresion aparece una vez entre los hombres у once entre las mujeres,98 diez entre las personas con edades inferiores a veinticinco anos у dos entre las que tienen de vein- ticinco a cincuenta у cinco. Combinando ambas variables, la expresion aparece nueve veces entre mujeres con edades inferiores a veinticinco anos, lo cual supone el 69,23 % de los casos de esta expresion. La coincidencia con lo que hemos visto en ESLORA es casi total.

Otra lfnea de gran interes para este tipo de estudios es la constituida por los corpus cons- truidos sobre la forma de hablar de una parte de la poblacion identificada por su interes para

Tabla 4.27 Frecuencias relativas (casos por milldn) de genial por sexo у grupo de edad en ESLORA

19-34

35-54

>54

Hombres

92

35

0

Mujeres

236

128

25

Fuente: ESLORA. Elaboracidn propia

Tabla 4.28 Frecuencias relativas (casos por milldn) de me encanta у similares por sexo у grupo de edad en ESLORA. Elaboracidn propia

19-34

35-54

>54

Hombres

205

81

69

Mujeres

571

527

320

los estudios sociolingiifsticos. Entre ellos, los mas difundidos son, sin duda, los de habla juvenil у adolescente, сото el Corpus Oral para el Estudio del Lenguaje Juvenil у del Espanol Hablado en Alicante (ALCORE у COVJA), dirigido por Dolores Azori'n, о el Corpus Oral de Lenguaje Adolescente (COLA), construido por Annete Myre Jorgensen."

Como hemos visto en los apartados anteriores, la variabilidad diastratica se relaciona con aquellos parametros sociales que tienen relevancia en la configuracion у evolucion de los fenomenos lingiiisticos, у la diafasica se vincula a las diferentes situaciones en que puede tener lugar la comunicacion. Estamos, pues, en el ambito de actuacion de la sociolingiifstica, que trabaja sistematicamente con factores сото la edad, el sexo, el nivel sociocultural у el caracter mas о menos formal de la situacion comunicativa. Es decir, se trata del conjunto de fenomenos englobados tradicionalmente en la alusion a diferentes registros, estilos о incluso, con un termino vinculado directamente a la tradicion inglesa, “acentos”.

La recogida de materiales debe tomar en cuenta todos estos aspectos, lo cual condiciona la construccion de los corpus, el sistema de codificacion у tambien algunas de las caracte- risticas de las aplicaciones de consulta. Una buena parte de todo ello esta relacionada con las muestras orales que puedan constituir, total о parcialmente, nuestro corpus de trabajo. La diferenciacion habitual entre lengua escrita у lengua oral no sirve mas que de forma indirecta para organizar los datos que necesitamos. En efecto, las caracterfsticas lingiifsticas de una conferencia academica (no leida), un discurso parlamentario (no lefdo), una conversacion sobre cuestiones tecnicas, una tertulia radiofonica о televisiva, una conversacion informal en una cafeteria, una charla familiar, etc. responden a situaciones muy diferentes desde el punto de vista sociolingiifstico y, en consecuencia, es esperable la aparicion de caracterfsticas muy distintas. Tales diferencias pueden ser, al menos, de la misma entidad que las que suelen aparecer en textos escritos tan diferentes сото un ensayo academico, una noticia perio- dfstica, un reportaje, una novela en la que no se busque explfcitamente el lenguaje coloquial en los personajes (o el narrador), una carta formal, una carta familiar, un correo electronico entre amigos, un mensaje de Twitter, una intervencion en un bloq.. .. Parece evidente que la ecuacion lengua escrita = lengua literaria = lengua formal no ha sido exacta nunca, pero la evolucion de los sistemas de comunicacion la ha hecho todavfa menos solida.100 Es per- fectamente posible estudiar las caracterfsticas del espanol coloquial utilizando сото materia prima mensajes enviados a traves de alguno de los sistemas que funcionan en las redes sociales.

Naturalmente, todos estos factores pesan en la construccion de un corpus, su codificacion у el modo de extraer de el los datos relevantes para nuestra investigacion. He aludido ya a los cambios que se producen cuando se pasa de trabajar con, por ejemplo, un ensayo о una carta familiar (un autor unico y, por tanto, un pafs, un ano, una caracterizacion socio- lingiifstica) о bien una tertulia radiofonica (varios interlocutores, diferentes pafses, caracte- rfsticas sociolingufsticas variadas, etc.). La inclusion de materiales orales en un corpus supone siempre un trabajo muy considerable, puesto que hay que hacer las transcripciones y, en la medida de lo posible, atender tambien a los rasgos de la lengua oral que no se reflejan en una transcripcion convencional (gestos, miradas, ruidos interacciones con los demas interlocu- tores, etc.). A pesar de estas dificultades, sistematicamente destacadas en la documentacion de los corpus orales, los corpus de referencia suelen incluir un cierto porcentaje de textos orales,101 destinado precisamente a facilitar el analisis de esos factores especiales que los diferencian de los textos escritos, resultantes siempre de una situacion especial, menos “natural”. Por todo ello, es perfectamente esperable encontrar en el contraste entre los datos localizables en textos escritos у los procedentes de textos orales la manifestacion de fenomenos que estan relacionados con la evolucion de la lengua, las caracterfsticas socio- lingiifsticas de sus hablantes о la situacion en que se produce la comunicacion.

El analisis de lo que podemos encontrar en el uso de la palabra chevere puede resultar un ejemplo ilustrativo de interes. Se trata, al parecer, de un africanismo introducido en el espa- nol de Cuba a comienzos del siglo xx у que poco tiempo despues se extendio con rapidez por pafses proximos gracias a que aparecfa en la letra de una conga cubana de gran exito hacia 1920. El DLE lo incorporo ya en 1970, con cuatro acepciones muy vinculadas entre si, adscritas a Ecuador, Puerto Rico, Venezuela у Cuba.

El CORDE, que llega hasta 1974, tiene unicamente tres casos de la palabra, todos ellos procedentes de Cuba у fechados entre 1960 у 1970.102 El CDH tiene un testimonio anterior, tambien cubano, que se encuentra en uno de los poemas de Songoro cosongo, de Nicolas Guillen (1931).103 Los datos del CREA no anotado (1975-2004) muestran que el uso de la palabra (398 casos en total) se extiende ya a un numero importante de pafses, en alguno de los cuales alcanza una frecuencia normalizada de cierta entidad, сото muestra la tabla 4-29:

Tabla 4.29 Frecuencias normalizadas de ch6vere en distintos pafses segdn el CREA

F.N. total

Argentina

0,20

Colombia

3,37

Cuba

1,21

Ecuador

4,35

Espana

0,08

Мёхгсо

0,41

Peru

1,17

Puerto Rico

14,25

Rep. Dominicana

24,46

Venezuela

47,74

Fuente: Elaboracidn propia

Parece claro que el uso de la palabra tiene una zona preferente, en la que Venezuela tiene un papel especialmente relevante: de los 398 casos de chevere que registra el CREA, trescien- tos cinco (el 76,63 %) proceden de Venezuela.104 Sin embargo, es necesario considerar mejor este dato, porque no se trata en realidad de un predominio tan fuerte de este pais. La expli- cacion reside, mas bien, en el hecho de que, gracias a la gran cantidad de materiales orales correspondientes a la epoca del CREA transcritos en Venezuela, la proporcion de los orales con respecto a la generalidad de los textos venezolanos es muy superior a la que se puede encontrar en otros pafses. En Venezuela es del 21,6 %, frente al 12,37 % de Cuba о el 3,2 % de Puerto Rico. Asf pues, lo que parece un fenomeno relacionado con la distribucion geografica es, en este caso, una apariencia producida por el desequilibrio que el CREA presenta en este punto. Los datos generates del CORPES indican que el uso de esta palabra se concentra en los pafses que figuran en la tabla 4.30, con las frecuencias normalizadas que se indican.

Tabla 4.30 Frecuencias normalizadas de ch6vere en distintos pa(ses segiin el CORPES

F.N. total

Ecuador

6,47

Puerto Rico

6,19

Colombia

5,39

Venezuela

5,14

Estados Unidos

1,97

Peril

1,63

Rep. Dominicana

1,46

Guatemala

1,42

Cuba

0,89

Fuente: Elaboracidn propia

 
Source
< Prev   CONTENTS   Source   Next >