Hacia una documentación lingüística comunitaria. Consideraciones sobre la documentación de dos comunalectos de la lengua mixe

Yásnaya Elena A. Gil
Lingüista, escritora, traductora
Tonantzin Indira Díaz Robles
Lingüista

La documentación lingüística

Una de las actividades asociadas a la investigación lingüística ha sido la recolección, análisis y manejo de datos lingüísticos. Los datos son indispensables para hacer diferentes tipos de estudios gramaticales y son, en muchas ocasiones, la evidencia necesaria para sostener distintas posturas teóricas. Sin embargo, aún cuando el levantamiento de datos lingüísticos precede incluso al establecimiento de la lingüística como disciplina en forma, la documentación lingüística ha surgido como un área relativamente nueva con sus propios objetivos específicos claramente delineados; como puntualiza Romero Méndez (2009), “el reconocimiento de la documentación como una

disciplina lingüística con derecho propio, con ciertos estándares de calidad y con reflexiones teóricas que le son propias, sí es nuevo”. Por su parte, para Delgado y Pico (2021), es importante diferenciar entre la lingüística descriptiva y la lingüística documental. Estos autores puntualizan que en el primer caso los datos lingüísticos primarios son el instrumento para producir “descripciones lingüísticas”, mientras que, para la lingüística documental, el objetivo de documentar estos datos es producir una “documentación lingüística”. En otras palabras, para estos autores también es importante diferenciar entre lingüística documental y documentación lingüística entendiendo la segunda como un producto de la primera.

Según el trabajo pionero de Himmelmann (1998), una documentación lingüística “es un registro duradero y multifuncional de una lengua” o, como dice más adelante junto a otros autores, se trata de “un registro multipropósito representativo y duradero de una lengua natural o cualquiera de sus variedades” (Himmelmann et al., 2007). Aún cuando los datos recogidos con fines de descripción lingüística pueden ser muy importantes, no necesariamente constituyen un registro multifuncional, multipropósito o representativo de una lengua, pues los objetivos por los que se recogen suelen estar muy acotados por el tipo de descripción lingüística a la que pretenden servir. La documentación lingüística tiene entonces que ser lo más densa y variada posible para que pueda servir a muchos propósitos y funcionar para diversos objetivos que, en muchos casos, van mucho más allá de los objetivos de la descripción gramatical. La documentación lingüística producida puede dar cuenta no solo de los rasgos de la gramática sino de los muy distintos tipos de conocimiento asociados a la lengua y a su uso como tipos de actos de habla, información botánica, información cultural diversa, estrategias de creación poética, por mencionar solo algunos ejemplos.

En concordancia con las ideas de Delgado y Pico (2021), creemos que la documentación lingüística juega un papel fundamental en el proceso de fortalecimiento y revitalización que emprenden comunidades de hablantes de lenguas que están en riesgo de desaparición. La documentación lingüística ha adquirido más relevancia en el contexto actual en el que la muerte de las lenguas del mundo se está acelerando cada vez más.

En este texto compartiremos algunas consideraciones surgidas de dos experiencias de documentación lingüística en dos comunidades hablantes de mixe realizadas por hablantes de otras variedades de la misma lengua. Esta experiencia nos permite plantear algunas consideraciones para el desarrollo de una lingüística documental comunitaria.

Un proyecto de documentación de dos comunalectos de la lengua mixe

El mixe pertenece a la familia lingüística mixezoqueana, en la actualidad es posible encontrar lenguas de esta familia en cuatro estados de la república mexicana: Oaxaca, Chiapas, Veracruz y Tabasco. Wichmann (1995) propuso que el mixe de Oaxaca se encuentra dividido en cuatro variantes dialectales: mixe alto del norte, mixe alto del sur, mixe medio y mixe bajo. Posteriormente el mismo Wichmann (2008) añadió otra variante bautizada como mixe ulterior, de manera que el mixe de Oaxaca quedó así con cinco variantes distintas. A cada una de éstas corresponde un conjunto de comunalectos. Usamos el término “comunalecto” del modo en el que Valiñas (2010) lo plantea, como la lengua de cada comunidad concreta. Así como este autor plantea que cada comunalecto debe tratarse como un sistema lingüístico distinto para fines descriptivos, pensamos que también debe tratarse así para fines de la lingüística documental en tanto que, para el caso del mixe de Oaxaca, cada comunidad despliega una serie de prácticas lingüísticas que la diferencia de las demás.

Aunque los estudios gramaticales de la lengua mixe de Oaxaca no son cuantiosos, cuenta con diversos estudios lingüísticos. Desde principios del siglo XVIII, fray Agustín de Quintana incluyó entre sus publicaciones algunas descripciones gramaticales, las primeras de las que tenemos noticias; el Instituto Lingüístico de Verano elaboró vocabularios, descripciones gramaticales y materiales didácticos de comunalectos pertenecientes a tres variantes del mixe de Oaxaca durante el siglo XX; a finales de este mismo siglo, Wichmann (1995) hizo una descripción fonológica comparativa de datos de diferentes comunalectos para proponer una clasificación dialectal. Desde principios del siglo XXI destacan las tesis sobre lingüística descriptiva elaboradas por hablantes del mixe de Oaxaca, sobre todo de comunalectos pertenecientes a la variante mixe alto del sur y mixe alto del norte. También contamos con los estudios gramaticales y lexicográficos sobre el mixe de Ayutla y estudios de variación dialectal de diversos fenómenos gramaticales elaborados por el lingüista Rodrigo Romero Méndez.

Diversos investigadores comunitarios y profesores de educación básica han llevado a cabo distintos proyectos de documentación para fines didácticos, sin embargo, son de difícil acceso para consulta. Entre los proyectos de documentación planteados de manera formal como proyectos de investigación destacan el proyecto “Descripción y documentación del mixe de Ayutla” en 2005, el proyecto «Documentación y estudio del conocimiento léxico del mixe de Ayutla” en 2015 y el proyecto “Documentación y revitalización del conocimiento léxico del mixe de Coatlán” en 2020, los tres dirigidos por Rodrigo Romero Méndez.

En septiembre de 2022, el colectivo de investigadores mixes independientes COLMIX comenzó un proyecto de documentación inicial de dos comunalectos,[1] el de Santa María Nizaviguiti y el de San Pedro Jilotepec. Quienes nos encargamos de ejecutar este proyecto, somos hablantes de dos comunalectos distintos, el de Santa María Tlahuitoltepec y el de San Pedro y San Pablo Ayutla, aunque ambos pertenecen a una de las cinco variantes del mixe de Oaxaca, el mixe alto del sur.

La elección de los comunalectos a documentar se determinó con base en cuatro criterios: el interés de miembros de la comunidad y autoridades locales por el desarrollo de material didáctico para la enseñanza y fortalecimiento lingüístico de sus comunalectos, el alto grado de riesgo de desaparición de la lengua mixe hablada en estas comunidades, el tiempo disponible de nuestro equipo para ejecutar el proyecto y la falta de estudios o descripciones sobre los comunalectos de esa zona geográfica dentro de la Región Mixe.

Esta zona geográfica está conformada en la actualidad por seis comunidades, Santa María Nizaviguiti, San Miguel Nizaviguiti, San Sebastián Jilotepec, Agua Blanca, San Pedro Jilotepec y El Sauce. Estas comunidades se encuentran al sur de la Región Mixe, una zona separada del resto de la región por el río Tehuantepec. Los comunalectos que aún se hablan en estas comunidades no habían sido considerados en estudios anteriores y no hay datos o descripciones que nos permitan definir a cuál de las cinco variantes del mixe de Oaxaca pertenecen o si bien estos comunalectos conforman una sexta variante. Aunque lo ideal sería poder documentar los comunalectos de las seis comunidades, decidimos comenzar el trabajo en dos de ellas, considerando que, por la distancia entre ellas, podríamos plantear como hipótesis que cada comunalecto representa los extremos de un continuo dialectal. Esto último fue decidido después de un viaje de exploración en el que, además de conocer el territorio, pudimos hablar con las autoridades locales. En el caso de Santa María Nizaviguiti, las autoridades nos informaron que plantearían el proyecto ante la asamblea comunitaria para que, como sucedió después, aprobara el proyecto. En el caso de San Pedro Jilotepec, las autoridades dieron su autorización en un contexto en el que ya habían estado promoviendo otras actividades de enseñanza para la revitalización del mixe de su comunidad y habían solicitado apoyo en la creación de materiales didácticos.

Aún cuando ambas comunidades tienen comunalectos en alto riesgo de desaparición, la situación sociolingüística en ambos casos es distinta. De los 232 habitantes de Santa María Nizaviguiti, el Censo de Población y Vivienda del INEGI de 2020 registra que el 65.09 % de la población habla la lengua mixe aunque, ya en la comunidad, pudimos constatar la existencia de un gran número de hablantes con muy distintos grados de competencia. Por esta razón, creemos que es necesario hacer un estudio sociolingüístico más detallado porque es posible que el porcentaje de hablantes de mixe que el Censo reportó no refleje la vitalidad de este comunalecto. Algo similar sucede en San Pedro Jilotepec: esta comunidad, antes numerosa y políticamente relevante durante la época colonial, cuenta ahora con 93 habitantes según el mismo Censo de Población y Vivienda, para 2020 se reportó que el 21.51% habla lengua indígena; sin embargo, ya en la comunidad pudimos constatar que son aproximadamente cinco personas las que hablan el mixe de Jilotepec, un comunalecto de gran importancia histórica que lamentablemente se encuentra a punto de la extinción y que hasta ahora no había sido documentado.

Como Delgado y Pico (2021) plantean, la descripción lingüística gramatical puede servir de instrumento auxiliar para “registrar correctamente y sistemáticamente datos primarios” de una documentación que dé cuenta de una muestra representativa de las interacciones lingüísticas de los comunalectos que pretendíamos documentar. Por lo tanto, a la par que comenzamos con la documentación de interacciones lingüísticas, registramos datos que nos permitieran hacer una descripción lingüística gramatical básica para conocer las características dialectales de estos comunalectos y el funcionamiento básico del sistema fonológico con el fin de usar la escritura en los materiales didácticos iniciales que la comunidad requirió en cada caso. Podemos decir entonces que, a la par, hicimos documentación lingüística al tiempo que registramos también datos con el objetivo de hacer una descripción gramatical que necesitábamos para la elaboración de material aplicado.

El proceso de descripción gramatical de los comunalectos y la sistematización de la documentación siguen aún, pero se ha desarrollado y entregado materiales didácticos a la comunidad de Santa María Nizaviguiti.[2] Seguimos trabajando para lograr lo mismo para el comunalecto de San Pedro Ocotepec. Al mismo tiempo estamos trabajando en la sistematización de los datos registrados, en hacer más descripción lingüística y en diseñar programas de formación para lingüistas comunitarios. De esta experiencia de documentación lingüística con perspectiva comunitaria hemos podido derivar algunas consideraciones que compartimos a continuación.

Hacia una lingüística documental comunitaria

¿Qué objetivos deben tener prioridad para el proceso de documentación lingüística?

Dado que son los hablantes y las comunidades de hablantes quienes deben protagonizar los esfuerzos por revitalizar y fortalecer las lenguas en riesgo de desaparición, es muy importante que la lingüística documental, contrario a lo que tradicionalmente ha sucedido con la lingüística descriptiva, tenga una orientación comunitaria. En este sentido, los proyectos de investigación tendrían que tener como prioridad una documentación orientada a satisfacer las necesidades principales de la comunidad de hablantes así como a atender sus más grandes preocupaciones respecto a su propia lengua. En nuestro caso, la prioridad ha sido orientar el registro de datos a la creación de materiales didácticos para la enseñanza del ayuujk, una preocupación importante de los hablantes interesados en el tema en estas comunidades. Nuestro trabajo ha priorizado esto y ha supeditado la descripción gramatical al servicio de la producción de este tipo de materiales. Si bien nos interesa ubicar estos comunalectos dentro de la clasificación dialectal del mixe de Oaxaca y hacer descripción gramatical de los mismos, nos ha importado más generar los materiales que sean útiles para la revitalización y fortalecimiento de estos comunalectos.

¿En qué plataformas se debe albergar la documentación lingüística?

Es fundamental tener en cuenta que el trabajo con lenguas en riesgo de desaparición, sobre todo cuando se trata de lenguas indígenas, está fuertemente relacionado con la defensa del territorio, de los derechos lingüísticos y el derecho a la autonomía y a la libre determinación. En este tenor, la producción de documentación lingüística se relaciona por fuerza con un tema fundamental para los pueblos indígenas como lo es la soberanía de datos, la gobernanza sobre ellos y la accesibilidad a los mismos. Lejos de tener resuelto ya este asunto, durante la ejecución de nuestro proyecto, nos hemos planteado preguntas sobre las plataformas en las que se deben albergar los datos registrados, el diseño de los metadatos para su clasificación y accesibilidad, las acciones necesarias para que las personas de cada comunidad puedan consultar e interactuar con estos datos primarios debidamente clasificados. Hasta ahora, los grandes repositorios de registros y datos lingüísticos de lenguas indígenas mexicanas se encuentran en plataformas que controlan universidades de élite en países del primer mundo. Tal es el caso del Archive of the Indigenous Languages of Latin America (Archivo de los Idiomas Indígenas de Latinoamérica) de la Universidad de Texas en Austin o los programas de documentación lingüística impulsados por la Universidad de Londres. No es el objetivo aquí discutir la importancia de estos repositorios sino plantearnos la posibilidad de desarrollar los nuestros en el contexto comunitario, además de hacer accesibles a nuestras comunidades aquellos que se encuentran fuera de nuestro territorio.

¿En qué lenguas se realiza la documentación lingüística?

El hecho de ser hablantes de la lengua mixe de Oaxaca nos permitió tener un acercamiento planteado desde nuestra propia lengua con las autoridades comunitarias; esto, aunado al conocimiento que tenemos del funcionamiento comunitario, nos permitió seguir los canales de consulta adecuados. Por otro lado, el conocimiento que tenemos sobre nuestros propios comunalectos nos permitió también establecer una ruta de registro de datos que fue diseñada considerando los fenómenos gramaticales que sabemos que se diferencian con mayor frecuencia, por ejemplo, dedicamos más tiempo a la exploración de vocales bajas que a la variación de las consonantes porque sabemos que las primeras presentan una gran variación dialectal. Además de que es importante que quienes realicen la documentación hablen la lengua que estén registrando, nos parece fundamental desarrollar un metalenguaje en esta misma lengua para el registro y el análisis de sus comunalectos en aras de desarrollar una documentación lingüística comunitaria.

A modo de conclusión, creemos que es importante ir creando las condiciones para el desarrollo de una lingüística documental comunitaria como parte del ejercicio de la autonomía y libre determinación de nuestros pueblos. Entre las primeras necesidades para lograr este objetivo se encuentra la formación de lingüistas comunitarios que puedan capacitarse para hacer este trabajo de modo que se pueda lograr un registro masivo de los comunalectos del mixe de Oaxaca o de otras lenguas indígenas. Otra necesidad es la creación de una red de nodos de información en cada comunidad que, en interrelación, puedan intercambiar información que ayude a los propósitos de revitalización y fortalecimiento lingüístico. Es necesario hacer documentación lingüística que sirva a los múltiples propósitos que nos hemos trazado para impedir que nuestros comunalectos mueran. Además de esto, necesitamos desarrollar la infraestructura necesaria para albergar estos nodos de información que sirvan como repositorios de la documentación lingüística que se desarrolle desde esta perspectiva comunitaria. Estamos comenzando a trabajar en todo ello.

Referencias bibliográficas

Delgado, Amanda, y Maurice Pico
2021 “El papel de la lingüística documental en el decenio de las lenguas indígenas”, Ichan Tecocolotl, núm. 345, https://ichan.ciesas.edu.mx/el-papel-de-la-linguistica-documental-en-el-decenio-de-las-lenguas-indigenas/.

Himmelmann, Nikolaus P.
1998 “Documentary and descriptive linguistics”, Linguistics, vol. 36, pp. 161-196.

Himmelmann, Nikolaus P., Jost Gippert y Ulrike Mosel (eds.)
2007 Bases de la documentación lingüística. (Versión en español coordinada por John B. Haviland y José Antonio Flores Farfán), México, Instituto Nacional de Lenguas Indígenas.

Romero Méndez, Rodrigo
2009 “Bases de la documentación lingüística”, Estudios de lingüística aplicada, núm. 49, pp. 167-173.

Valiñas Coalla, Leopoldo
2010 “Historia lingüística: migraciones y asentamientos. Relaciones entre pueblos y lenguas”, en Rebeca Barriga Villanueva y Pedro Martín Butragueño (dirs.), Historia sociolingüística de México. Vol. 1. México, El Colegio de México, pp. 97-160.

Wichmann, Soren
1995 The Relationship Among the Mixe-Zoquean Languages of Mexico, Salt Lake City, University of Utah Press.

Wichmann, Soren
2008 “Om opdagelsen af et gränseoverskridende nyt sprog”, en Jesper Nielsen y Mettelise Fritz Hansen (eds.), De mange veje til Mesoamerika: Hyldestskrift til Una Canger, Copenhague, Afdelingen for Indianske Sprog og Kulturer, Institut for Tvärkulturelle og Regionale Studier, Københavns Universitet.


  1. Una de las principales limitaciones para el desarrollo de estos trabajos son los costos de movilidad hacia las comunidades, en esta ocasión tuvimos un apoyo destinado para viáticos por parte del Centro de Investigación en Tecnologías y Saberes Comunitarios (CITSAC).
  2. El diseño y parte de la impresión de los materiales fue posible con el financiamiento de la organización Cultural Survival que en 2022 apoyó una iniciativa que incluyó una “Jornada de diseño y creación de material didáctico para la enseñanza de la lengua mixe”. Otro tanto de impresiones de loterías y carteles se realizó con el apoyo del Centro de Investigación en Tecnologías y Saberes Comunitarios (CITSAC).