Una propuesta de herramientas informáticas para el tratamiento estadístico del índice de disponibilidad léxica en estudios correlacionales de educación y movilidad social
A Proposal of Computer Tools for the Statistical Treatment of the Lexical Availability Index in Education and Social Mobility Correlation Studies
DOI:
https://doi.org/10.15446/fyf.v34n1.80581Palabras clave:
educación, estudios correlacionales, herramientas tecnológicas, lingüística de corpus, minería de datos (es)corpus linguistics, correlational studies, data mining, education, technological tools (en)
El trabajo plantea una propuesta para el procesamiento de índices de disponibilidad léxica (ámbito educativo) mediante herramientas estadísticas más eficientes que las usadas en la última década. El planteamiento asociado deriva una ruta de ejercicio interdisciplinar entre lingüistas y estadísticos que capitaliza los corpus lingüísticos, tratándolos como estudios correlacionales dentro del marco de la minería de datos. Se muestran resultados iniciales de la fase cuantitativa del estudio La escuela secundaria como reguladora de los factores discursivos correlativos entre disponibilidad léxica y movilidad social, procesados con metodología de lingüística de corpus y software estadístico libre, correlacionando, con alta eficiencia, índices de disponibilidad léxica y perspectiva de movilidad social en alumnos de secundaria en Saltillo, Coahuila, México, y como un corpus viable de ser correlacionado con bases de datos parciales o censuales para la toma de decisiones en el aula y la política pública por la posibilidad de correlación entre bases de datos.
The work presents a proposal for the processing of lexical availability indexes (educational field) through the employment of more efficient statistical tools than the ones used in the last decade. The associated approach derives from an interdisciplinary exercise route between linguists and statisticians that capitalizes on a linguistic corpus, treating them as correlational studies within the framework of data mining. Initial results of the quantitative phase of the study The high school as a regulator of the correlative discursive factors between lexical availability and social mobility are shown, processed with corpus linguistics methodology and free statistical software, correlating, with high efficiency, indices of lexical availability, and perspective of social mobility in high school students in Saltillo, Coahuila, Mexico, and as a viable corpus to be correlated with partial or census databases for decision-making in the classroom and public policy due to the possibility of a correlation between databases.
Referencias
Adler, J. (2009). R in Nutshell. O´Reilly.
Arriaga, R. (2003). Memorias del Encuentro sobre problemas para la enseñanza del español. En Educación e involución de la complejidad lingüística (pp. 33-46). UAZ.
Ayres, R. (1994). Information, Entropy, and Progress. AIP Press American Institute of Physics.
Bauman, Z. (2005). Tiempos líquidos. Tusquets.
Baayen, R. (2008). Analyzing Linguistic Data. Cambridge University Press. https://doi.org/10.1017/CBO9780511801686
Bolaños, S. (2015). La Lingüística de Corpus, perspectivas para la investigación lingüistica contemporánea. Forma y Función, 28(1), 31-54. https://doi.org/10.15446/fyf.v28n1.51970
Bourdieu, P. (2011). Capital cultural, escuela y espacio social. Siglo XXI.
Conapo. (2019). Informe sobre el consumo de drogas en México y su atención integral. Conadic.
Cortez, G. (2016). Una aplicación de la disponibilidad léxica. UAZ.
Du Bois, P. (2009). MySQL. Addison-Wesley.
Echeverría, M., & Parada, C. (1990). DispoLex. Programa de cómputo. Universidad de la Concepción.
Graser, A. (2013). Learning QGIS 2.0. Packt Publishing.
Goffman, E. (1997). La presentación de la persona en la vida cotidiana. Amorrotu.
INEGI. (2010). Censo 2010. Instituto Nacional de Estadística, Geografía e Informática. http://www.beta.inegi.org.mx/proyectos/enchogares/especiales/intercensal/
Janert, P. (2010). Data Analysis with Open Source Tools. O'Reilly.
Kelleher, J., & Tierney, B. (2018). Data science. MIT Press. https://doi.org/10.7551/mitpress/11140.001.0001
Konishi, S., & Kitagawa, G. (2008). Information Criteria and Statitical Modeling. Springer. https://doi.org/10.1007/978-0-387-71887-3
Liu, B. (2015). Sentiment Analysis. Mining Opinions, Sentiment, and Emotions. Cambridge University Press. https://doi.org/10.1017/CBO9781139084789.003
López, H. (1996). Los estudios de disponibilidad léxica, pasado y presente. Boletín de Filología, 35(1), 245-259.
López, J. (2003). ¿Qué te viene a la memoria? UAZ.
López, J. (2008). Estudio de disponibilidad léxica en 43 estudiantes de ELE. Universidad de Nebrija.
Michea, R. (1953). Mots fréquents et mots disponibles. Un aspecto Nouveau de la statistique du language. Les Langues Modernes, 47(1), 338-344.
Moreno, F. (1995). Cálculo de disponibilidad léxica. El programa LexiDisp. Lingüística, 51(2), 243-250.
Pacheco, C. (2016). Incidencia de la vairable «sexo» en la dsponibilidad léxica de estudiantes preuniversitarios en Pinar del Río, Cuba. Íkala, 22(2), 237-253. https://doi.org/10.17533/udea.ikala.v22n02a05
Pérez, M. (2020). Análisis del léxico disponible del centro de interés del insulto en estudiantes de secundaria de San Luis Potosí, México. Revista de Filología y Lingüística de la Universidad de Costa Rica, 46(1), 261-278. https://doi.org/10.15517/rfl.v46i1.41164
Perkins, J. (2014). Python 3 Text Processing with NLTK3 Cookbook. Packt Publishing.
R Core Team. (2018). Language and Enviroment for Statistical Computing. R Foundation for Statistical Computing.
Reyes, D., & Flores, M. (2018). La movilidad social en los implícitos discursivos de estudiantes de secundaria en México. De la escuela pública a la privada. Oxímora, 13(2), 58-80. https://doi.org/10.1344/oxi.2018.i13.22341
Rojas, D. (2017). Metodología de análisis de disponibilidad léxica en alumnos de Pedagogía a través de la comparación jerárquica de lexicones. Formación universitaria, 10(4), 3-14. https://doi.org/10.4067/S0718-50062017000400002
Russell, M. (2014). Mining the Social Web. O'Reilly.
Shmueli, G. (2018). Data Mining for Bussines Analytics. Concepts, Techniques and Applications in R. Wiley.
Silge, J., & Robinson, D. (2017). Text Mining with R. O'Reilly.
Torgo, L. (2011). Mining with R. Chapnam and Hall/CRC. https://doi.org/10.1201/b10328
Urbizagástegui, R., & Restrepo, C. (2011). La ley de Zipf y el punto de transición de Goffman en la indización automática. Revista de Investigación Bibliotecnológica, 25(54), 25-32. https://doi.org/10.22201/iibi.0187358xp.2011.54.27482
Cómo citar
APA
ACM
ACS
ABNT
Chicago
Harvard
IEEE
MLA
Turabian
Vancouver
Descargar cita
CrossRef Cited-by
1. Marco Antonio Pérez Durán, Alejandro César Rico Martínez, Alejandra Haydee Moreno Sánchez. (2025). Uso de Python en el análisis de la disponibilidad léxica. Boletín de la Academia Peruana de la Lengua, 78(78), p.235. https://doi.org/10.46744/bapl.202502.007.
Dimensions
PlumX
Visitas a la página del resumen del artículo
Descargas
Licencia
Derechos de autor 2020 Forma y Función

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Forma y Función está suscrita al convenio Open Journal System, lo que significa que tiene el carácter de acceso abierto. Se provee acceso libre e inmediato a su contenido, bajo el principio de que hacer disponible gratuitamente los resultados de investigación contribuye a la divulgación global del conocimiento, así como al intercambio académico que propicia vínculos entre las comunidades científicas. Los usuarios pueden buscar, leer, copiar, descargar y compartir la totalidad de los textos publicados. Se autoriza su uso, siempre y cuando se conceda el crédito a los autores de los textos y a Forma y Función como fuente original de la publicación. No se permite el uso comercial de copia o distribución de contenidos, así como tampoco la adaptación, derivación o transformación alguna de estos sin la autorización previa de los autores y del editor de Forma y Función.
Los contenidos de la revista son publicados en acceso abierto bajo la Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional. Para mayor información sobre los términos de la licencia, se puede consultar: http://creativecommons.org/licenses/by-nc-sa/4.0/legalcode.
En consonancia con la política de acceso abierto, Forma y Función no aplica cargos por el procesamiento de los textos enviados, ni por su publicación.














