Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus

En esta investigación se aborda la relación inversa que se produce en español entre la longitud léxica y la frecuencia de uso considerando los procesos de formación de palabras. Este objetivo central se aborda al tener en cuenta la estructura (derivación) de las palabras, para lo cual se analiza cua...

Full description

Saved in:

Bibliographic Details
Main Authors:	Inmaculada Martínez Martínez, Hiroto Ueda
Format:	Article
Language:	Catalan
Published:	Universidad de Alicante 2025-01-01
Series:	Estudios de Lingüística
Subjects:	longitud léxica frecuencia de uso formación de palabras análisis estadístico español contemporáneo longitud lingüística
Online Access:	https://revistaelua.ua.es/article/view/26993
Tags:	Add Tag No Tags, Be the first to tag this record!

_version_	1841537081059311616
author	Inmaculada Martínez Martínez Hiroto Ueda
author_facet	Inmaculada Martínez Martínez Hiroto Ueda
author_sort	Inmaculada Martínez Martínez
collection	DOAJ
description	En esta investigación se aborda la relación inversa que se produce en español entre la longitud léxica y la frecuencia de uso considerando los procesos de formación de palabras. Este objetivo central se aborda al tener en cuenta la estructura (derivación) de las palabras, para lo cual se analiza cuantitativamente la relación entre la longitud de las palabras, la frecuencia de uso, la formación de palabras y el estilo de escritura. Se revisan los análisis previos, basados exclusivamente en el cómputo de caracteres (Takefuta 1981; Yoshioka 1996), y también aquellos estudios que consideran la sílaba como unidad de medida de longitud (Herdan 1956; Gómez Guinovart 1999). En ambos casos se muestran sus carencias a través del análisis estadístico. Cuando la longitud de la palabra se mide utilizando el número de sílabas, el primer término de la distribución de frecuencia, las palabras de una sílaba, se convierten en un grupo que incluye palabras de distinto número de fonemas. De esta forma, el uso de unidades de medida aproximadas, como las sílabas, da como resultado observaciones aproximadas que no proporcionan una imagen precisa de la situación. Los resultados apuntan a que la longitud de las formas debe observarse desde una perspectiva no física, sino lingüística. Se considera en este estudio que la longitud lingüística de una palabra debe medirse desde la perspectiva de la morfología derivacional teórica y práctica, es decir, mediante prefijos y sufijos, que son unidades de morfología derivada. Lo que hace posible este tipo de análisis es, en definitiva, el estudio de frecuencia de los afijos. La metodología que se sigue es la correspondiente al análisis estadístico con medidas básicas como la distribución de frecuencia, la desviación estándar y otras fórmulas de creación propia en el programa R (R Core Team 2021). Asimismo, empleamos ggplot2 (Wickham 2016) para crear gráficos. Los textos sometidos a análisis forman parte de un corpus del español contemporáneo hablado y escrito reunido ad hoc para el estudio. Esta selección pretende aportar una solución general a una variedad de materiales y no una visión particular de un único material, lo que da como resultado una conclusión no definitiva, pero sí más fiable.
format	Article
id	doaj-art-3009594bf2ed4bdaacfce9a3cd757cfa
institution	Kabale University
issn	2171-6692
language	Catalan
publishDate	2025-01-01
publisher	Universidad de Alicante
record_format	Article
series	Estudios de Lingüística
spelling	doaj-art-3009594bf2ed4bdaacfce9a3cd757cfa2025-01-14T09:24:06ZcatUniversidad de AlicanteEstudios de Lingüística2171-66922025-01-014316118110.14198/ELUA.2699335205Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpusInmaculada Martínez Martínez0https://orcid.org/0000-0003-4760-0903Hiroto Ueda1https://orcid.org/0000-0003-3204-609XUniversidad de CantabriaThe University of TokyoEn esta investigación se aborda la relación inversa que se produce en español entre la longitud léxica y la frecuencia de uso considerando los procesos de formación de palabras. Este objetivo central se aborda al tener en cuenta la estructura (derivación) de las palabras, para lo cual se analiza cuantitativamente la relación entre la longitud de las palabras, la frecuencia de uso, la formación de palabras y el estilo de escritura. Se revisan los análisis previos, basados exclusivamente en el cómputo de caracteres (Takefuta 1981; Yoshioka 1996), y también aquellos estudios que consideran la sílaba como unidad de medida de longitud (Herdan 1956; Gómez Guinovart 1999). En ambos casos se muestran sus carencias a través del análisis estadístico. Cuando la longitud de la palabra se mide utilizando el número de sílabas, el primer término de la distribución de frecuencia, las palabras de una sílaba, se convierten en un grupo que incluye palabras de distinto número de fonemas. De esta forma, el uso de unidades de medida aproximadas, como las sílabas, da como resultado observaciones aproximadas que no proporcionan una imagen precisa de la situación. Los resultados apuntan a que la longitud de las formas debe observarse desde una perspectiva no física, sino lingüística. Se considera en este estudio que la longitud lingüística de una palabra debe medirse desde la perspectiva de la morfología derivacional teórica y práctica, es decir, mediante prefijos y sufijos, que son unidades de morfología derivada. Lo que hace posible este tipo de análisis es, en definitiva, el estudio de frecuencia de los afijos. La metodología que se sigue es la correspondiente al análisis estadístico con medidas básicas como la distribución de frecuencia, la desviación estándar y otras fórmulas de creación propia en el programa R (R Core Team 2021). Asimismo, empleamos ggplot2 (Wickham 2016) para crear gráficos. Los textos sometidos a análisis forman parte de un corpus del español contemporáneo hablado y escrito reunido ad hoc para el estudio. Esta selección pretende aportar una solución general a una variedad de materiales y no una visión particular de un único material, lo que da como resultado una conclusión no definitiva, pero sí más fiable.https://revistaelua.ua.es/article/view/26993longitud léxicafrecuencia de usoformación de palabrasanálisis estadísticoespañol contemporáneolongitud lingüística
spellingShingle	Inmaculada Martínez Martínez Hiroto Ueda Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus Estudios de Lingüística longitud léxica frecuencia de uso formación de palabras análisis estadístico español contemporáneo longitud lingüística
title	Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus
title_full	Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus
title_fullStr	Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus
title_full_unstemmed	Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus
title_short	Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus
title_sort	longitud lexica y frecuencia de uso en el espanol contemporaneo un analisis estadistico de corpus
topic	longitud léxica frecuencia de uso formación de palabras análisis estadístico español contemporáneo longitud lingüística
url	https://revistaelua.ua.es/article/view/26993
work_keys_str_mv	AT inmaculadamartinezmartinez longitudlexicayfrecuenciadeusoenelespanolcontemporaneounanalisisestadisticodecorpus AT hirotoueda longitudlexicayfrecuenciadeusoenelespanolcontemporaneounanalisisestadisticodecorpus

Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus

Similar Items