Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus

En esta investigación se aborda la relación inversa que se produce en español entre la longitud léxica y la frecuencia de uso considerando los procesos de formación de palabras. Este objetivo central se aborda al tener en cuenta la estructura (derivación) de las palabras, para lo cual se analiza cua...

Full description

Saved in:
Bibliographic Details
Main Authors: Inmaculada Martínez Martínez, Hiroto Ueda
Format: Article
Language:Catalan
Published: Universidad de Alicante 2025-01-01
Series:Estudios de Lingüística
Subjects:
Online Access:https://revistaelua.ua.es/article/view/26993
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1841537081059311616
author Inmaculada Martínez Martínez
Hiroto Ueda
author_facet Inmaculada Martínez Martínez
Hiroto Ueda
author_sort Inmaculada Martínez Martínez
collection DOAJ
description En esta investigación se aborda la relación inversa que se produce en español entre la longitud léxica y la frecuencia de uso considerando los procesos de formación de palabras. Este objetivo central se aborda al tener en cuenta la estructura (derivación) de las palabras, para lo cual se analiza cuantitativamente la relación entre la longitud de las palabras, la frecuencia de uso, la formación de palabras y el estilo de escritura. Se revisan los análisis previos, basados exclusivamente en el cómputo de caracteres (Takefuta 1981; Yoshioka 1996), y también aquellos estudios que consideran la sílaba como unidad de medida de longitud (Herdan 1956; Gómez Guinovart 1999). En ambos casos se muestran sus carencias a través del análisis estadístico. Cuando la longitud de la palabra se mide utilizando el número de sílabas, el primer término de la distribución de frecuencia, las palabras de una sílaba, se convierten en un grupo que incluye palabras de distinto número de fonemas. De esta forma, el uso de unidades de medida aproximadas, como las sílabas, da como resultado observaciones aproximadas que no proporcionan una imagen precisa de la situación. Los resultados apuntan a que la longitud de las formas debe observarse desde una perspectiva no física, sino lingüística. Se considera en este estudio que la longitud lingüística de una palabra debe medirse desde la perspectiva de la morfología derivacional teórica y práctica, es decir, mediante prefijos y sufijos, que son unidades de morfología derivada. Lo que hace posible este tipo de análisis es, en definitiva, el estudio de frecuencia de los afijos. La metodología que se sigue es la correspondiente al análisis estadístico con medidas básicas como la distribución de frecuencia, la desviación estándar y otras fórmulas de creación propia en el programa R (R Core Team 2021). Asimismo, empleamos ggplot2 (Wickham 2016) para crear gráficos. Los textos sometidos a análisis forman parte de un corpus del español contemporáneo hablado y escrito reunido ad hoc para el estudio. Esta selección pretende aportar una solución general a una variedad de materiales y no una visión particular de un único material, lo que da como resultado una conclusión no definitiva, pero sí más fiable.
format Article
id doaj-art-3009594bf2ed4bdaacfce9a3cd757cfa
institution Kabale University
issn 2171-6692
language Catalan
publishDate 2025-01-01
publisher Universidad de Alicante
record_format Article
series Estudios de Lingüística
spelling doaj-art-3009594bf2ed4bdaacfce9a3cd757cfa2025-01-14T09:24:06ZcatUniversidad de AlicanteEstudios de Lingüística2171-66922025-01-014316118110.14198/ELUA.2699335205Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpusInmaculada Martínez Martínez0https://orcid.org/0000-0003-4760-0903Hiroto Ueda1https://orcid.org/0000-0003-3204-609XUniversidad de CantabriaThe University of TokyoEn esta investigación se aborda la relación inversa que se produce en español entre la longitud léxica y la frecuencia de uso considerando los procesos de formación de palabras. Este objetivo central se aborda al tener en cuenta la estructura (derivación) de las palabras, para lo cual se analiza cuantitativamente la relación entre la longitud de las palabras, la frecuencia de uso, la formación de palabras y el estilo de escritura. Se revisan los análisis previos, basados exclusivamente en el cómputo de caracteres (Takefuta 1981; Yoshioka 1996), y también aquellos estudios que consideran la sílaba como unidad de medida de longitud (Herdan 1956; Gómez Guinovart 1999). En ambos casos se muestran sus carencias a través del análisis estadístico. Cuando la longitud de la palabra se mide utilizando el número de sílabas, el primer término de la distribución de frecuencia, las palabras de una sílaba, se convierten en un grupo que incluye palabras de distinto número de fonemas. De esta forma, el uso de unidades de medida aproximadas, como las sílabas, da como resultado observaciones aproximadas que no proporcionan una imagen precisa de la situación. Los resultados apuntan a que la longitud de las formas debe observarse desde una perspectiva no física, sino lingüística. Se considera en este estudio que la longitud lingüística de una palabra debe medirse desde la perspectiva de la morfología derivacional teórica y práctica, es decir, mediante prefijos y sufijos, que son unidades de morfología derivada. Lo que hace posible este tipo de análisis es, en definitiva, el estudio de frecuencia de los afijos. La metodología que se sigue es la correspondiente al análisis estadístico con medidas básicas como la distribución de frecuencia, la desviación estándar y otras fórmulas de creación propia en el programa R (R Core Team 2021). Asimismo, empleamos ggplot2 (Wickham 2016) para crear gráficos. Los textos sometidos a análisis forman parte de un corpus del español contemporáneo hablado y escrito reunido ad hoc para el estudio. Esta selección pretende aportar una solución general a una variedad de materiales y no una visión particular de un único material, lo que da como resultado una conclusión no definitiva, pero sí más fiable.https://revistaelua.ua.es/article/view/26993longitud léxicafrecuencia de usoformación de palabrasanálisis estadísticoespañol contemporáneolongitud lingüística
spellingShingle Inmaculada Martínez Martínez
Hiroto Ueda
Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus
Estudios de Lingüística
longitud léxica
frecuencia de uso
formación de palabras
análisis estadístico
español contemporáneo
longitud lingüística
title Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus
title_full Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus
title_fullStr Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus
title_full_unstemmed Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus
title_short Longitud léxica y frecuencia de uso en el español contemporáneo: un análisis estadístico de corpus
title_sort longitud lexica y frecuencia de uso en el espanol contemporaneo un analisis estadistico de corpus
topic longitud léxica
frecuencia de uso
formación de palabras
análisis estadístico
español contemporáneo
longitud lingüística
url https://revistaelua.ua.es/article/view/26993
work_keys_str_mv AT inmaculadamartinezmartinez longitudlexicayfrecuenciadeusoenelespanolcontemporaneounanalisisestadisticodecorpus
AT hirotoueda longitudlexicayfrecuenciadeusoenelespanolcontemporaneounanalisisestadisticodecorpus