Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel

Suurte keelemudelite ja tehisintellekti kiire areng pakub võimalusi nende mitmekülgseks rakendamiseks, mh erialakeele arendamisel. Artikli eesmärk on analüüsida riigikaitsevaldkonna terminitöö näitel välistoelise genereerimise (RAG) sobivust ja tõhusust definitsioonide ja allikaviidete väljatoomisel...

Full description

Saved in:
Bibliographic Details
Main Authors: Sandra Eiche, Reet Hendrikson, Eleri Aedmaa, Esta Prangel, Mari-Liis Tikerperi
Format: Article
Language:English
Published: Eesti Rakenduslingvistika Ühing (Estonian Association for Applied Linguistics) 2025-04-01
Series:Eesti Rakenduslingvistika Ühingu Aastaraamat
Subjects:
Online Access:http://arhiiv.rakenduslingvistika.ee/ajakirjad/index.php/aastaraamat/article/view/ERYa21.02
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1849315770882850816
author Sandra Eiche
Reet Hendrikson
Eleri Aedmaa
Esta Prangel
Mari-Liis Tikerperi
author_facet Sandra Eiche
Reet Hendrikson
Eleri Aedmaa
Esta Prangel
Mari-Liis Tikerperi
author_sort Sandra Eiche
collection DOAJ
description Suurte keelemudelite ja tehisintellekti kiire areng pakub võimalusi nende mitmekülgseks rakendamiseks, mh erialakeele arendamisel. Artikli eesmärk on analüüsida riigikaitsevaldkonna terminitöö näitel välistoelise genereerimise (RAG) sobivust ja tõhusust definitsioonide ja allikaviidete väljatoomisel alusdokumentidest. Esialgsed tulemused näitavad, et RAG-süsteem leiab alusandmetest täpselt definitsioone ja allikaviiteid, mis teeb sellest sobiliku abivahendi terminoloogi töö tõhustamiseks. Seega on alust eeldada, et RAG-süsteemi abil saab toetada teisigi terminitöö etappe, nt pakkuda mõistekirje koostamiseks välja vajalikku infot, aidata visandada mõistesüsteemi, viidata võimalikele probleemidele algtekstis jm. Süsteem ei suuda terminoloogi küll asendada, ent abivahendina on RAG terminiarenduses perspektiivikas. *** "Applying artificial intelligence in specialized language development: The example of Estonian national defense terminology" *** This article explores the application of Retrieval-Augmented Generation (RAG) for extracting definitions and source references in defense terminology. By integrating external data during generation, RAG enhances large language models, reducing hallucinations and improving accuracy. This capability is critical in fields like defense terminology, where precise definitions and reliable references are essential. The study found that RAG accurately extracts definitions and references from foundational documents, achieving a precision of 89.6% for definitions and 98.9% for references. However, challenges exist, particularly in parsing documents like PDFs, which can lead to occasional inaccuracies. These issues highlight the importance of terminologists for ensuring data quality, as RAG cannot fully replace human oversight. Despite these limitations, RAG holds promise as a tool to support terminology work by efficiently retrieving relevant data and assisting in dictionary compilation. It also offers potential for enhancing other stages of terminology development, such as suggesting synonyms and identifying issues in source texts. Further improvements, such as refining document parsing and reference validation, could enhance RAG’s reliability, making it a valuable tool for terminologists.
format Article
id doaj-art-bca4876e05af40668dee9ffb3c8c3fa4
institution Kabale University
issn 1736-2563
2228-0677
language English
publishDate 2025-04-01
publisher Eesti Rakenduslingvistika Ühing (Estonian Association for Applied Linguistics)
record_format Article
series Eesti Rakenduslingvistika Ühingu Aastaraamat
spelling doaj-art-bca4876e05af40668dee9ffb3c8c3fa42025-08-20T03:52:03ZengEesti Rakenduslingvistika Ühing (Estonian Association for Applied Linguistics)Eesti Rakenduslingvistika Ühingu Aastaraamat1736-25632228-06772025-04-0121294510.5128/ERYa21.02Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitelSandra Eiche0Reet Hendrikson1Eleri Aedmaa2Esta Prangel3Mari-Liis Tikerperi4Institute of the Estonian LanguageEstonian Military AcademyInstitute of the Estonian LanguageInstitute of the Estonian LanguageEstonian Military AcademySuurte keelemudelite ja tehisintellekti kiire areng pakub võimalusi nende mitmekülgseks rakendamiseks, mh erialakeele arendamisel. Artikli eesmärk on analüüsida riigikaitsevaldkonna terminitöö näitel välistoelise genereerimise (RAG) sobivust ja tõhusust definitsioonide ja allikaviidete väljatoomisel alusdokumentidest. Esialgsed tulemused näitavad, et RAG-süsteem leiab alusandmetest täpselt definitsioone ja allikaviiteid, mis teeb sellest sobiliku abivahendi terminoloogi töö tõhustamiseks. Seega on alust eeldada, et RAG-süsteemi abil saab toetada teisigi terminitöö etappe, nt pakkuda mõistekirje koostamiseks välja vajalikku infot, aidata visandada mõistesüsteemi, viidata võimalikele probleemidele algtekstis jm. Süsteem ei suuda terminoloogi küll asendada, ent abivahendina on RAG terminiarenduses perspektiivikas. *** "Applying artificial intelligence in specialized language development: The example of Estonian national defense terminology" *** This article explores the application of Retrieval-Augmented Generation (RAG) for extracting definitions and source references in defense terminology. By integrating external data during generation, RAG enhances large language models, reducing hallucinations and improving accuracy. This capability is critical in fields like defense terminology, where precise definitions and reliable references are essential. The study found that RAG accurately extracts definitions and references from foundational documents, achieving a precision of 89.6% for definitions and 98.9% for references. However, challenges exist, particularly in parsing documents like PDFs, which can lead to occasional inaccuracies. These issues highlight the importance of terminologists for ensuring data quality, as RAG cannot fully replace human oversight. Despite these limitations, RAG holds promise as a tool to support terminology work by efficiently retrieving relevant data and assisting in dictionary compilation. It also offers potential for enhancing other stages of terminology development, such as suggesting synonyms and identifying issues in source texts. Further improvements, such as refining document parsing and reference validation, could enhance RAG’s reliability, making it a valuable tool for terminologists.http://arhiiv.rakenduslingvistika.ee/ajakirjad/index.php/aastaraamat/article/view/ERYa21.02välistoeline genereerimine (rag)suured keelemudeliderialakeelterminoloogiadefinitsioonmõisteterminriigikaitsesõjateaduseesti keelinglise keelretrieval-augmented generation (rag)llmspecialized languageterminologydefinition
spellingShingle Sandra Eiche
Reet Hendrikson
Eleri Aedmaa
Esta Prangel
Mari-Liis Tikerperi
Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel
Eesti Rakenduslingvistika Ühingu Aastaraamat
välistoeline genereerimine (rag)
suured keelemudelid
erialakeel
terminoloogia
definitsioon
mõiste
termin
riigikaitse
sõjateadus
eesti keel
inglise keel
retrieval-augmented generation (rag)
llm
specialized language
terminology
definition
title Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel
title_full Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel
title_fullStr Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel
title_full_unstemmed Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel
title_short Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel
title_sort tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia naitel
topic välistoeline genereerimine (rag)
suured keelemudelid
erialakeel
terminoloogia
definitsioon
mõiste
termin
riigikaitse
sõjateadus
eesti keel
inglise keel
retrieval-augmented generation (rag)
llm
specialized language
terminology
definition
url http://arhiiv.rakenduslingvistika.ee/ajakirjad/index.php/aastaraamat/article/view/ERYa21.02
work_keys_str_mv AT sandraeiche tehisintellektirakendamineerialakeelearendamiselriigikaitseterminoloogianaitel
AT reethendrikson tehisintellektirakendamineerialakeelearendamiselriigikaitseterminoloogianaitel
AT eleriaedmaa tehisintellektirakendamineerialakeelearendamiselriigikaitseterminoloogianaitel
AT estaprangel tehisintellektirakendamineerialakeelearendamiselriigikaitseterminoloogianaitel
AT mariliistikerperi tehisintellektirakendamineerialakeelearendamiselriigikaitseterminoloogianaitel