Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel
Suurte keelemudelite ja tehisintellekti kiire areng pakub võimalusi nende mitmekülgseks rakendamiseks, mh erialakeele arendamisel. Artikli eesmärk on analüüsida riigikaitsevaldkonna terminitöö näitel välistoelise genereerimise (RAG) sobivust ja tõhusust definitsioonide ja allikaviidete väljatoomisel...
Saved in:
| Main Authors: | , , , , |
|---|---|
| Format: | Article |
| Language: | English |
| Published: |
Eesti Rakenduslingvistika Ühing (Estonian Association for Applied Linguistics)
2025-04-01
|
| Series: | Eesti Rakenduslingvistika Ühingu Aastaraamat |
| Subjects: | |
| Online Access: | http://arhiiv.rakenduslingvistika.ee/ajakirjad/index.php/aastaraamat/article/view/ERYa21.02 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| _version_ | 1849315770882850816 |
|---|---|
| author | Sandra Eiche Reet Hendrikson Eleri Aedmaa Esta Prangel Mari-Liis Tikerperi |
| author_facet | Sandra Eiche Reet Hendrikson Eleri Aedmaa Esta Prangel Mari-Liis Tikerperi |
| author_sort | Sandra Eiche |
| collection | DOAJ |
| description | Suurte keelemudelite ja tehisintellekti kiire areng pakub võimalusi nende mitmekülgseks rakendamiseks, mh erialakeele arendamisel. Artikli eesmärk on analüüsida riigikaitsevaldkonna terminitöö näitel välistoelise genereerimise (RAG) sobivust ja tõhusust definitsioonide ja allikaviidete väljatoomisel alusdokumentidest. Esialgsed tulemused näitavad, et RAG-süsteem leiab alusandmetest täpselt definitsioone ja allikaviiteid, mis teeb sellest sobiliku abivahendi terminoloogi töö tõhustamiseks. Seega on alust eeldada, et RAG-süsteemi abil saab toetada teisigi terminitöö etappe, nt pakkuda mõistekirje koostamiseks välja vajalikku infot, aidata visandada mõistesüsteemi, viidata võimalikele probleemidele algtekstis jm. Süsteem ei suuda terminoloogi küll asendada, ent abivahendina on RAG terminiarenduses perspektiivikas. *** "Applying artificial intelligence in specialized language development: The example of Estonian national defense terminology" *** This article explores the application of Retrieval-Augmented Generation (RAG) for extracting definitions and source references in defense terminology. By integrating external data during generation, RAG enhances large language models, reducing hallucinations and improving accuracy. This capability is critical in fields like defense terminology, where precise definitions and reliable references are essential. The study found that RAG accurately extracts definitions and references from foundational documents, achieving a precision of 89.6% for definitions and 98.9% for references. However, challenges exist, particularly in parsing documents like PDFs, which can lead to occasional inaccuracies. These issues highlight the importance of terminologists for ensuring data quality, as RAG cannot fully replace human oversight. Despite these limitations, RAG holds promise as a tool to support terminology work by efficiently retrieving relevant data and assisting in dictionary compilation. It also offers potential for enhancing other stages of terminology development, such as suggesting synonyms and identifying issues in source texts. Further improvements, such as refining document parsing and reference validation, could enhance RAG’s reliability, making it a valuable tool for terminologists. |
| format | Article |
| id | doaj-art-bca4876e05af40668dee9ffb3c8c3fa4 |
| institution | Kabale University |
| issn | 1736-2563 2228-0677 |
| language | English |
| publishDate | 2025-04-01 |
| publisher | Eesti Rakenduslingvistika Ühing (Estonian Association for Applied Linguistics) |
| record_format | Article |
| series | Eesti Rakenduslingvistika Ühingu Aastaraamat |
| spelling | doaj-art-bca4876e05af40668dee9ffb3c8c3fa42025-08-20T03:52:03ZengEesti Rakenduslingvistika Ühing (Estonian Association for Applied Linguistics)Eesti Rakenduslingvistika Ühingu Aastaraamat1736-25632228-06772025-04-0121294510.5128/ERYa21.02Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitelSandra Eiche0Reet Hendrikson1Eleri Aedmaa2Esta Prangel3Mari-Liis Tikerperi4Institute of the Estonian LanguageEstonian Military AcademyInstitute of the Estonian LanguageInstitute of the Estonian LanguageEstonian Military AcademySuurte keelemudelite ja tehisintellekti kiire areng pakub võimalusi nende mitmekülgseks rakendamiseks, mh erialakeele arendamisel. Artikli eesmärk on analüüsida riigikaitsevaldkonna terminitöö näitel välistoelise genereerimise (RAG) sobivust ja tõhusust definitsioonide ja allikaviidete väljatoomisel alusdokumentidest. Esialgsed tulemused näitavad, et RAG-süsteem leiab alusandmetest täpselt definitsioone ja allikaviiteid, mis teeb sellest sobiliku abivahendi terminoloogi töö tõhustamiseks. Seega on alust eeldada, et RAG-süsteemi abil saab toetada teisigi terminitöö etappe, nt pakkuda mõistekirje koostamiseks välja vajalikku infot, aidata visandada mõistesüsteemi, viidata võimalikele probleemidele algtekstis jm. Süsteem ei suuda terminoloogi küll asendada, ent abivahendina on RAG terminiarenduses perspektiivikas. *** "Applying artificial intelligence in specialized language development: The example of Estonian national defense terminology" *** This article explores the application of Retrieval-Augmented Generation (RAG) for extracting definitions and source references in defense terminology. By integrating external data during generation, RAG enhances large language models, reducing hallucinations and improving accuracy. This capability is critical in fields like defense terminology, where precise definitions and reliable references are essential. The study found that RAG accurately extracts definitions and references from foundational documents, achieving a precision of 89.6% for definitions and 98.9% for references. However, challenges exist, particularly in parsing documents like PDFs, which can lead to occasional inaccuracies. These issues highlight the importance of terminologists for ensuring data quality, as RAG cannot fully replace human oversight. Despite these limitations, RAG holds promise as a tool to support terminology work by efficiently retrieving relevant data and assisting in dictionary compilation. It also offers potential for enhancing other stages of terminology development, such as suggesting synonyms and identifying issues in source texts. Further improvements, such as refining document parsing and reference validation, could enhance RAG’s reliability, making it a valuable tool for terminologists.http://arhiiv.rakenduslingvistika.ee/ajakirjad/index.php/aastaraamat/article/view/ERYa21.02välistoeline genereerimine (rag)suured keelemudeliderialakeelterminoloogiadefinitsioonmõisteterminriigikaitsesõjateaduseesti keelinglise keelretrieval-augmented generation (rag)llmspecialized languageterminologydefinition |
| spellingShingle | Sandra Eiche Reet Hendrikson Eleri Aedmaa Esta Prangel Mari-Liis Tikerperi Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel Eesti Rakenduslingvistika Ühingu Aastaraamat välistoeline genereerimine (rag) suured keelemudelid erialakeel terminoloogia definitsioon mõiste termin riigikaitse sõjateadus eesti keel inglise keel retrieval-augmented generation (rag) llm specialized language terminology definition |
| title | Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel |
| title_full | Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel |
| title_fullStr | Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel |
| title_full_unstemmed | Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel |
| title_short | Tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia näitel |
| title_sort | tehisintellekti rakendamine erialakeele arendamisel riigikaitseterminoloogia naitel |
| topic | välistoeline genereerimine (rag) suured keelemudelid erialakeel terminoloogia definitsioon mõiste termin riigikaitse sõjateadus eesti keel inglise keel retrieval-augmented generation (rag) llm specialized language terminology definition |
| url | http://arhiiv.rakenduslingvistika.ee/ajakirjad/index.php/aastaraamat/article/view/ERYa21.02 |
| work_keys_str_mv | AT sandraeiche tehisintellektirakendamineerialakeelearendamiselriigikaitseterminoloogianaitel AT reethendrikson tehisintellektirakendamineerialakeelearendamiselriigikaitseterminoloogianaitel AT eleriaedmaa tehisintellektirakendamineerialakeelearendamiselriigikaitseterminoloogianaitel AT estaprangel tehisintellektirakendamineerialakeelearendamiselriigikaitseterminoloogianaitel AT mariliistikerperi tehisintellektirakendamineerialakeelearendamiselriigikaitseterminoloogianaitel |