ПОРІВНЯННЯ ЕФЕКТИВНОСТІ МОДЕЛЕЙ ГЛИБОКОГО НАВЧАННЯ В ЗАДАЧАХ ГЕНЕРУВАННЯ ТЕКСТОВИХ ОПИСІВ ЗАПЧАСТИН ДО СІЛЬСЬКОГОСПОДАРСЬКОЇ ТЕХНІКИ

Завантажень

Завантажень за місяць протягом останнього року

Ганжа, О. О. та Іванчук, Н. В. (2024) ПОРІВНЯННЯ ЕФЕКТИВНОСТІ МОДЕЛЕЙ ГЛИБОКОГО НАВЧАННЯ В ЗАДАЧАХ ГЕНЕРУВАННЯ ТЕКСТОВИХ ОПИСІВ ЗАПЧАСТИН ДО СІЛЬСЬКОГОСПОДАРСЬКОЇ ТЕХНІКИ. Вісник Національного університету водного господарства та природокористування (1(105)). с. 273-281.

[img] Text
Vt10521.pdf

Download(225kB)

Анотація

В статті розглянуто процес генерації текстових описів за допомогою моделей глибокого навчання. Було підготовлено набір даних для дослідження ефективності моделей в галузі запчастин до сільськогосподарської техніки. На розглянутому наборі проведено навчання моделей-трансформерів на архітектурах GPT- 2, XLM-RoBERTa та ELECTRA. Для порівняння ефективності моделей використано машиноцентричні та людиноцентричні методи. Результати дослідження показали придатність моделей для генерування описів та виявили ряд недоліків методу. Дані результати можуть бути використані для подальшого вдосконалення методик генерації для отримання більш ефективних моделей, придатних для комерційного використання.

Title in English

COMPARISON OF THE EFFECTIVENESS OF DEEP LEARNING MODELS IN GENERATING TEXTUAL DESCRIPTIONS OF SPARE PARTS FOR AGRICULTURAL MACHINERY

English abstract

In recent years, deep learning models have made significant strides in text generation, enabling the creation of text that closely resembles human writing. This has become highly popular in various domains such as news, social media, and creative writing. The use of text generation has sparked significant interest in academic circles, particularly due to its ability to replace humans in writing commercial texts. This study compares the effectiveness of different transformer model architectures in generating text descriptions based on headlines, using data on agricultural machinery parts. For this study, a dataset comprising approximately 19,000 Ukrainian-language descriptions of agricultural machinery parts collected from online stores was prepared. The main fields in the dataset include product name, catalog number, short description, specifications, and full description, which is a combination of the former. Three transformer models were selected for the study: GPT-2, XLM-RoBERTa, and ELECTRA, which were trained on the dataset. The performance of the models was evaluated using numerical metrics such as BLEU, METEOR, and ROUGE, using randomly selected instances from the same dataset used for training. Analyzing the results, it is evident that GPT-2 shows the best performance overall, except for the BLEU metric, where XLM- RoBERTa slightly outperforms it. The example demonstrates that all models generate natural language, but the accuracy of the data is insufficient, especially in product specifications. The conclusions indicate that transformer models, especially GPT-2, are capable of generating product descriptions for online stores, but the accuracy of such descriptions leaves room for improvement, especially in the field of spare parts. In such cases, the generation method needs significant refinement.

Тип елементу : Стаття
Ключові слова: нейронні мережі; глибоке навчання; обробка природної мови; генерація тексту; сільськогосподарська техніка; neural networks; deep learning; natural language processing; text generation; agricultural machinery
УДК: 004.912
Бібліографічний опис: Ганжа О. О. Порівняння ефективності моделей глибокого навчання в задачах генерування текстових описів запчастин до сільськогосподарської техніки / О. О. Ганжа, Н. В. Іванчук // Вісник НУВГП. Технічні науки : зб. наук. праць. - Рівне, 2024. - Вип. 1(105). - С. 273-281.
Тематики: Видання університету > Вісник НУВГП > серія "Технічні науки" > 2024 > Вісник 1
Видання університету > Вісник НУВГП > серія "Технічні науки" > 2024
Видання університету
Користувач, що депонує: С. Й. Гипчинська
Дата внесення: 15 Лист 2024 07:18
Останні зміни: 15 Лист 2024 07:18
URI: http://ep3.nuwm.edu.ua/id/eprint/31597
Перегляд елементу Перегляд елементу

Завантажень

Завантажень за місяць протягом останнього року