Система класифікації текстових документів із використанням технологій Big Data

dc.contributor.authorМороз, Б.
dc.contributor.authorКабак, Л.
dc.contributor.authorВарех, Н. В.
dc.contributor.authorМороз, Д.
dc.contributor.authorVarekh, N. V.
dc.contributor.authorMoroz, B.
dc.contributor.authorKabak, L.
dc.contributor.authorMoroz, D.
dc.date.accessioned2024-11-18T09:28:29Z
dc.date.issued2023
dc.description.abstractУ роботі було розглянуто модель системи класифікації документів з використанням технології Big Data. При використанні технології Big Data на сервері накопичується великий масив документів, які потрібно попередньо обробити та завантажити у базу даних. В документах потрібно визначити ключові слова за допомогою яких їх потрібно віднести до однієї або декількох тематичних розділів. Крім того розроблена система повинна працювати швидко та передбачати автоматичне навчання. Отже розробка моделей та методів класифікації текстових документів на дійсний час є актуальним завданням. Дуже інтенсивний розвиток цих методів спостерігається в останній час при стрімкому розвитку обчислювальної техніки, та при переході багатьох організацій на електронний документообіг. В результаті дослідження було розроблено метод та модель системи; запропоновано комбінацію підходів для навчання моделі; визначено найбільш продуктивну модель для навчання системи.
dc.description.abstractThe paper considered a model of the document classification system using Big Data technology. When using Big Data technology, a large array of documents accumulates on the server which must be pre-processed and uploaded to the database. In the documents you need to define keywords with a help of which you need to assign them to one or more thematic sections. In addition, the developed system should operate fast and provide automatic learning. Therefore, the development of models and methods of classification of text documents for real time is an urgent task. A very intensive development of these methods has been observed recently with the rapid development of computer technology and with the transition of many organizations into electronic document management. As a result of the study, a method and a system model were developed; a combination of approaches for model training is proposed; the most productive model for system training is determined.
dc.identifier.citationМороз Б., Кабак Л., Варех Н. В., Мороз Д. Система класифікації текстових документів із використанням технологій Big Data. Information Technology: Computer Science, Software Engineering and Cyber Security. 2023. № 2. С. 34–40. DOI: https://doi.org/10.32782/IT/2023-2-4.
dc.identifier.doihttps://doi.org/10.32782/IT/2023-2-4
dc.identifier.issn2786-5088
dc.identifier.orcidhttps://orcid.org/0000-0002-2779-9225
dc.identifier.urihttps://dspace.mipolytech.education/handle/mip/1273
dc.language.isouk
dc.publisherНаціональний технічний університет «Дніпровська політехніка»
dc.subjectBig Data
dc.subjectHadoop
dc.subjectMap Reduce
dc.subjectApache Spark
dc.subjectалгоритми машинного навчання
dc.subjectсистеми класифікації
dc.subjectбайєсовський класифікатор
dc.subjectMachine Learning Algorithm
dc.subjectsystems of classification
dc.subjectBayes Classifier
dc.titleСистема класифікації текстових документів із використанням технологій Big Data
dc.title.alternativeSystema klasyfikatsii tekstovykh dokumentiv іz vykorystanniam tekhnolohii Big Data
dc.typeArticle

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Ескіз
Назва:
Система класифікації текстових документів із використанням технологій Big Data.pdf
Розмір:
468.15 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
10.29 KB
Формат:
Item-specific license agreed to upon submission
Опис: