Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration. Т. В. Какатунова
Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration
Год выпуска: 2019
Автор произведения: Т. В. Какатунова
Серия: Прикладная информатика. Научные статьи
Жанр: Техническая литература
Издательство: Синергия
isbn:
Краткое описание:
В статье предложен новый подход к автоматическому анализу коротких сообщений, поступающих на Интернет-порталы и электронную почту органов государственной власти. Разработанная модель позволяет выполнять классификацию коротких неструктурированных текстовых документов при недостатке статистической информации и слабой степени пересечения тематических рубрик. Входными данными для алгоритма построения модели является множество рубрик и обучающая выборка, а его результатом являются нечеткие весовые коэффициенты значимых слов тезаурусов рубрик, что обеспечивает корректное представление характеристик документа и работу алгоритма рубрицирования (классификации).