Адаптивное обучение моделей для прогнозирования потоков данных в информационно-телекоммуникационных системах

Сухопаров М. Е., Лебедев И. С., Сикарев И. А.

Читать статью полностью

  Адаптивное обучение моделей для прогнозирования потоков данных в информационно-телекоммуникационных системах(844,03 KB)

Аннотация

Предлагается метод адаптивного обучения моделей для обработки потоков данных в информационно-телекоммуникационных системах, использующий автоматическое сегментирование данных. Целью предлагаемого решения является повышение качественных показателей классифицирующих моделей за счет разделения выборок данных с учетом их свойств на подмножества. Основное отличие предлагаемого метода заключается в том, что используется разделение выборки на подвыборки. Приведено разбиение выборки данных на конечное число не пересекающихся измеримых подмножеств.

A method of adaptive training of models for processing data flows in information and telecommunication systems using automatic data segmentation is proposed. The purpose of the proposed solution is to improve the quality indicators of classifying models by dividing data samples, considering their properties, into subsets. The main difference of the proposed method is that the sample is divided into subsamples. The data sample is divided into a finite number of non-overlapping measurable subsets.

Ключевые слова:

машинное обучение – machine learning; информационно-телекоммуникационные системы – information and telecommunication systems; потоки данных – data flows; воздействующие факторы – influencing factors; сетевой трафик – network traffic.

Список литературы

1. Descriptor generation and optimization for a specific outdoor environment / A. Takacs, M. Toledano-Ayala, A. Dominguez-Gonzalez [et al.] // IEEE Access. – 2020. – Vol. 8. – P. 2169–2182.

2. Лебедев, И. С. Сегментирование множества данных с учетом информации воздействующих факторов / И.С. Лебедев // Информационно-управляющие системы. – 2021. – № 3 (112). – C. 29–38.

3. Zhou, Z.-H. Deep Forest / Z.-H. Zhou, J. Feng // National Science Review. – 2019. – Vol. 6, No. 1. – P. 74–86.

4. Лебедев, И. С. Адаптивное применение моделей машинного обучения на отдельных сегментах выборки в задачах регрессии и классификации / И.С. Лебедев // Информационноуправляющие системы. – 2022. – № 3 (118). – C. 20–30.

5. kNN-IS: An Iterative Spark-based design of the k-Nearest Neighbors classifier for big data / J. Maillo, S. Ramrez, I. Triguero, F. Herrera // Knowledge-Based Systems. – 2017. – Vol. 117. – P. 3–15.

6. Maletzke, A. Combining instance selection and selftraining to improve data stream quantification / A. Maletzke, D. dos Reis, G. Batista // Journal of the Brazilian Computer Society. – 2018. – Vol. 24, No. 12. – P.123–141.

7. Wu, Z. Improving generalization via scalable neighborhood component analysis / Z. Wu, A. Efros, S. Yu // Proceedings of the European Conference on Computer Vision (ECCV). – 2018. – P. 685–701.

8. The analysis of abnormal behavior of the system local segment on the basis of statistical data obtained from the network infrastructure monitoring / I. Lebedev, I. Krivtsova, V. Korzhuk [et al.] // Lecture Notes in Computer Science. – 2016. – No. 9870. – P. 503–511.

9. Meiseles, A. Source Model Selection for Deep Learning in the Time Series Domain / A. Meiseles, L. Rokach // IEEE Access. – 2020. – Vol. 8. – P. 6190–6200.

10. Дьяконов, А. Методы решения задач классификации с категориальными признаками / А. Дьяконов // Прикладная математика и информатика. Труды факультета Вычисли- тельной математики и кибернетики МГУ имени М.В. Ломоносова. – 2014. – № 46. – С. 103–127.