Методика идентификации интернет-пользователя на основе стилистических и лингвистических характеристик коротких электронных сообщений

Воробьева А. А.

Читать статью полностью

  Методика идентификации интернет-пользователя на основе стилистических и лингвистических характеристик коротких электронных сообщений (881,09 KB)

Аннотация

В работе рассмотрена задача идентификации пользователей интернет-порталов в условиях возможности деанонимизации источника информа- ции и роста числа преступлений, совершаемых с применением компьютеров и современных средств коммуникации. Представлена методика идентификации интернет-пользователя на основе стилистических и лингвистических характеристик коротких электронных сообщений на русском языке, используемых в качестве идентификатора. Эксперименты показали, что методика позволяет обеспечить более высокую точность идентификации для сообщений на русском языке длиной менее 5000 символов; средняя точность идентификации - 79,7%. 

Ключевые слова:

информационная безопасность- information security; идентификация интернет пользователей - web-user identification; лингвистическая идентификация - forensic linguistics

Список литературы

1. Лебедев, И. С.Методика идентификации авторства текстов коротких сообщений пользователей порталов сети интернет на основе методов математической лингвистики / И.С. Лебедев, М.Е. Сухопаров / / В мире научных открытий. - 2014. - Т. 6.1. - № 54. - С. 599-622.

2. Романов, А. С. Методика и программный комплекс для идентификации автора неизвестного текста: автореф. дисс. ... канд. тех. наук : 05.13.18 / А. С. Романов. - Томск, 2010.- 26 с.

3. Vorobeva, A. Forensic linguistics: automatic web author identification / A. Voroveba / / Научно-технический вестник информационных технологий, механики и оптики. - 2016. - Т. 16, № 2(102). - С. 295-302.

4. Authorship attribution for social media forensics / A. Rocha [et al.] / / IEEE Transactions on Information Forensics and Security.- 2017.- Vol. 12, No. 1. - P. 5-33.

5. Doppelganger finder: Taking stylometry to the underground / S. Afroz [et al.] / / 2014 IEEE Symposium on Security and Privacy (SP). - 2014. - P. 212-226.

6. Vorobeva, A. Examining the Performance of Classification Algorithms for Imbalanced Data Sets in Web Author Identification / A. Voroveba / / Proceedings of the 18th Conference of Open Innovations Association FRUCT. - 2016. - P. 385-390.

7. Воробьева, А. А. Отбор информативных признаков для идентификации интернет-пользователей по коротким элек- тронным сообщениям / А.А. Воробьева / / Научно-технический вестник информационных технологий, механики и оптики. - 2017. - Т. 17, № 1 (107). - С. 117-128.