МОДЕЛЬ ОШИБОК ДЛЯ НЕЧЕТКОГО ТЕКСТОВОГО ПОИСКА В ЗАДАЧЕ МОНИТОРИНГА ВИРТУАЛЬНЫХ СОЦИАЛЬНЫХ СЕТЕЙ ДЛЯ ОБЕСПЕЧЕНИЯ ИНФОРМАЦИОННО-ПСИХОЛОГИЧЕСКОЙ БЕЗОПАСНОСТИ ЛИЧНОСТИ

  • Юлия Витальевна Давыдова Орловский государственный университет имени И.С. Тургенева

Аннотация

Мониторинг виртуальных социальных сетей с целью выявления угроз информационно-психологической безопасности личности является актуальной задачей. Под угрозами понимается пропаганда суицида, экстремизма, терроризма, наркотиков. В процессе мониторинга осуществляется поиск по ключевым словам в текстах сообщений пользователей, который существенно осложняется наличием большого количества ошибок. В данной статье предлагается использовать модель ошибок, интегрированную в нечеткий текстовый поиск, для повышения эффективности мониторинга. Приведена оценка параметров статистической компоненты модели ошибок на основе анализа корпуса сообщений.

Сведения об авторе

Юлия Витальевна Давыдова, Орловский государственный университет имени И.С. Тургенева

ведущий программист

Литература

1. Socyal’nye seti v Rossii, leto 2017: cyfry i trendy [электронный ресурс] // URL: http://blog.br-analytics.ru/sotsialnye-seti-v-rossii-leto-2017-tsifry-i-trendy/ (дата обращения 22.08.2017).
2. Davydova Yu.V. K voprosu o neobhodimosti avtomatizacii ugroz v virtual’nyh social’nyh setyah i soobshhestvah // Aktual’nye problemy nauki v 21 veke: materialy 6-j Mezhdunarodnoj nauchno-prakticheskoj konferencii (Mahachkala, 28 dek. 2014 g.). – Mahachkala, 2014. – S. 25-26
3. Bazenkov N.I., Gubanov D.A. Obzor informacyonnyh system analiza social’nyh setej // Upravlenie bol’shhimi sistemami. – 2013. – Vyp. 41. – S. 357-394.
4. Gubanov D.A., Novikov D.A., Chhartishvili A.G. Social’nye seti: modeli informacyonnogo vliyaniya, upravleniya i protivoborstva. – M.: Fizmatlit, 2010. – 228 с.
5. Mashechkin I.V., Petrovskij M.I., Pospelova I.I., Tsarev D.V. Metody avtomaticheskogo annotirovaniya i vydeleniya klyuchevyh slov v zadachah obnaruzheniya jekstremistskoj informacii v seti Internet // Sovremennye informacyonnye tehnologii i IT-obrazovanie. – 2016. – T. 12, № 1. – S. 188-198.
6. Savva Yu.B., Eremenko V.T., Davydova Yu.V. O probleme lingvisticheskogo analiza slenga v zadache avtomatizirovannogo poiska urgoz rasprostraneniya narkomanii v virtual’nyh social’nyh setyah // Informatcyonnye sistemy i tehnologii. – 2015. – T.6, №. 92, – S. 68-75.
7. Sykora M.D., Jackson T.W., O’Brien A., Elayan S. National security and social media monitoring: a presentation of the EMOTIVE and related systems // Proceedings of European Intelligence and Security Informatics Conference. – 2013. – pp. 172-175
8. Navarro G. A guided tour to approximate string matching // ACM Surveys. – 2001. – Vol. 33, No. 1. – pp. 33-88.
9. Savva Yu.B., Davydova Yu.V. Modeling of online social networks for automated monitoring system // Proceedings of the III International conference on Information Technology and Nanotechnology. Session Data Science. – 2017. URL: http://ceur-ws.org/Vol-1903/paper16.pdf
10. Manning C.D., Raghavan P., Schutze H. Introduction to information retrieval. – Cambridge: Cambridge University Press, 2008. – 496 p.
11. Ingersoll G.S., Morton T.S., Farris L.A. Taming text. How to find, organize and manipulate it. – NY: Manning Publications Co., 2013. – 320 p.
12. Damerau F.J. A technique for computer detection and correction of spelling errors // Communications of the ACM. – 1964. – Vol. 7, No. 3. – pp. 171-176.
13. Holub J. The finite automata approaches in stringology // Kybernetika. – 2012. Vol. 48, No. 3. – pp. 386-401.
14. Smyth B. Computing patterns in strings. – Pearson Addison-Wesley, 2003. – 423 p.
15. Baeza-Yates R.A., Perleberg C.H. Fast and practical approximate string matching // Information Processing Letters. – 1996. – Vol. 59. – pp. 21-27.
16. Aduriz I. et al. Spelling corrector for Basque based on morphology // Literary and Linguistic Computing. – 1997. – Vol. 12, No. 1. – pp. 31-3.
17. Yannakoudakis E., Fawthrop D. An intelligent spelling corrector // Information processing and management. – 1983. – Vol. 19, No. 2. – pp. 101-108.
18. Pollock J.J., Zamora A. Automatic spelling correction in scientific and scholarly texts // Communications of the ACM. – 1984. – Vol. 27, No. 4. – pp. 358-368.
19. Kernighan M.D., Church K.W., Gale W.A. A spelling correction program based on a noisy channel model // Proceedings of COLING. – 1990. – pp. 205-210.
20. Panina M.F., Bajtin A.V., Galinskaya I.E. Avtomaticheskoe ispravlenie opechatok v poiskovyh zaprosah bez ucheta konteksta // Komp’yuternaya lingvistika i intellektual’nye tehnologii: materialy ezhegodnoj Mezhdunarodnoj konferencii “Dialog” (Bekasovo, 29 majya – 2 iyunya 2013 g.). – Bekasovo, 2013. – S. 568-579.
21. Karpenko M.P., Protasov S. V. Nekotorye metody ochistki slovarya zaprosov poiska // Komp’yuternaya lingvistika i intellektual’nye tehnologii: materialy ezhegodnoj Mezhdunarodnoj konferencii “Dialog” (Bekasovo, 25 – 29 majya 2011 g.). – Bekasovo, 2011. – S. 280-291.
22. Sorokin A.A., Shavrina T.O. Automatic spelling correction for Russian social media texts // Proceedings of the International Conference “Dialog” (Moscow, June 1 – 6, 2016). – Moscow, 2016. – pp.688-701.
23. Brill E., Moore R.C. An improved error model for noisy channel spelling correction // Proceedings of the 38th Annual Meeting on the Association for Computational Linguistics. – 2000. – pp. 286-293.
24. Toutanova K., Moore R.C. Pronunciation modeling for improved spelling correction // Proceedings of the 40th Annual Meeting on Association for Computational Linguistics. – 2002, pp. 144-151.
25. General’nyj internet-korpus russkogo yazyka [электронный ресурс] // URL: http://www.webcorpora.ru/ (дата обращения 04.09.2017).
Опубликована
2017-10-01
Как цитировать
ДАВЫДОВА, Юлия Витальевна. МОДЕЛЬ ОШИБОК ДЛЯ НЕЧЕТКОГО ТЕКСТОВОГО ПОИСКА В ЗАДАЧЕ МОНИТОРИНГА ВИРТУАЛЬНЫХ СОЦИАЛЬНЫХ СЕТЕЙ ДЛЯ ОБЕСПЕЧЕНИЯ ИНФОРМАЦИОННО-ПСИХОЛОГИЧЕСКОЙ БЕЗОПАСНОСТИ ЛИЧНОСТИ. Современные информационные технологии и ИТ-образование, [S.l.], v. 13, n. 3, p. 72-82, oct. 2017. ISSN 2411-1473. Доступно на: <http://sitito.cs.msu.ru/index.php/SITITO/article/view/292>. Дата доступа: 19 apr. 2024 doi: https://doi.org/10.25559/SITITO.2017.3.460.