МОДЕЛЬ ОШИБОК ДЛЯ НЕЧЕТКОГО ТЕКСТОВОГО ПОИСКА В ЗАДАЧЕ МОНИТОРИНГА ВИРТУАЛЬНЫХ СОЦИАЛЬНЫХ СЕТЕЙ ДЛЯ ОБЕСПЕЧЕНИЯ ИНФОРМАЦИОННО-ПСИХОЛОГИЧЕСКОЙ БЕЗОПАСНОСТИ ЛИЧНОСТИ
Аннотация
Мониторинг виртуальных социальных сетей с целью выявления угроз информационно-психологической безопасности личности является актуальной задачей. Под угрозами понимается пропаганда суицида, экстремизма, терроризма, наркотиков. В процессе мониторинга осуществляется поиск по ключевым словам в текстах сообщений пользователей, который существенно осложняется наличием большого количества ошибок. В данной статье предлагается использовать модель ошибок, интегрированную в нечеткий текстовый поиск, для повышения эффективности мониторинга. Приведена оценка параметров статистической компоненты модели ошибок на основе анализа корпуса сообщений.
Литература
2. Davydova Yu.V. K voprosu o neobhodimosti avtomatizacii ugroz v virtual’nyh social’nyh setyah i soobshhestvah // Aktual’nye problemy nauki v 21 veke: materialy 6-j Mezhdunarodnoj nauchno-prakticheskoj konferencii (Mahachkala, 28 dek. 2014 g.). – Mahachkala, 2014. – S. 25-26
3. Bazenkov N.I., Gubanov D.A. Obzor informacyonnyh system analiza social’nyh setej // Upravlenie bol’shhimi sistemami. – 2013. – Vyp. 41. – S. 357-394.
4. Gubanov D.A., Novikov D.A., Chhartishvili A.G. Social’nye seti: modeli informacyonnogo vliyaniya, upravleniya i protivoborstva. – M.: Fizmatlit, 2010. – 228 с.
5. Mashechkin I.V., Petrovskij M.I., Pospelova I.I., Tsarev D.V. Metody avtomaticheskogo annotirovaniya i vydeleniya klyuchevyh slov v zadachah obnaruzheniya jekstremistskoj informacii v seti Internet // Sovremennye informacyonnye tehnologii i IT-obrazovanie. – 2016. – T. 12, № 1. – S. 188-198.
6. Savva Yu.B., Eremenko V.T., Davydova Yu.V. O probleme lingvisticheskogo analiza slenga v zadache avtomatizirovannogo poiska urgoz rasprostraneniya narkomanii v virtual’nyh social’nyh setyah // Informatcyonnye sistemy i tehnologii. – 2015. – T.6, №. 92, – S. 68-75.
7. Sykora M.D., Jackson T.W., O’Brien A., Elayan S. National security and social media monitoring: a presentation of the EMOTIVE and related systems // Proceedings of European Intelligence and Security Informatics Conference. – 2013. – pp. 172-175
8. Navarro G. A guided tour to approximate string matching // ACM Surveys. – 2001. – Vol. 33, No. 1. – pp. 33-88.
9. Savva Yu.B., Davydova Yu.V. Modeling of online social networks for automated monitoring system // Proceedings of the III International conference on Information Technology and Nanotechnology. Session Data Science. – 2017. URL: http://ceur-ws.org/Vol-1903/paper16.pdf
10. Manning C.D., Raghavan P., Schutze H. Introduction to information retrieval. – Cambridge: Cambridge University Press, 2008. – 496 p.
11. Ingersoll G.S., Morton T.S., Farris L.A. Taming text. How to find, organize and manipulate it. – NY: Manning Publications Co., 2013. – 320 p.
12. Damerau F.J. A technique for computer detection and correction of spelling errors // Communications of the ACM. – 1964. – Vol. 7, No. 3. – pp. 171-176.
13. Holub J. The finite automata approaches in stringology // Kybernetika. – 2012. Vol. 48, No. 3. – pp. 386-401.
14. Smyth B. Computing patterns in strings. – Pearson Addison-Wesley, 2003. – 423 p.
15. Baeza-Yates R.A., Perleberg C.H. Fast and practical approximate string matching // Information Processing Letters. – 1996. – Vol. 59. – pp. 21-27.
16. Aduriz I. et al. Spelling corrector for Basque based on morphology // Literary and Linguistic Computing. – 1997. – Vol. 12, No. 1. – pp. 31-3.
17. Yannakoudakis E., Fawthrop D. An intelligent spelling corrector // Information processing and management. – 1983. – Vol. 19, No. 2. – pp. 101-108.
18. Pollock J.J., Zamora A. Automatic spelling correction in scientific and scholarly texts // Communications of the ACM. – 1984. – Vol. 27, No. 4. – pp. 358-368.
19. Kernighan M.D., Church K.W., Gale W.A. A spelling correction program based on a noisy channel model // Proceedings of COLING. – 1990. – pp. 205-210.
20. Panina M.F., Bajtin A.V., Galinskaya I.E. Avtomaticheskoe ispravlenie opechatok v poiskovyh zaprosah bez ucheta konteksta // Komp’yuternaya lingvistika i intellektual’nye tehnologii: materialy ezhegodnoj Mezhdunarodnoj konferencii “Dialog” (Bekasovo, 29 majya – 2 iyunya 2013 g.). – Bekasovo, 2013. – S. 568-579.
21. Karpenko M.P., Protasov S. V. Nekotorye metody ochistki slovarya zaprosov poiska // Komp’yuternaya lingvistika i intellektual’nye tehnologii: materialy ezhegodnoj Mezhdunarodnoj konferencii “Dialog” (Bekasovo, 25 – 29 majya 2011 g.). – Bekasovo, 2011. – S. 280-291.
22. Sorokin A.A., Shavrina T.O. Automatic spelling correction for Russian social media texts // Proceedings of the International Conference “Dialog” (Moscow, June 1 – 6, 2016). – Moscow, 2016. – pp.688-701.
23. Brill E., Moore R.C. An improved error model for noisy channel spelling correction // Proceedings of the 38th Annual Meeting on the Association for Computational Linguistics. – 2000. – pp. 286-293.
24. Toutanova K., Moore R.C. Pronunciation modeling for improved spelling correction // Proceedings of the 40th Annual Meeting on Association for Computational Linguistics. – 2002, pp. 144-151.
25. General’nyj internet-korpus russkogo yazyka [электронный ресурс] // URL: http://www.webcorpora.ru/ (дата обращения 04.09.2017).
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Редакционная политика журнала основывается на традиционных этических принципах российской научной периодики и строится с учетом этических норм работы редакторов и издателей, закрепленных в Кодексе поведения и руководящих принципах наилучшей практики для редактора журнала (Code of Conduct and Best Practice Guidelines for Journal Editors) и Кодексе поведения для издателя журнала (Code of Conduct for Journal Publishers), разработанных Комитетом по публикационной этике - Committee on Publication Ethics (COPE). В процессе издательской деятельности редколлегия журнала руководствуется международными правилами охраны авторского права, нормами действующего законодательства РФ, международными издательскими стандартами и обязательной ссылке на первоисточник.
Журнал позволяет авторам сохранять авторское право без ограничений. Журнал позволяет авторам сохранить права на публикацию без ограничений.
Издательская политика в области авторского права и архивирования определяются «зеленым цветом» в базе данных SHERPA/RoMEO.
Все статьи распространяются на условиях лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная, которая позволяет другим использовать, распространять, дополнять эту работу с обязательной ссылкой на оригинальную работу и публикацию в этом журналe.