ЯЗЫКОВАЯ ИДЕНТИФИКАЦИЯ ИНФОРМАЦИОННЫХ БЛОКОВ НА ОСНОВЕ ЛЕКСИКО-ГРАММАТИЧЕСКИХ МАРКЕРОВ

  • Сергей Николаевич Калегин Московский научно-исследовательский телевизионный институт (ЗАО «МНИТИ») http://orcid.org/0000-0003-3540-3902

Аннотация

Данная статья является продолжением серии публикаций автора по тематике языковой идентификации текстов. Рассматривается создание технологической основы для систем языковой идентификации неструктурированных информационных блоков на основе лексико-грамматических маркеров, в качестве которых используются формы глаголов, отглагольных образований или функционально аналогичных конструкций, даётся описание предлагаемого способа и алгоритма его программной реализации. Данные разработки позволят существенно уменьшить ресурсоёмкость и улучшить качество подобных систем, что даст значительный экономический эффект и возможность создания принципиально новых технологий для определения языковой принадлежности информации в многоязычной среде. Следовательно, работа представляет интерес для компьютерных лингвистов и разработчиков систем автоматической обработки текстов, таких как: системы глобального мониторинга, многоязычные базы знаний, автоматические системы перевода, информационно-поисковые комплексы, системы реферирования документов, каталогизаторы литературы и т.д.

Сведения об авторе

Сергей Николаевич Калегин, Московский научно-исследовательский телевизионный институт (ЗАО «МНИТИ»)

аспирант, начальник сектора НТО

Литература

1. Chernovalyuk I.V. Referirovanie nauchnogo teksta // Metodicheskie rekomendatsii po russkomu yazyku dlya inostrannykh studentov i aspirantov CHast' II. – Odessa, 2012. – 47 s.
2. Puzyryov А.V. O razgranichenii ponyatij «opornye i klyuchevye ehlementy khudozhestvennogo teksta» // Аktual'nye problemy filologii i pedagogicheskoj lingvistiki, № 16. Vladikavkaz, 2014. – s. 308-317.
3. Burlak S. А. Proiskhozhdenie yazyka: Fakty, issledovaniya, gipotezy. M: Аstrel', 2011. – 464 s.
4. Gromova O.E. Аllo! Lyalya? Rech'. Pervye glagoly. Dlya detej do 2 let / M.: Karapuz, 2003.
5. YAnushko E.А. Razvitie rechi. Pervye glagoly. Dlya detej ot 1 goda / M.: Eksmo, 2011.
6. Patent RF № 2607989, MPK G06F 17/27. Sposob avtomatizirovannogo opredeleniya yazyka ili yazykovoj gruppy teksta / Kalegin S.N.; ZАO «MNITI»; zayav. 08.07.2015; opubl. 11.01.2017, byul. № 2.
7. Kalegin S.N. Logicheskaya struktura identifikatsionnykh naborov v sistemakh yazykovoj identifikatsii // Sovremennye informatsionnye tekhnologii i IT-obrazovanie. - 2016. - Tom 12, № 1. – S. 173-181.
Опубликована
2017-12-03
Как цитировать
КАЛЕГИН, Сергей Николаевич. ЯЗЫКОВАЯ ИДЕНТИФИКАЦИЯ ИНФОРМАЦИОННЫХ БЛОКОВ НА ОСНОВЕ ЛЕКСИКО-ГРАММАТИЧЕСКИХ МАРКЕРОВ. Современные информационные технологии и ИТ-образование, [S.l.], v. 13, n. 4, p. 225-231, dec. 2017. ISSN 2411-1473. Доступно на: <http://sitito.cs.msu.ru/index.php/SITITO/article/view/326>. Дата доступа: 24 nov. 2024 doi: https://doi.org/10.25559/SITITO.2017.4.492.
Раздел
Исследования и разработки в области новых ИТ и их приложений