СРАВНИТЕЛЬНЫЙ АНАЛИЗ СВЯЗАННЫХ РЯДОВ И ИХ ПРИРАЩЕНИЙ НА ОСНОВЕ ДИСКРИМИНАНТНОГО АНАЛИЗА

  • Светлана Николаевна Истомина Московский авиационный институт (национальный исследовательский университет) http://orcid.org/0000-0002-9206-2641

Аннотация

Работа посвящена изучению связи длин ортологичных белков четырех организмов, один из которых принят за базисный (в сумме более 1200 белков). Использованы методы многомерного статистического анализа, который применяется к парам, тройкам и четвёркам (строкам), составленным из длин ортологичных белков. Таких строк от 200 до 400. Анализ парных корреляций, ортогональное преобразование и кластерный анализ позволили выделить два однородных кластера четвёрок длин. Параллельно изучали приращения длины ортологичного белка относительно базисного организма. Показали, что строки образуют неоднородную выборку, а приращения образуют однородную выборку. Далее задача состояла в расширении кластеров строками с неполными данными. Показали, что для этого кластерный анализ не применим, поэтому использовали дискриминантный анализ с обучающей выборкой – кластеризацией с полными данными. Получено 100-процентное разделение всех неполных строк по кластерам; с последующим описанием по кластерам зависимости длин от базисных. Проверена адекватность полученных уравнений регрессии. В результате статистического анализа сделаны следующие выводы. Для множества длин ортологичных рядов получен обобщающий фактор, назовем его размером ортологичного объекта из 4-х длин ортологичных беков. Для данной задачи получены такие размеры объектов, причем их средние групповые отличаются они образуют два отдельных интервала значений, по одному для каждой группы из полученных другими методами. Для рядов приращений длин ортологичных белков из объектов по четыре анализ показал всеми методами однородность множества. Показано, что длины ортологичных белков имеют значимую автокорреляцию, как и бывает у рядов, связанных с одним и тем же базисным рядом.

Сведения об авторе

Светлана Николаевна Истомина, Московский авиационный институт (национальный исследовательский университет)

кандидат химических наук, доцент

Литература

[1] Seliverstov A.V., Zverkov O.A., Istomina S.N., Pirogov S.A., Kitsis P.S. Comparative Analysis of Apicoplast-Targeted Protein Extension Lengths in Apicomplexan Parasites. BioMed Research International. 2015; 2015:452958. DOI: 10.1155/2015/452958
[2] Seliverstov A.V., Rubanov L.I., Shilovsky G.A., Zverkov O.A., Lyubetsky V.A. Longevity in euarchontoglires: lost genes as a determinant. FEBS Open Bio. 2018; 8(Suppl. 1):456-457. DOI: 10.1002/2211-5463.12453
[3] Lyubetsky V.A., Gershgorin R.A., Gorbunov K.Yu. Chromosome structures: reduction of certain problems with unequal gene content and gene paralogs to integer linear programming. BMC Bioinformatics. 2017; 18:537. 18 pp. DOI: 10.1186/s12859-017-1944-x
[4] Lyubetsky V.A., Korotkova D.D., Ivanova A.S., Rubanov L.I., Seliverstov A.V., Zverkov O.A., Nesterenko A.M., Tereshina M.B., Zaraisky A.G. Novel transmembrane protein c-Answer revealed by bioinformatic screening of genes present only in well regenerating animals. FEBS Journal. 2017; 284(S1):155. DOI: doi.org/10.1111/febs.14174
[5] Korotkova D.D., Ivanova A.S., Lyubetsky V.A., Seliverstov A.V., Martynova N.Yu., Nesterenko A.M., Tereshina M.B., Zaraisky A.G. Novel FGF-signaling modulator c-Answer revealed by bioinformatics screening for genes present only in well-regenerative animals. Mechanisms of Development. 2017; 145:S49. DOI: doi.org/10.1016/j.mod.2017.04.089
[6] Istomina S.N. Comparative analysis of related series: lengths of orthologous proteins and their increments relative to the lengths of basic proteins. Modern Information Technology and IT-education. 2015; 11(2):594-599. Available at: https://elibrary.ru/item.asp?id=26167553 18 (accessed 05.08.2018). (In Russian)
[7] Gorbunov K.Yu., Lyubetsky V.A. The minimum-cost transformation of graphs. Doklady Mathematics. 2017; 96(2):503–505. DOI: 10.1134/S1064562417050313
[8] Gorbunov K.Yu., Lyubetsky V.A. Linear algorithm for minimal rearrangement of structures. Problems of Information Transmission. 2017; 53(1):60-78. Available at: https://elibrary.ru/item.asp?id=28876248 (accessed 05.08.2018). (In Russian)
[9] Lyubetsky V.A. Linear algorithm for minimal rearrangement of structures. Problems of Information Transmission. 2017; 53(1):55–72. DOI: 10.1134/S0032946017010057
[10] Gorbunov K.Yu., Lyubetsky V.A. A linear algorithm for the shortest transformation of graphs with different operation costs. Journal of Communications Technology and Electronics. 2017; 62(6):653–662. DOI: 10.1134/S1064226917060092
[11] Korolev S.A., Zverkov O.A., Seliverstov A.V., Lyubetsky V.A. Ribosome reinitiation at leader peptides increases translation of bacterial proteins. Biology Direct. 2016; 11(1):20. 6 pp. DOI: 10.1186/s13062-016-0123-8
[12] Lyubetsky V.A., Gershgorin R.A., Seliverstov A.V., Gorbunov K.Yu. Algorithms for reconstruction of chromosomal structures. BMC Bioinformatics. 2016; 17(1):40. 23 pp. DOI: 10.1186/s12859-016-0878-z
[13] Rubanov L.I., Seliverstov A.V., Zverkov O.A., Lyubetsky V.A. A method for identification of highly conserved elements and evolutionary analysis of superphylum Alveolata. BMC Bioinformatics. 2016; 17(1):385. 16 pp. DOI: 10.1186/s12859-016-1257-5
[14] Gorbunov K.Yu., Gershgorin R.A., Lyubetsky V.A. Rearrangement and Inference of Chromosome Structures. Molecular Biology. 2015; 49(3):327–338. DOI: 10.1134/S0026893315030073
[15] Zverkov O.A., Seliverstov A.V., Lyubetsky V.A. A Database of Plastid Protein Families from Red Algae and Apicomplexa and Expression Regulation of the moeB Gene. BioMed Research International. 2015; 2015:510598. 5 pp. DOI: 10.1155/2015/510598
[16] Rusin L.Yu., Lyubetskaya E.V., Gorbunov K.Yu., Lyubetsky V.A. Reconciliation of Gene and Species Trees. BioMed Research International. 2014; 2014:642089. 22 pp. DOI: 10.1155/2014/642089
[17] Lyubetsky V.A., Korolev S.A., Seliverstov A.V., Zverkov O.A., Rubanov L.I. Gene expression regulation of the PF00480 or PF14340 domain proteins suggests their involvement in sulfur metabolism. Computational Biology and Chemistry. 2014; 49:7-13. DOI: 10.1016/j.compbiolchem.2014.01.001
Опубликована
2018-09-30
Как цитировать
ИСТОМИНА, Светлана Николаевна. СРАВНИТЕЛЬНЫЙ АНАЛИЗ СВЯЗАННЫХ РЯДОВ И ИХ ПРИРАЩЕНИЙ НА ОСНОВЕ ДИСКРИМИНАНТНОГО АНАЛИЗА. Современные информационные технологии и ИТ-образование, [S.l.], v. 14, n. 3, p. 672-678, sep. 2018. ISSN 2411-1473. Доступно на: <http://sitito.cs.msu.ru/index.php/SITITO/article/view/434>. Дата доступа: 29 mar. 2024 doi: https://doi.org/10.25559/SITITO.14.201803.672-678.