СРАВНИТЕЛЬНЫЙ АНАЛИЗ СВЯЗАННЫХ РЯДОВ И ИХ ПРИРАЩЕНИЙ НА ОСНОВЕ ДИСКРИМИНАНТНОГО АНАЛИЗА
Аннотация
Работа посвящена изучению связи длин ортологичных белков четырех организмов, один из которых принят за базисный (в сумме более 1200 белков). Использованы методы многомерного статистического анализа, который применяется к парам, тройкам и четвёркам (строкам), составленным из длин ортологичных белков. Таких строк от 200 до 400. Анализ парных корреляций, ортогональное преобразование и кластерный анализ позволили выделить два однородных кластера четвёрок длин. Параллельно изучали приращения длины ортологичного белка относительно базисного организма. Показали, что строки образуют неоднородную выборку, а приращения образуют однородную выборку. Далее задача состояла в расширении кластеров строками с неполными данными. Показали, что для этого кластерный анализ не применим, поэтому использовали дискриминантный анализ с обучающей выборкой – кластеризацией с полными данными. Получено 100-процентное разделение всех неполных строк по кластерам; с последующим описанием по кластерам зависимости длин от базисных. Проверена адекватность полученных уравнений регрессии. В результате статистического анализа сделаны следующие выводы. Для множества длин ортологичных рядов получен обобщающий фактор, назовем его размером ортологичного объекта из 4-х длин ортологичных беков. Для данной задачи получены такие размеры объектов, причем их средние групповые отличаются они образуют два отдельных интервала значений, по одному для каждой группы из полученных другими методами. Для рядов приращений длин ортологичных белков из объектов по четыре анализ показал всеми методами однородность множества. Показано, что длины ортологичных белков имеют значимую автокорреляцию, как и бывает у рядов, связанных с одним и тем же базисным рядом.
Литература
[2] Seliverstov A.V., Rubanov L.I., Shilovsky G.A., Zverkov O.A., Lyubetsky V.A. Longevity in euarchontoglires: lost genes as a determinant. FEBS Open Bio. 2018; 8(Suppl. 1):456-457. DOI: 10.1002/2211-5463.12453
[3] Lyubetsky V.A., Gershgorin R.A., Gorbunov K.Yu. Chromosome structures: reduction of certain problems with unequal gene content and gene paralogs to integer linear programming. BMC Bioinformatics. 2017; 18:537. 18 pp. DOI: 10.1186/s12859-017-1944-x
[4] Lyubetsky V.A., Korotkova D.D., Ivanova A.S., Rubanov L.I., Seliverstov A.V., Zverkov O.A., Nesterenko A.M., Tereshina M.B., Zaraisky A.G. Novel transmembrane protein c-Answer revealed by bioinformatic screening of genes present only in well regenerating animals. FEBS Journal. 2017; 284(S1):155. DOI: doi.org/10.1111/febs.14174
[5] Korotkova D.D., Ivanova A.S., Lyubetsky V.A., Seliverstov A.V., Martynova N.Yu., Nesterenko A.M., Tereshina M.B., Zaraisky A.G. Novel FGF-signaling modulator c-Answer revealed by bioinformatics screening for genes present only in well-regenerative animals. Mechanisms of Development. 2017; 145:S49. DOI: doi.org/10.1016/j.mod.2017.04.089
[6] Istomina S.N. Comparative analysis of related series: lengths of orthologous proteins and their increments relative to the lengths of basic proteins. Modern Information Technology and IT-education. 2015; 11(2):594-599. Available at: https://elibrary.ru/item.asp?id=26167553 18 (accessed 05.08.2018). (In Russian)
[7] Gorbunov K.Yu., Lyubetsky V.A. The minimum-cost transformation of graphs. Doklady Mathematics. 2017; 96(2):503–505. DOI: 10.1134/S1064562417050313
[8] Gorbunov K.Yu., Lyubetsky V.A. Linear algorithm for minimal rearrangement of structures. Problems of Information Transmission. 2017; 53(1):60-78. Available at: https://elibrary.ru/item.asp?id=28876248 (accessed 05.08.2018). (In Russian)
[9] Lyubetsky V.A. Linear algorithm for minimal rearrangement of structures. Problems of Information Transmission. 2017; 53(1):55–72. DOI: 10.1134/S0032946017010057
[10] Gorbunov K.Yu., Lyubetsky V.A. A linear algorithm for the shortest transformation of graphs with different operation costs. Journal of Communications Technology and Electronics. 2017; 62(6):653–662. DOI: 10.1134/S1064226917060092
[11] Korolev S.A., Zverkov O.A., Seliverstov A.V., Lyubetsky V.A. Ribosome reinitiation at leader peptides increases translation of bacterial proteins. Biology Direct. 2016; 11(1):20. 6 pp. DOI: 10.1186/s13062-016-0123-8
[12] Lyubetsky V.A., Gershgorin R.A., Seliverstov A.V., Gorbunov K.Yu. Algorithms for reconstruction of chromosomal structures. BMC Bioinformatics. 2016; 17(1):40. 23 pp. DOI: 10.1186/s12859-016-0878-z
[13] Rubanov L.I., Seliverstov A.V., Zverkov O.A., Lyubetsky V.A. A method for identification of highly conserved elements and evolutionary analysis of superphylum Alveolata. BMC Bioinformatics. 2016; 17(1):385. 16 pp. DOI: 10.1186/s12859-016-1257-5
[14] Gorbunov K.Yu., Gershgorin R.A., Lyubetsky V.A. Rearrangement and Inference of Chromosome Structures. Molecular Biology. 2015; 49(3):327–338. DOI: 10.1134/S0026893315030073
[15] Zverkov O.A., Seliverstov A.V., Lyubetsky V.A. A Database of Plastid Protein Families from Red Algae and Apicomplexa and Expression Regulation of the moeB Gene. BioMed Research International. 2015; 2015:510598. 5 pp. DOI: 10.1155/2015/510598
[16] Rusin L.Yu., Lyubetskaya E.V., Gorbunov K.Yu., Lyubetsky V.A. Reconciliation of Gene and Species Trees. BioMed Research International. 2014; 2014:642089. 22 pp. DOI: 10.1155/2014/642089
[17] Lyubetsky V.A., Korolev S.A., Seliverstov A.V., Zverkov O.A., Rubanov L.I. Gene expression regulation of the PF00480 or PF14340 domain proteins suggests their involvement in sulfur metabolism. Computational Biology and Chemistry. 2014; 49:7-13. DOI: 10.1016/j.compbiolchem.2014.01.001
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Редакционная политика журнала основывается на традиционных этических принципах российской научной периодики и строится с учетом этических норм работы редакторов и издателей, закрепленных в Кодексе поведения и руководящих принципах наилучшей практики для редактора журнала (Code of Conduct and Best Practice Guidelines for Journal Editors) и Кодексе поведения для издателя журнала (Code of Conduct for Journal Publishers), разработанных Комитетом по публикационной этике - Committee on Publication Ethics (COPE). В процессе издательской деятельности редколлегия журнала руководствуется международными правилами охраны авторского права, нормами действующего законодательства РФ, международными издательскими стандартами и обязательной ссылке на первоисточник.
Журнал позволяет авторам сохранять авторское право без ограничений. Журнал позволяет авторам сохранить права на публикацию без ограничений.
Издательская политика в области авторского права и архивирования определяются «зеленым цветом» в базе данных SHERPA/RoMEO.
Все статьи распространяются на условиях лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная, которая позволяет другим использовать, распространять, дополнять эту работу с обязательной ссылкой на оригинальную работу и публикацию в этом журналe.