Списки аспирантов и портфолио

105

Гаранина Ирина Андреевна

Дата начала обучения 2015-11-01
Дата окончания обучения 2019-10-31
Руководитель Фесенко Игорь Александрович
Специальность Биохимия [03.01.04]
Статус Обучается

Отчеты аспиранта

0 год обучения (0)

учебный план

План работы аспиранта

1 год обучения (0)

Статьи по теме диссертации:
⦁ Matyushkina D, Pobeguts O, Garanina I, Babenko V, Vakhitova M, Fisunov G, Govorun V. Data on genome analysis of Mycoplasmagallisepticum during intracellular infection. Data Brief. 2016 Dec 8;10:264-268. 
⦁ Matyushkina D, Pobeguts O, Butenko I, Vanyushkina A, Anikanov N, Bukato O, Evsyutina D, Bogomazova A, Lagarkova M, Semashko T, Garanina I, Babenko V, Vakhitova M, Ladygina V, Fisunov G, Govorun V. Phase Transition of the Bacterium upon Invasion of a Host Cell as a Mechanism of Adaptation: a Mycoplasma gallisepticum Model. Sci Rep. 2016 Oct 24;6:35959. 
⦁ Fisunov GY, Garanina IA, Evsyutina DV, Semashko TA, Nikitina AS, Govorun VM. Reconstruction of Transcription Control Networks in Mollicutes by High-Throughput Identification of Promoters. Front Microbiol. 2016 Dec 6;7:1977. 
 
Конференции:
⦁ Гаранина И.А., Фисунов, Г.Ю., Евсютина Д.В., Говорун В.М. Организация промоторов у молликут, НАУЧНАЯ КОНФЕРЕНЦИЯ МОЛОДЫХ УЧЕНЫХ ПО МЕДИЦИНСКОЙ БИОЛОГИИ ФГБУ ФНКЦ ФХМ ФМБА ТЕЗИСЫ ДОКЛАДОВ, с. 45, Москва 2016, устный доклад
⦁ I.A. Garanina, G.U. Fisunov., D.V. Evsutina, V.M. Govorun, Reconstruction of  transcription control network in genome-reduced bacteria by high-throughput promoters identification, The tenth international conference on bioinformatics of genome regulation and structuresystems biology, Новосибирск 29 August – 2 September, 2016, c. 87, постерный до­­­клад
⦁ I.A. Garanina, G.U. Fisunov., D.V. Evsutina, V.M. Govorun, Reconstruction of transcription control network in genome-reduced bacteria by high-throughput promoters identification, The eighth international young scientists school “Systems biology and bioinformatics”, 29 August – 2 September Новосибирск 2016, устный доклад
⦁ Fisunov G.Y., Garanina I.A., Govorun V.M., Reconstruction of transcription control network in genome-reduced bacteria by high-throughput promoters identification, International Conference on Systems Biology 16-20 September 2016, Барселона, Испания, постерный до­­­клад
⦁ Д.В. Евсютина, Г.Ю. Фисунов, Д.С. Матюшкина, О.В. Побегуц, И.А. Гаранина, В.А. Манувера, В.М. Говорун, Fur И SpxA – ОСНОВНЫЕ ФАКТОРЫ РЕГУЛЯЦИИ ТРАНСКРИПЦИИ ГЕНОВ ОКИСЛИТЕЛЬНОГО СТРЕССА У MYCOPLASMA GALLISEPTICUM, спецвыпуск ActaNaturae т.2, с. 103, V СЪЕЗД ОБЩЕСТВА БИОХИМИКОВ РОССИИ Дагомыс, 4-9 октября 2016, устный доклад
⦁ И.А. Гаранина, Г.Ю. Фисунов, Д.В., Евсютина, Т.А., Семашко, В.М., Говорун, ПОСТРОЕНИЕ СЕТИ ТРАНСКРИПЦИОННОЙ РЕГУЛЯЦИИ МОЛЛИКУТ, спецвыпуск ActaNaturae т.2, с. 118, V СЪЕЗД ОБЩЕСТВА БИОХИМИКОВ РОССИИ Дагомыс, 4-9 октября 2016, постерный до­­­клад
⦁ Д.С. Матюшкина, О.В. Побегуц, И.О. Бутенко, А.А. Ванюшкина, Н.А.  Аниканов, О.Н. Букато, Д.В. Евсютина, Т.А. Семашко, И.А. Гаранина, Г.Ю. Фисунов, В.М. Говорун, ActaNaturae т.2, с. 120, V СЪЕЗД ОБЩЕСТВА БИОХИМИКОВ РОССИИ Дагомыс, 4-9 октября 2016, постерный до­­­клад
 
Отчет первый семестр
Коллегами из лаборатории протеомного анализа были получены данные РНК-секвенирования 5` - обогащенных библиотек РНК по 4 биологических повтора двух видов молликут  –  Acholeplasma laidlawii (A.laidlawii) и Spiroplasma malliferum (S.malliferum).  Половина бактерий подверглась тепловому шоку. Полученные прочтения были выровнены с геномами исследуемых бактерий с помощью программы bowtie со следующими параметрами: --trim3 23 -f -C -v 3 -y -a --best --strata –S. Предварительно были отфильтрованы прочтения с качеством ниже 15. Прочтения, выровненные более с чем одним сайтом в геноме, обрабатывались тем же образом, что и уникальные прочтения. Для того, чтобы найти сайты старта транскрипции (transcription start site - TSS) был проведен поиск локальных максимумов в покрытии прочтениями, 5 прочтения было поставлено в качестве порога на покрытие для TSS. Для моделирования покрытия в каждом локальном максимуме рассматривая покрытие в 5 нуклеотидов в качестве фона по каждой кодирующей цепи, для моделирования использовалась обобщенная линейная модель с квази-биномиальным распределением и овердиспресией не менее 1. Я использовала квази-максимальный тест правдоподобия для оценки значимости полученных пиков, пики с корректированным p-value ниже 0.05 считались значимыми. 
По TSS с покрытием более 100 нуклеотидов была построена позиционно-специфическая матрица промотера главного сигма-фактора  70. С помощью этой матрицы был проведен поиск всех промоторов в геноме на расстоянии от TSS не более 250 нуклеотидов. Таким образом для A.laidlawii было идентифицировано 836 TSS и все гены были разбиты на 535 транскрипционных единиц. Транскрипционная единица определялась как несколько генов с общим началом транскрипции. Я выяснила, что промотор  A.laidlawii состоит из трех основных элементов: -10 бокс с последовательностью TAWAAT и дополнительной частью перед ним с последовательностью TRTG и -35 бокс с последовательностью TTGACA. Так же было замечено, что первый нуклеотид транскрипта чаще всего G или А. 
Идентифицированные TSS использовались для определения оперонной структуры изучаемых геномов и поиска сайтов связывания транскрипционных факторов. В геноме A.laidlawii было идентифицировано 38 транскрипционных факторов из 17 семейств. 25 из них находятся в оперонах с более чем 1 геном и, вероятно, регулируют транскрипцию этого оперона. На основании этого предположения был проведен поиск сайтов связывания этих факторов, используя сравнительно геномный подход. С помощью программы blast были определены ближайшие гомологи транскрипционных факторов (более 60% совпадения по аминокислотам). Программами meme и dminda был проведен поиск мотивв сайтов связывания.  Для 21 из 25 транскрипционных факторов, таким образом, были предсказаны последовательности сайтов связывания на ДНК. Для каждого мотива сайта были построены позиционно-специфические матрицы, которые использовались для поиска генов-мишеней, регулируемых данными транскрипционными факторами. Только для 4 факторов из 21 были найдены мишени, отличные от оперонов, в которые входят сами транскрипционные факторы. Аналогичным образом были предсказаны последовательности сайтов связывания транскрипционных факторов, которые лежат в единичных оперонах. Для них было предсказано множество генов-мишеней транскрипционных факторов из семейства LacI, регулирующих катаболизм различных углеродных соединений. 
Так же был проведен поиск и анализ регуляторных РНК в геноме A.laidlawii. В базе Rfam были обнаружены предсказанные ранее регуляторные РНК-элементы, в том числе различные рибопереключали и короткие антисмысловые РНК. Используя данные о покрытии, мною были идентифицировано 6 новых регуляторных РНК. Половина из них находятся в антисмысловой цепи аннотированных генов и, вероятно, участвует в регуляции транскрипции этих генов. 
В ходе анализа выяснилось, что количество прочтений в одном из 4 повторов S.malliferum содержит в 20 раз меньше прочтений по сравнению с остальными образцами. По этой причине этот образец был отправлен на дополнительное пересеквенирование. Новые данные по секвенированию этого образца уже были получены, но еще не обработаны. Предварительный анализ трех хороших образцов показал, что S.malliferum имеет такое же строение промотера как и A.laidlawii. 
Таким образом, в результате работы были получены координаты стартов транскрипции в геноме A.laidlawii и проанализированы последовательности промоторов и сайтов связывания транскрипционных факторов. 
 
Отчет второй семестр
Коллегами из лаборатории протеомного анализа были получены данные РНК-секвенирования 5` - обогащенных библиотек РНК по 4 биологических повтора двух видов молликут  –  Acholeplasma laidlawii (A.laidlawii) и Spiroplasma malliferum (S.malliferum).  Половина бактерий подверглась тепловому шоку. Полученные прочтения были выровнены с геномами исследуемых бактерий с помощью программы bowtie со следующими параметрами: --trim3 23 -f -C -v 3 -y -a --best --strata –S. Предварительно были отфильтрованы прочтения с качеством ниже 15. Прочтения, выровненные более с чем одним сайтом в геноме, обрабатывались тем же образом, что и уникальные прочтения. Для того, чтобы найти сайты старта транскрипции (transcription start site - TSS) был проведен поиск локальных максимумов в покрытии прочтениями, 5 прочтения было поставлено в качестве порога на покрытие для TSS. Для моделирования покрытия в каждом локальном максимуме рассматривая покрытие в 5 нуклеотидов в качестве фона по каждой кодирующей цепи, для моделирования использовалась обобщенная линейная модель с квази-биномиальным распределением и овердиспресией не менее 1. Я использовала квази-максимальный тест правдоподобия для оценки значимости полученных пиков, пики с корректированным p-value ниже 0.05 считались значимыми. 
По TSS с покрытием более 100 нуклеотидов была построена позиционно-специфическая матрица промотера главного сигма-фактора  70. С помощью этой матрицы был проведен поиск всех промоторов в геноме на расстоянии от TSS не более 250 нуклеотидов. Таким образом для A.laidlawii было идентифицировано 836 TSS и все гены были разбиты на 535 транскрипционных единиц. Транскрипционная единица определялась как несколько генов с общим началом транскрипции. Я выяснила, что промотор  A.laidlawii состоит из трех основных элементов: -10 бокс с последовательностью TAWAAT и дополнительной частью перед ним с последовательностью TRTG и -35 бокс с последовательностью TTGACA. Так же было замечено, что первый нуклеотид транскрипта чаще всего G или А. 
Идентифицированные TSS использовались для определения оперонной структуры изучаемых геномов и поиска сайтов связывания транскрипционных факторов. В геноме A.laidlawii было идентифицировано 38 транскрипционных факторов из 17 семейств. 25 из них находятся в оперонах с более чем 1 геном и, вероятно, регулируют транскрипцию этого оперона. На основании этого предположения был проведен поиск сайтов связывания этих факторов, используя сравнительно геномный подход. С помощью программы blast были определены ближайшие гомологи транскрипционных факторов (более 60% совпадения по аминокислотам). Программами meme и dminda был проведен поиск мотивв сайтов связывания.  Для 21 из 25 транскрипционных факторов, таким образом, были предсказаны последовательности сайтов связывания на ДНК. Для каждого мотива сайта были построены позиционно-специфические матрицы, которые использовались для поиска генов-мишеней, регулируемых данными транскрипционными факторами. Только для 4 факторов из 21 были найдены мишени, отличные от оперонов, в которые входят сами транскрипционные факторы. Аналогичным образом были предсказаны последовательности сайтов связывания транскрипционных факторов, которые лежат в единичных оперонах. Для них было предсказано множество генов-мишеней транскрипционных факторов из семейства LacI, регулирующих катаболизм различных углеродных соединений. 
Так же был проведен поиск и анализ регуляторных РНК в геноме A.laidlawii. В базе Rfam были обнаружены предсказанные ранее регуляторные РНК-элементы, в том числе различные рибопереключали и короткие антисмысловые РНК. Используя данные о покрытии, мною были идентифицировано 6 новых регуляторных РНК. Половина из них находятся в антисмысловой цепи аннотированных генов и, вероятно, участвует в регуляции транскрипции этих генов. 
В ходе анализа выяснилось, что количество прочтений в одном из 4 повторов S.malliferum содержит в 20 раз меньше прочтений по сравнению с остальными образцами. По этой причине этот образец был отправлен на дополнительное пересеквенирование. Новые данные по секвенированию этого образца уже были получены, но еще не обработаны. Предварительный анализ трех хороших образцов показал, что S.malliferum имеет такое же строение промотера как и A.laidlawii. 
Таким образом, в результате работы были получены координаты стартов транскрипции в геноме A.laidlawii и проанализированы последовательности промоторов и сайтов связывания транскрипционных факторов. 

2 год обучения (0)

Статьи по теме диссертации:

⦁ Fisunov GY, Evsyutina DV, Garanina IA, Arzamasov AA, Butenko IO, Altukhov IA,  Nikitina AS, Govorun VM. Ribosome profiling reveals an adaptation strategy of reduced bacterium to acute stress. Biochimie. 2017 Jan;132:66-74. 
 
Конференции: 
⦁ I.A. Garanina, D.V. Evsutina, G.U. Fisunov., Identification of bacteria transcription factor targets by machine learning MOSCOW CONFERENCE ON COMPUTATIONAL MOLECULAR BIOLOGY (MCCMB 2017) Mосква, 27-30 июля 2017 г., с. 87, устный доклад
⦁ I.A. Garanina, G.U. Fisunov., D.V. Evsutina, V.M. Govorun, IDENTIFICATION OF BACTERIA TRANSCRIPTION FACTOR TARGETS BY MACHINE LEARNING, SYSTEMS BIOLOGY AND BIOINFORMATICS Yalta, 25-30 июня 2017 г., с. 33, постерный до­­­клад
⦁ D. Evsyutina, I. Garanina, A. Nikitina, G. Fisunov, V. Govorun, RIBOSOME AS SELECTOR OF ADAPTIVE RESPONSE IN MYCOPLASMA GALLISEPTICUM, SYSTEMS BIOLOGY AND BIOINFORMATICS SYSTEMS BIOLOGY AND BIOINFORMATICS Yalta, 25-30 июня 2017 г., с. 30-31, постерный до­­­клад
⦁ FISUNOV GLEB, GARANINA IRINA, EVSYUTINA DARIA, SEMASHKO TATIANA, GOVORN VADIM, RECONSTRUCTION OF TRANSCRIPTION CONTROL NETWORKS IN MOLLICUTES BY HIGH-THROUGHPUT IDENTIFICATION OF PROMOTERS, MOSCOW CONFERENCE ON COMPUTATIONAL MOLECULAR BIOLOGY (MCCMB 2017) Mосква, 27-30 июля 2017 г., с. 53, постерный до­­­клад
⦁ И.А. Гаранина, Г.Ю. Фисунов, ПОИСК МИШЕНЕЙ ТРАНСКРИПЦИОННЫХ ФАКТОРОВ БАКТЕРИЙ МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ, НАУЧНАЯ  КОНФЕРЕНЦИЯ МОЛОДЫХ УЧЕНЫХ ПО МЕДИЦИНСКОЙ БИОЛОГИИ ФГБУ ФНКЦ ФХМ ФМБА ТЕЗИСЫ ДОКЛАДОВ, с. 7, Москва 2017, устный доклад
⦁ Гаранина И.А., Фисунов Г.Ю. , ПОИСК МИШЕНЕЙ ТРАНСКРИПЦИОННЫХ ФАКТОРОВ БАКТЕРИЙ МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ  XXIХ Зимняя молодежная научная школа «Перспективные направления физико-химической биологии и биотехнологии», Москва 07-10 февраля 2017 г, c. 77, постерный до­­­клад
⦁ СЕМАШКО Т.А., АРЗАМАСОВ А.А., ГАРАНИНА И.А., ФИСУНОВ Г.Ю., ГОВОРУН В.М. ИДЕНТИФИКАЦИЯ МОДИФИКАЦИЙ ДНК M GALLISEPTICUM МЕТОДОМ SMRT СЕКВЕНИРОВАНИЯ, II ВСЕРОССИЙСКАЯ КОНФЕРЕНЦИЯ С МЕЖДУНАРОДНЫМ УЧАСТИЕМ «ВЫСОКОПРОИЗВОДИТЕЛЬНОЕ СЕКВЕНИРОВАНИЕ В ГЕНОМИКЕ» Новосибирск, 18-23 июня 2017 г., с. 50, постерный до­­­клад
 
Отчет первый семестр
Была создана база данных «База данных по системной биологии Молликут», содержащая различные системные данные о трех видах бактерий средуцированными геномами из класса Молликут: Acholeplasma laidlawii (A.laidlawii) и Spiroplasma malliferum (S.malliferum) и Mycoplasma gallisepticum (M.gallisepticum). База данных создана на английском языке для возможности международного доступа. Для неё разработан веб-интерфейс, размещенный по адресу http://smdb.rcpcm.org/.  База данных включает в себя  экспериментальные данные, полученные коллегами из лаборатории протеомного анализа. База реализована как гено-центрическое приложение, позволяющее выбрать ген бактерии и просмотреть всю известную по нему информацию из мировых баз данных, а также всю новую экспериментальную информацию: уровень экспрессии генов в различных состояниях клетки, изменения количественной представленности белка в различных состояниях, данные по взаимодействию с другими белками. Так же база включает подробные карты метаболических путей с информацией об экспериментальном подтверждении конкретных метаболитов в клетке. На основе данных представленных в базе данных были предсказаны  пути транскрипционной регуляции микоплазмы и близких видов молликут. 
Для построения базы я использовала данные обычного РНК-секвенирования и секвенирования 5`-концевой РНК. Для подсчета уровня экспрессии использовалась программа bowtie со следующими параметрами: --trim3 23 -f -C -v 3 -y -a --best --strata –S. Для определения ортологичных и паралогичных генов использовалась программа blast и алгоритм марковской кластеризации. 
Используя полученные и обработанные ранее данные по координатам TSS (transcription start site)  я разработала и применила новый метод для предсказания мишеней транскрипционных факторов в бактериальных геномах. Метод основан на применении машинного обучения с использованием экспериментальных данных  5`-концевого секвенирования РНК. Суть метода состоит в сравнении предсказанной (pps – predicted promoter strength) и экспериментально измеренной силы промотора (ps – promoter strength). Теоретически, если транскрипция некоторого гена не зависит от активности транскрипционных факторов, то pps должна быть примерно равна ps, в случае репрессии транскрипции гена pps будет сильно больше ps – это значит, что ген имеет «сильный» промотер, но реальная частота инициации транскрипции не очень большая или равна нулю.  Если pps будет меньше ps, значит с промотером гена, возможно, связывается транскрипционный фактор, активирующий транскрипцию. 
Для проведения машинного обучения был выбран алгоритм RF (random forest), который строит множество независимых деревьев решений по случайным подвыборкам из обучающей выборки. Была построена модель, которая по последовательности промотора предсказывает его «силу», выраженную в количестве прочтений, выровненных с 5`-концом транскрипта. Для построения модели использовалось несколько характеристик промотора, оценивающих соответствие оптимальной последовательности, оптимальным расстояниям между различными детерминантами промотора и нуклеотидный состав спейсеров между детерминантами. Соответствие оптимальным последовательностям детерминант промотора выражалось через вес выравнивания последовательности с позиционной весовой матрицей оптимального мотива.
Получена модель, с точностью 86% предсказывающая силу промотора по его последовательности. Для бактерии Mycoplasma gallisepticum я показала, что 40% генов находятся под контролем некоторых факторов, влияющих на инициацию транскрипции, что примерно в 40 раз больше количества аннотированных на данный момент мишеней транскрипционных факторов у  M.gallisepticum. 70% из обнаруженных регулируемых генов репрессированы. Функциональный анализ репрессированных генов показал, что в основном они относятся к видоспецифичным или специфичным для микоплазм генам, связанным с их паразитическим образом жизни. Примерно 62% генов  Acholeplasma laidlawii репрессированы, среди остальных генов, большая часть так же экспрессируется ниже теоретически предсказанного уровня.
Таким образом, был разработан метод для точного предсказания «силы» бактериальных промоторов по его последовательности, метод опробован на двух близкородственных бактериях класса Молликут. Частота инициации транскрипции более чем половины генов  M.gallisepticum  полностью предсказывается по последовательности промотора. У A.laidlawii наоборот - большинство генов находятся в репрессированном состоянии. На основе полученных данных были найдены гены в геноме M.gallisepticum, которые, возможно, являются новыми  транскрипционными факторами, что в ближайшем будущем планируется подтвердить экспериментально.
 
Отчет второй семестр
 
Была создана база данных «База данных по системной биологии Молликут», содержащая различные системные данные о трех видах бактерий средуцированными геномами из класса Молликут: Acholeplasma laidlawii (A.laidlawii) и Spiroplasma malliferum (S.malliferum) и Mycoplasma gallisepticum (M.gallisepticum). База данных создана на английском языке для возможности международного доступа. Для неё разработан веб-интерфейс, размещенный по адресу http://smdb.rcpcm.org/.  База данных включает в себя  экспериментальные данные, полученные коллегами из лаборатории протеомного анализа. База реализована как гено-центрическое приложение, позволяющее выбрать ген бактерии и просмотреть всю известную по нему информацию из мировых баз данных, а также всю новую экспериментальную информацию: уровень экспрессии генов в различных состояниях клетки, изменения количественной представленности белка в различных состояниях, данные по взаимодействию с другими белками. Так же база включает подробные карты метаболических путей с информацией об экспериментальном подтверждении конкретных метаболитов в клетке. На основе данных представленных в базе данных были предсказаны  пути транскрипционной регуляции микоплазмы и близких видов молликут. 
Для построения базы я использовала данные обычного РНК-секвенирования и секвенирования 5`-концевой РНК. Для подсчета уровня экспрессии использовалась программа bowtie со следующими параметрами: --trim3 23 -f -C -v 3 -y -a --best --strata –S. Для определения ортологичных и паралогичных генов использовалась программа blast и алгоритм марковской кластеризации. 
Используя полученные и обработанные ранее данные по координатам TSS (transcription start site)  я разработала и применила новый метод для предсказания мишеней транскрипционных факторов в бактериальных геномах. Метод основан на применении машинного обучения с использованием экспериментальных данных  5`-концевого секвенирования РНК. Суть метода состоит в сравнении предсказанной (pps – predicted promoter strength) и экспериментально измеренной силы промотора (ps – promoter strength). Теоретически, если транскрипция некоторого гена не зависит от активности транскрипционных факторов, то pps должна быть примерно равна ps, в случае репрессии транскрипции гена pps будет сильно больше ps – это значит, что ген имеет «сильный» промотер, но реальная частота инициации транскрипции не очень большая или равна нулю.  Если pps будет меньше ps, значит с промотером гена, возможно, связывается транскрипционный фактор, активирующий транскрипцию. 
Для проведения машинного обучения был выбран алгоритм RF (random forest), который строит множество независимых деревьев решений по случайным подвыборкам из обучающей выборки. Была построена модель, которая по последовательности промотора предсказывает его «силу», выраженную в количестве прочтений, выровненных с 5`-концом транскрипта. Для построения модели использовалось несколько характеристик промотора, оценивающих соответствие оптимальной последовательности, оптимальным расстояниям между различными детерминантами промотора и нуклеотидный состав спейсеров между детерминантами. Соответствие оптимальным последовательностям детерминант промотора выражалось через вес выравнивания последовательности с позиционной весовой матрицей оптимального мотива.
Получена модель, с точностью 86% предсказывающая силу промотора по его последовательности. Для бактерии Mycoplasma gallisepticum я показала, что 40% генов находятся под контролем некоторых факторов, влияющих на инициацию транскрипции, что примерно в 40 раз больше количества аннотированных на данный момент мишеней транскрипционных факторов у  M.gallisepticum. 70% из обнаруженных регулируемых генов репрессированы. Функциональный анализ репрессированных генов показал, что в основном они относятся к видоспецифичным или специфичным для микоплазм генам, связанным с их паразитическим образом жизни. Примерно 62% генов  Acholeplasma laidlawii репрессированы, среди остальных генов, большая часть так же экспрессируется ниже теоретически предсказанного уровня.
Таким образом, был разработан метод для точного предсказания «силы» бактериальных промоторов по его последовательности, метод опробован на двух близкородственных бактериях класса Молликут. Частота инициации транскрипции более чем половины генов  M.gallisepticum  полностью предсказывается по последовательности промотора. У A.laidlawii наоборот - большинство генов находятся в репрессированном состоянии. На основе полученных данных были найдены гены в геноме M.gallisepticum, которые, возможно, являются новыми  транскрипционными факторами, что в ближайшем будущем планируется подтвердить экспериментально.
 

3 год обучения (0)

Статьи по теме диссертации:

⦁ Orlov M, Garanina I, Fisunov GY, Sorokin A. Comparative Analysis of Mycoplasma gallisepticum vlhA Promoters. Front Genet. 2018 Nov 21;9:569. 
⦁ Garanina IA, Fisunov GY, Govorun VM. BAC-BROWSER: The Tool for Visualization and Analysis of Prokaryotic Genomes. Front Microbiol. 2018 Nov 21;9:2827.

Конференции:

⦁ Garanina, I.; Evsutina, D.; Fisunov, G., Affect of N6-methyladenosine mRNA modification on translation rate of bacteria, Febs Open Bio 8:113-114, FEBS congress Prague, Czech republic, 7-12 JUL 2018, постерный до­­­клад
⦁ Fisunov, G.; Evsyutina, D.; Garanina, I.; Govorun V. Identification of novel mechanisms of transcriptional regulation in reduced bacteria using machine learning and high-throughput identification of promoters, Febs Open Bio 8:444, FEBS congress Prague, Czech republic, 7-12 JUL 2018, постерный до­­­клад
⦁ Matyushkina, D; Butenko, I; Pobeguts, O; Evsyutina,; Garanina, I; Musarova, V; Ladygina, V; Fisunov, G; Govorun, V. Phenotypic memory in bacteria with minimal genome Febs Open Bio 8: 194, JUL 2018, постерный до­­­клад
⦁ Evsiutina, D; Pobeguts, O; Butenko,; Semashko, T; Ladygina, V; Garanina, I; Fisunov, G; Govorun, V Secreted and surface-associated proteins of Mycoplasma gallisepticum, Febs Open Bio 8:196, FEBS congress Prague, Czech republic, 7-12 JUL 2018, постерный до­­­клад
⦁ Semashko, T; Arzamasov, A; Garanina, I; Matyushkina, D; Pobeguts, O; Fisunov, G; Govorun, V. DNA methylation in Mycoplasma gallisepticum, Febs Journal 284:237-238, FEBS congress  Jerusalem, Israel, 10-14 SEP 2017, постерный до­­­клад
⦁ Гаранина И.А., Семашко Т.А., Бутенко И.О., Матюшкина Д.С., Побегуц О.В., Евсютина Д.В., Фисунов Г.Ю., Говорун В.М. (Garanina I.A., Semashko T.A., Butenko I.O., Matyushkina D.S., Pobeguts O.V., Evsyutina D.V., Fisunov G.Y., Govorun V.M.) БАЗА ОМИКСНЫХ ДАННЫХ ДЛЯ ИЗУЧЕНИЯ ЭВОЛЮЦИИ БАКТЕРИЙ НА СИСТЕМНОМ УРОВНЕ В поисках моделей персонализированной медицины. V Международной конференции «ПОСТГЕНОМ’2018» 29 октября - 2 ноября 2018, Казань, с. 225, устный доклад 
⦁ Раковская И.В., Лёвина Г.А., Бархатова О.И., Грибова Т.Н., Гаранина И.А., Бутенко И.О., Букато О.Н., Левитес М.А, Ладыгина В.Г., Побегуц О.В., Фисунов Г.Ю. ПРОТЕОМНЫЙ АНАЛИЗ КЛЕТОК MYCOPLASMA HOMINIS, ОБРАЗУЮЩИХ КОЛОНИИ НЕИЗВЕСТНОГО РАНЕЕ МОРФОЛОГИЧЕСКОГО ТИПА, V Международной конференции «ПОСТГЕНОМ’2018» 29 октября - 2 ноября 2018, Казань, с. 214, постерный доклад
⦁ Г.Ю. Фисунов, И.А. Гаранина, Д.В. Евсютина, О.В. Побегуц, И.О. Бутенко, В.М. Говорун ТЁМНАЯ МАТЕРИЯ РЕГУЛЯЦИИ ЭКСПРЕССИИ ГЕНОВ В МИНИМАЛЬНОЙ КЛЕТКЕ, V Международной конференции «ПОСТГЕНОМ’2018» 29 октября - 2 ноября 2018, Казань, с.47, постерный доклад
⦁ Гаранина И.А., Матюшкина Д.С., Бабенко В.В., Вакхитова В.Т., Фисунов Г.Ю. СРАВНЕНИЕ ГЕНОМА КУРИНОГО ПАТОГЕНА MYCOPLASMA GALLISEPTICUM ПРИ ОСТРОЙ И ХРОНИЧЕСКОЙ ИНФЕКЦИИ, БИОТЕХНОЛОГИЯ В РАСТЕНИЕВОДСТВЕ, ЖИВОТНОВОДСТВЕ И ВЕТЕРИНАРИИ Москва, 19-20 апреля 2018 г., с. 161, устный доклад
⦁ Orlov M., Garanina I., Ryasik A., Zykova E., Fisunov G., Sorokin A. PHYSICOCHEMICAL PROPERTIES OF VLHA PROMOTERS IN MYCOPLASMA GALLISEPTICUM AND THEIR POSSIBLE REGULATORY ROLE, SYSTEMS BIOLOGY AND BIOINFORMATICS (SBB-2018) Novosibirsk, 27-31 августа 2018 г., стр. 33 в сборнике, постерный доклад
 
Отчет первый семестр
На основе данных профилирования стартов транскрипции бактерии Mycoplasma gallisepticum была построена математическая модель, позволяющая предсказывать теоретический уровень экспрессии гена по последовательности его промотора. С помощью этой модели было обнаружено несколько генов, регулируемых потенциальными неизвестными регуляторами. Чтобы обнаружить эти возможные регуляторы были собраны и проанализированы данные РНК секвенирования близкородственной бактерии Mycoplasma pneumonia. Данные с прочтениями, полученными при секвенировании 95 полных транскриптомов M.pneumonia были проанализированы с помощью программы Salmon и нормализованы относительно контрольных образцов. Полученные данные использовались для построения сети коэкспрессии генов M.gallisepticum. Для построения сети коэкспрессии применялся корреляционный анализ. Сеть коэкспрессии использовалась для поиска регуляторов, регулирующих потенциальные мишени, предсказанные при помощи построенной ранее математической модели. Благодаря этому методу были обнаружены гены, экспрессия которых коррелирует с экспрессией интересующих нас генов.  
Для идентификации регуляторов мишеней в M.gallisepticum была проведена попытка использовать систему фаговой защиты CRISPR-Cas. В геноме бактерии M.gallisepticum имеются собственные белки данной системы. Но последовательность протоспейсера PAM, необходимая для обнаружения мишени редактирования, была не известна.  Я применила биоинформатический подход для предсказания последовательности PAM M.gallisepticum. Для этого были использованы спейсеры из CRISPR системы из лабораторного штамма M.gallisepticum S6 и 8 диких штаммов, изолированных от вьюрков. Последовательности спейсеров были выравнены с прочтениями из метагеномов кур, полученных из открытых баз данных. В качестве PAM последовательности была предсказана короткая консервативная последовательность, окружающая последовательности из метагеномов, которые были гомологичны спейсерам из CRISPR кассет. 
Таким образом, был проведен анализ различных опубликованных данных, который помог в поиске регуляторов потенциальных мишеней в геноме M.gallisepticum. 
 
 
Отчет второй семестр
 
Ранее была построена математическая модель, предсказывающая частоту инициации транскрипции по последовательности промотора бактерий. Эта модель была экспериментально валидирована на 5 различных промоторах Mycoplasma gallisepticum. Последовательности промоторов были синтезированы и включены в генетические конструкции на основе транспозонов, которые экспрессируются в клетках Mycoplasma gallisepticum. С помощью метода ПЦР в реальном времени были получены данные, подтверждающие результаты математического предсказания. Так для 4 из 5 проверенных промоторов частота инициация транскрипции, предсказанная с помощью модели, совпадает с экспериментально полученными данными. Так же было создано порядка 10 различных генетических конструкций для уточнения математической модели. В частности на экспериментальных данных было показано влияние первого нуклеотида на уровень транскрипции, различных последовательностей -10 бокса и наличия -35 бокса. Полученные новые данные помогли уточнить математическую модель.
Используя раннее полученные данные РНК-секвенирования, я показала, что -10 боксы у бактерий с редуцированными геномами имеют склонность к формированию скоплений в районе промотора. Из этих -10 боксов для инициации транскрипции используется только один. Эти данные были получены статистическим анализом порядка 500 промоторов Mycoplasma gallisepticum. Было проведено математическое сравнение плотности теоретически предсказанных и экспериментально полученных -10 боксов с помощью непараметрического теста Манна-Уитни. Полученные данные были использованы для уточнения математической модели.
Математической моделью были предсказаны гены, которые являются возможными мишенями транскрипционной регуляции в геноме Mycoplasma gallisepticum. Вычислительными методами было показано, что транскрипция одного из этих генов HatA находится под контролем рибопереключателя. Ранее для Mycoplasma gallisepticum не было показано наличие рибопереключателей в геноме. Чтобы экспериментально подтвердить наличие рибопереключателя была создана генетическая конструкция на основе транспозона, включающая участки промотора HatA различной длины. Сравнивая уровень транскрипции гена HatA с разными участками промотора я показала, что этот ген действительно находится под контролем рибопереключателя. 
Таким образом, новые данные, полученные в экспериментах, были использованы для уточнения построенной ранее математической модели. С ее помощью был предсказан новый регуляторный элемент в геноме Mycoplasma gallisepticum – рибопереключатель гена HatA.

4 год обучения (0)

Планируется публикация 1 научной статьи и 3 выступления на конференциях

Отчет первый семестр

Построенная нами ранее математическая модель выявила несколько новых потенциальных регуляторов транскрипции бактерий. Мы более подробно изучили белок WhiA. Мы показали, что этот белок является регулятором транскрипции консервативного оперона, включающего в себя порядка 20 генов рибосомальных белков, субъединицу РНК-полимеразы и аденилатциклазу. Белок WhiA подавляет транскрипцию этого оперона в стационарной фазе, при избытке АТФ в среде эффект репрессии исчезает. Мы показали, что белок образует специфический ДНК-белковый комплекс при повышении уровня АТФ. С помощью метода торможения ДНК в геле мы показали какие именно участки ДНК участвуют в связывании белка. У других бактерий WhiA вовлечен в процесс регуляции спорообразования. Предположительно, WhiA необходим для торможения синтеза белка клетки при недостатке ресурсов и в условиях голодания. Мы проверили это предположение, выращивая микоплазму в среде без добавления глюкозы. Транскрипция WhiA  и рибосомальных генов при этом не изменилась. С помощью сравнительно-геномных методов был проведен поиск гена WhiA и его сайта связывания у других бактерий. Выяснилось, что этот ген консервативен для грамположительных бактерий и аннотирован в геномах таких опасных бактерий как Mycobacterium tuberculosis, Staphylococcus aureus. Также ген был обнаружен у бактерий из группы Thermotoga, которые являются одной из древнейших групп бактерий и похожи на архей. Это говорит о важности белка WhiA для бактерий и возможности его наличия у архей и общих предков с эукариотами. Белок WhiA состоит из двух доменов - HTH ДНК-связывающего домена и эндонуклеазного домена. Гомологичные по структуре эндонуклеазные домены широко распространены у эукариот, в том числе у человека. Также в других работах на Bacillus subtilis было замечено, что при нокауте WhiA меняется степень конденсации ДНК в клетке. Сайт связывания WhiA состоит из двух консервативных участков, эти участки связываются разными доменами белка, которые связаны подвижным линкером. Мы показали, что WhiA способен связывать участки ДНК на разных молекулах и таким образом работать как гистоно-подобный белок.