Базата данни с модели на гени НОСОМОСО е актуализирана
Руски учени в сътрудничество с колегите си от САЩ и Канада извършват сериозна актуализация на НОСОМОСО. Това е база данни от модели на нуклеотидни последователности на ДНК сектори, които свързват транскрипционни фактори (TF). НОСОМОСО е съкращението на HOmo sapiens COmprehensive MOdel Collection (Изчерпателна колекция от модели за Хомо сапиенс).
НОСОМОСО
В базата данни НОСОМОСО се съхраняват модели на местата за свързване на транскрипционните фактори. Всеки модел представя математически ДНК участъците, които могат да бъдат свързани с TF. Например с един от протеините, който потиска или напротив, който активира работата на различни гени.
В човешкия геном има кодирани хиляди транскрипционни фактора. А базата данни пази модели на участъците, свързани с TF за човешки и миши ортолози – гени, произлезли от същия ген във вид, който е общ за прародителя на мишката и човека.
Както подчертават изследователите в статията, публикувана в научното списание Nucleic Acid Research, изчислителната анотация на местата за свързване на транскрипционния фактор остава основният стълб, който поддържа купола на изследвания за генна регулация.
>>>Незабелязан седем десетилетия механизъм съхранява информация в ДНК
HOCOMOCO се използва от изследователите от целия свят за експериментите, които извършват. Например, чрез базата данни могат да бъдат предсказани местата на свързване на транскрипционните фактори с нуклеотиди в ДНК верига, тоест местата, на които експресията на гените се влияе от TF. А въз основа на предвидените места на свързване могат да бъдат изградени модели на регулаторни мрежи, които обясняват механизмите на превключване на гени при различни условия. Мрежите са нужни, за да бъде разбран биологичния модел на генната експресия в определен процес, например по времето, когато се развива рак.
Новият вариант на базата данни
Базата данни е създадена през 2013 г., а последното й обновяване е от 2018-а.
„Скорошното натрупване на данни и подобрения в анотацията на TF изискват колекцията да бъде увеличена значително. Стана едновременно необходимо и вече възможно да се покрият повече траскрипционни фактора и алтернативни подтипове на свързващ мотив“, пишат авторите и уточняват, че представят HOCOMOCO v12, който е възстановен от нулата като изследователите използват ин виво и ин витро високопроизводителни данни за TF свързване.
>>>Първият човешки пангеном съдържа геномите на 47 представители на расови и етнически групи
За базата данни учените събират резултатите от експерименти, които изучават взаимодействията на ДНК и транскрипционните фактори от няколко отворени бази с данни. Основната роля в тази дейност се пада на екипа на Федералния изследователски център за информационни и изчислителни технологии на Сибирския клон на Руската академия на науките. Техен ръководител е Федор Колпаков, който оглавява лабораторията по биоинформатика. Огромната колекция от ДНК фрагменти, които се свързват с протеини, е възможна благодарение на работата им.
За да бъде създаден HOCOMOCO с помощта на изчислителен анализ на ДНК текста в тези малки фрагменти биват намерени мотиви – малки ДНК последователности, с които се свързват транскрипционните фактори. Преди мотивите да бъдат включени в окончателната база данни учените определят структурата и функцията на протеините с помощта на специални инструменти. След това определят надеждността на мотивите, която показва доколко е достоверно взаимодействието на носещия ДНК мотив и TF в различни по вид опити.
>>>Енигматичната Y хромозома е разчетена напълно
Изследователите извършват и друга проверка. Преди да влезе окончателно в базата данни всеки модел бива подлаган на изчислителни експерименти. Целта е да се определи колко добре той помага да бъдат предсказани местата за свързването на ДНК с TF.
Получените от експериментите резултати биват сравнени с реалните данни от лабораторията. Оценката за точност, чувствителност и специфичност на всеки модел бива поставяна въз снова на няколко различни сравнение.
>>>Древна ДНК разкрива причината за по-голямата заболеваемост от множествена склероза в Европа
След изпълнението на тези стъпки учените съставят финалния ред за всеки модел в общата база. След това тя вече е отворена за учените от всички страни.
Настоящата версия има повече нови модели, а тяхната валидност и точност са повишени.
Създадени са още и колекции от специални модели за предсказване на ДНК протеинови взаимодействия ин виво и ин витро от една страна, а от друга за предвиждането на отделни варианти в генома, които влияят на свързването на регулаторните протеини.
Проф. Всеволод Макеев, член-кореспондент на Руската академия на науките, ръководител на лабораторията по системна биология и изчислителна генетика ИОГен към РАН и завеждащ катедрата по биоинформатика и системна биология в Московския физико-технически институт, определя HOCOMOCO по следния начин:„стабилна база данни, която разширява възможностите си в областта на молекулярната биология и епигенетика.“ Така е, защото: „За пълното обновяване и допълването екипът ни проучи данните от 14 183 експеримента за ChIP секвениране и 2554 опита HT-SELEX. Това направи възможно да получим повече от 400 000 кандидат – мотива, от които бяха избрани 1443, характеризиращи ДНК участъци, които свързват 949 човешки транскрипционни фактора и 720 техни аналози в мишки.“
- Вмъкват безопасно в човешкия геном дълги участъци от ДНК
- Двувалентни ДНК ензими изключват гените, отговорни за множество болести
- Експериментална генна терапия спира развитието на смъртоносния хемофагоцитен синдром
- Неправилната работа на гените Srr1 и Skb1 води до мащабни промени на хромозомите в ДНК
Продукти свързани с НОВИНАТА
НОВИНАТА е свързана към
- Генетични изследвания
- Исторически моменти от откриването и разгадаването на ДНК
- Полевата терапия може да лекува нелечими заболявания чрез кичур коса
- Опити за разгадаване състава на гена
- Розалинд Франклин и приносът й за разгадаването на структурата на ДНК
- Значение на точковите мутации за историята на биологичната наука
- Рядка мутация, водеща до нанизъм, намалява риска от сърдечни заболявания
- Какво означава да си секси?
- Опити и хипотези за направата на ДНК от нуклеина
- Създаване на представата за онкогените
Коментари към Базата данни с модели на гени НОСОМОСО е актуализирана