«ПЕРВЫЙ СРЕДИ РАВНЫХ...»
Нормативные документы
Противодействие коррупции
Поступающим
Студентам
Выпускникам
Проект 5-100
Аккредитация специалистов
28.01.2008

Московский семинар по биоинформатике Mark Borodovsky «A new ab initio gene finder for fungi genomes: iterative unsupervised parameter estimation»

Дата: 28.03.2008

Московский семинар по биоинформатике.
Mark Borodovsky «A new ab initio gene finder for fungi genomes: iterative unsupervised parameter estimation»

Пятница, 28 марта 2008 года, 18:00, Институт молекулярной биологии им. Энгельгардта, комната 309

226-е заседание Московского семинара по биоинформатике.

Тема заседания — Mark Borodovsky, Georgia Tech (Atlanta, Georgia)
«A new ab initio gene finder for fungi genomes: iterative unsupervised parameter estimation».

We describe a new ab initio algorithm for identification of protein-coding genes in fungi genomes. A prominent feature of this approach is elimination of a pre-determined training set for hidden Markov model (HMM) parameter estimation; instead, we delineate trusted genes in anonymous input sequence in iterative unsupervised fashion similarly to the algorithm implemented earlier in eukaryotic gene finder GeneMark.hmm-ES. In contrast, the new algorithm uses more complex HMM; particularly, the new intron model which architecture is changing upon iterations makes provisions for introns with and without branch point sites. We use both the Viterbi training and the MCMC sequence alignments to estimate parameters of the new intron model. We utilize EST validated test sets built for 16 fungi genomes to show that the new algorithm achieves a high accuracy in single exon and whole gene prediction and is favorably compared to the gene finders employing traditional supervised training. The new method provides means of accurate gene calling for sequencing projects accumulated a large amount of sequence ready for interpretation, while a large enough set of experimentally validated genes for supervised estimation of parameters of conventional gene finders is not available yet. Many out of more than 300 current fungi genome sequencing projects could benefit from using this new method for gene annotation.

Рабочий язык семинара — русский.

Адрес:
Москва, ул. Вавилова, 32, Институт молекулярной биологии им. Энгельгардта (ИМБ РАН), комната 309.
Проезд: станция метро «Университет» или «Ленинский проспект», далее трамваями № 14 или № 39 до остановки «Ул. Ляпунова» или «Ул. Бардина».

Схема проезда:

Институт молекулярной биологии РАН (схема проезда)

Сайт Московского семинара по биоинформатике





Список событий