バイオインフォマティクスのアルゴリズム、オンラインコース

10年前のヒトゲノムの配列決定は、生物学における計算革命の理由でした。 科学の他のどの基本分野よりも多くの新しいアルゴリズムを作成することが奨励されています。

10月21日、カリフォルニア大学のPhillip CompoPavel Pevznerと私はCoursera でバイオインフォマティクスアルゴリズムに関するオンラインコースを開始します 。 すでに10月21日までコースの最初の章の内容を確認し、狭い(バイオインフォマティクス)サークルで広く知られているRosalindのチームが取り組んでいる新しい教育プロジェクトStepicの問題を解決できます。

ゲノム配列決定は、それらを解決するために必要な計算方法と密接に関連するようになった数百の生物学的タスクの1つにすぎません。 このコースでは、現代の生物学を理解するための基本的なアルゴリズムのアイデアを検証します。 動的計画法やグラフ理論などの計算概念は、幅広い生物学的問題で使用されるアルゴリズムの研究に役立ちます:ゲノムの組み立て、DNAとタンパク質配列の比較、調節モチーフの検索、ゲノム再配列の分析、タンパク質の特定、生命の樹の復元など コースを通じて、参加者は実際のバイオインフォマティクスアルゴリズムを実際の遺伝データに適用します。


コースの各章には、個別の生物学的トピックが含まれています。 たとえば、最初の章は、複製起点(DNAが細胞内で分裂し始めるゲノム内の位置)の検索に焦点を当てており、ゲノム配列の単純なプログラミングと分析の助けを借りて、この純粋に生物学的な問題を一見して解決する方法について説明しています。

毎週のコースプログラム


  1. 複製開始点の検索:DNA複製はどこから始まりますか? (アルゴリズムのウォームアップ)
  2. 質量分析の計算:抗生物質のシーケンス方法 (ブルートフォースアルゴリズム)
  3. 頻繁に繰り返される配列(調節モチーフ)の検索:どのDNAパターンが細胞時計として機能するか? (貪欲でランダム化されたアルゴリズム)
  4. ゲノムアセンブリ:ゲノムの組み立て方法 (グラフアルゴリズム)
  5. ゲノム再編成:ヒトゲノムには脆弱な領域がありますか? (組み合わせアルゴリズム)
  6. ラインアライメント:生物学的シーケンスをどのように比較しますか? (動的計画法アルゴリズム)
  7. 部分文字列クイック検索、文字列インデックス:病気の原因となる変異の特定方法 (組み合わせパターンマッチング)

Pevzner教授による紹介ビデオ




大規模なオープンオンライン調査


コースの重要な要素は、各章ごとに策定されたオープンな科学的課題です。 各タスクの議論は、各特定分野の有力なバイオインフォマティクス科学者によって監督されます。 たとえば、コースの最初の章のオープンタスクは、 Mikhail Gelfand (IPPI RAS、モスクワ州立大学)、 Uri Keich (シドニー大学)、およびGlenn Tesler (UCSD)によって監督されています。

関連リンク


Source: https://habr.com/ru/post/J196870/


All Articles