CTOcast2Ignatius KolesnichenkoiBinom-ヒトゲノムの分析

IT䌁業のテクノロゞヌ、プロセス、むンフラストラクチャ、および人々に関するポッドキャストの2番目の問題を玹介したす。 今日、CTOcastはiBinomのテクニカルディレクタヌであるIgnatius Kolesnichenkoを蚪問しおいたす。

ポッドキャストを聎く



察談者ずiBinomに぀いおのいく぀かの蚀葉

むグナティりス・コレスニチェンコは、モスクワ州立倧孊力孊数孊郚ずデヌタ分析孊郚を卒業したした。 Yandexで働く2009幎から。 圌はYandex.Tracksで働き始め、ここ数幎、分散コンピュヌティングに携わっおきたした。 2013幎、圌はiBinomの共同蚭立者になりたした。 蚈算の耇雑さに関するワヌクショップを実斜したす。

iBinomは 2013幎に蚭立されたしたクリ゚むタヌはAndrey Afanasyev、Valery Ilyinsky、Ignatius Kolesnichenkoです。 同瀟は、ヒトゲノムデヌタを分析するためのSaaS゜リュヌションを開発しおいたす。 このような分析の結果は、バむオむンフォマティクスの特別な知識がなくおも医垫が䜿甚できるため、iBinomサヌビスはナニヌクです。 珟時点では、プロゞェクトのベヌタ版が準備されおおり、テストは医垫や蚺療所で積極的に実斜されおいたす。

ポッドキャストのテキスト版前線


オリンピアヌドのプログラミング、教育、個人的な経隓に぀いお

アレクサンダヌ・アスタペンコむグナティりス、私はiBinomではなく、あなたのキャリアからあなたず䞀緒にすべおを始めるこずを提案したす。 プログラミングに興味を持ち始めた経緯、Yandexでの仕事に぀いお、そしお最終的にどのようにしおiBinomに来たのかを少し教えおください。

Ignatius Kolesnichenko ...モスクワ工孊物理孊研究所のLyceum No. 1511で、プログラミングが䜕であるかを初めお知りたした。 それ以前はプログラミングもありたしたが、これは深刻なこずではありたせん。 䞀床広告を読んで、「面癜いこずに、プログラミングはオリンピアヌドになれる それが䜕であるかを芋に行く必芁がありたす。」 圌は来お、芋お、そしおあなたはすべおの束を知る必芁があるこずが刀明したした。 あなたはプログラムできるようにする必芁がありたす、私はその前に、それが刀明したした、どのように知りたせんでした...

アレクサンダヌ・アスタペンコ私の知る限り、オリンピアヌドずの興味深い話はありたしたか。 それずも、埌で倧孊で始たりたしたか

Ignatius Kolesnichenko私は孊校でオリンピックに参加し始めたした。 ...そしお、入孊埌、本質的に、物理孊ず数孊のどちらかを遞びたした。 ある時点で、私は数孊を決めたした。プログラミングが本圓に奜きだったからです。 私はmehmatに来るず思いたした、そしお、そこで、おそらく、円は私に察凊するでしょう。 プログラミング界の数孊にはそのようなものは䜕もないこずが刀明したした。 私は長い間人々を探しおいたした。䜕ずかしおこれに参加し始めるチヌムです。 しかし、適切な忍耐力を瀺しれば、チヌムは配眮され、すべおが実行できたす。

mechmathには、オリンピックプログラミングで豊富な経隓を持ち、孊校でさたざたなオリンピックで優勝した倚くの人々がいるこずは玠晎らしいこずです。 あなたは圌らに䌚い、圌らはあなたに䜕かを教えたす。 あなたはこのコミュニティに参加し始めたす。 特定のサヌクルはありたせんが、コミュニティが存圚するずいう事実だけで、競争盞手ず蚓緎盞手がいたすが、それは倧いに圹立ちたす。 たあ、数幎間、準々決勝で良い堎所を取り始め、準決勝に行くたで蚓緎したした。 もちろん、最もクヌルな人たちは、ACMプログラミングの䞖界遞手暩の決勝戊に参加しおいたした。 決勝戊には行きたせんでしたが、それでも倧きな経隓になりたした。

アレクサンダヌ・アスタペンコオリンピックでどのような課題に盎面したかに぀いお、最新のものではない人のために䞀蚀で蚀えたすか そのようなむベントに参加するこずは実際的な経隓を提䟛し、実際の生掻ず開発に圹立ちたすか

Ignatius Kolesnichenko 2番目の質問にすぐにお答えしたす。 はい 次にタスクに぀いお説明したす。 olympiadプログラミングのタスクは2぀の郚分で構成されおいたす。 倚くの堎合、そのうちの1぀は単玔ですが、もう1぀の困難はアルゎリズムを考案するこずです... olympiadプログラミングのすべおのタスクは自動的にテストされたす。 衚瀺されないタスクが衚瀺され、非衚瀺になっおいる特定のテストセットがありたす。 たた、テストでプログラムが動䜜する時間制限、぀たり䜿甚するメモリ量がありたす。 これらの制限に適合するようなアルゎリズムを考え出し、蚘述する必芁がありたす。 実際、タスクは2぀のタむプに分けられたすアルゎリズムを思い付くのが難しいものず、アルゎリズムを思い付くのがそれほど難しくないず思われるものがありたすが、倚くの異なる詳现があり、これらすべおを泚意深く䜜成しお実装する必芁がありたす ぀たり、olympiadプログラマヌの胜力は2぀の郚分で構成されおいたす。「発明する」こずず、圌が思い぀いたものを正確に実装するこずです。

これには䜕か利点がありたすか はい、もちろんありたす。 優れたプログラマヌはアルゎリズムを必芁ずするため、時間、メモリヌ、速床を評䟡でき、プログラムを効率的に蚘述できる必芁がありたす。 そしお、それを迅速に行うこずをお勧めしたす。 優れたコヌドを曞いおも、それぞれに2日間を費やしおも、これは良くないので、あたり曞くこずはありたせん。 ある時点で、これらのベクトルは自然に発散し、オリンピアヌドのプログラミングはより遠く、䞀定のトレヌニングに重点を眮き、アルゎリズムの蚘述に磚きをかけたす...

Pavel Pavlovアルゎリズム、アルゎリズム的思考、そのような問題を解決する胜力を理解するこずに加えお、良いプログラマヌず悪いプログラマヌを区別するものは䜕ですか

Ignatius Kolesnichenkoもちろん、オリンピックのベヌスは優れたプログラマヌになるのに十分ではありたせん。人生ではたったく異なる皮類のタスクや問題に盎面しおいるからです。

たず、実際のプログラムははるかに倧きくなりたす。 オリンピックでは、すべおのプログラムは100〜400〜500行です。 人生では、非垞に耇雑で膚倧な数䞇行からなるシステムを䜜成する必芁がありたす。 そこにあるすべおの詳现は非垞に単玔かもしれたせんが、この盞互䜜甚をすべお考えるこずは非垞に困難です。 もう1぀の重芁なポむント-APIを介しお考える胜力。 これは䞀郚です。

2番目の郚分プログラムは倧きいので、将来それらず連携できるようにする必芁がありたす。 珟圚コヌドを曞いおいるわけではなく、すべおを曞いおいたす-動䜜し、閉じお、忘れおしたいたした。 誰かが将来それを読むず考えるために、コヌドをテストでカバヌする必芁がありたす。 オリンピアヌドのプログラマヌは、だれかがコヌドを読むずはたったく考えおいたせん。したがっお、1文字の倉数があり、倚くの堎合、関数は割り圓おられたせん。぀たり、コヌドのキャンバスです。 䞻なこずは、動䜜するようにすばやく曞くこずです。 これは、プロトタむプをすぐに䜜成し、アむデアが機胜するかどうかを確認する必芁がある堎合に適しおいたす。 しかし、これは本番に移行するコヌドには完党に䞍適切であり、保守や開発などが必芁です。

たあ、これらのスキルは非垞に構造化されおおらず、取るに足らないものであり、私の意芋では、経隓を積むだけで習埗できたす。 本を読んで、コヌドをテストでカバヌする方法、システムアヌキテクチャを考案する、そのAPIを正しく考案する方法を孊ぶこずは䞍可胜です。 あなたは䞀床だけ、二床、䞉床、そしお䞉床目には、今私がかなりうたくやっおいるずいうこずをすでに理解しおいたす。

Pavel Pavlovあなたは教育システムの話題に觊れたした...あなたのスキルず知識の開発に関しお共通の興味を持぀人を芋぀けるのは困難でしたか 倧孊、孊校の教育レベルはどの皋床適切だず思いたすか それずも、この皮の知識を埗るために、基本的に䜕らかの狭い環境で調理する必芁がありたすか

Ignatius Kolesnichenkoロシアの教育には本圓に問題がありたす。 私たちにはトップレベルの技術倧孊がありたす-モスクワ州立倧孊、モスクワ工孊物理研究所、モスクワ物理技術研究所、バりマンカ、プログラミングコヌス、特に産業甚プログラミングに関連するすべおのものは、珟圚䞀般的に珟堎で提瀺されおいるレベルずそれらに提瀺されおいるレベルにわずかに察応しおいたせん同じペヌロッパたたはアメリカの倧孊。

䞀方、才胜のある人はたくさんいたす。 ロシアでは、最も匷力なオリンピアヌドコミュニティの1぀であり、これらすべおのトップ倧孊には、オリンピアヌドプログラミングに携わる人々がいたす。 あなたはこのパヌティヌに参加するこずができ、実際、そこであなたの知識のギャップを埋めたす。 圌らはたた、しばしばいく぀かの講矩をしたり、単にお互いに知識を共有したりしたす。 しかし、もちろん、これはあたり正しいアプロヌチではありたせん。なぜなら、オリンピアヌドのプログラマヌはこのように成長し、それでも業界で仕䞊げなければならないからです。

...しかし、状況は倉化しおいるようです。 この意味で、デヌタ分析の孊校のような玠晎らしい堎所がありたす。 さらに、私が知る限り、Yandexは新しい孊郚を開蚭しおいたす。 より正確には、HSEはYandexの支揎を受けお新しい孊郚を開蚭しおいたす。 ずおもクヌルなはずだず感じたすが、芋おみたしょう。

アレクサンダヌ・アスタペンコあなたは人を雇いたすが、圌らもプログラミング競技に参加しおいるこずがわかりたすが、これはあなたにずっお重芁な芁玠ですか

Ignatius Kolesnichenkoもちろん、人がオリンピアヌドのプログラミングを経隓した堎合はプラスになりたすが、圌は決定的ではありたせん。

アレクサンダヌアスタペンコ倧孊、オリンピックプログラミング...次に䜕が起きたしたか

Ignatius Kolesnichenko ...デヌタ分析孊郚での研究䞭に、Yandexずのむンタビュヌに招埅されたした。 その埌、それはショックでした3幎目ですが、あなたはすでに仕事をし、お金を皌ぎ、さらにいく぀かの興味深い問題を解決するこずができたす。 私はむンタヌンを務め、1幎以䞊圌になったようです。 ...その埌、私はすでにより耇雑なこずに埓事し、Yandex.Trafficで働いおいたした。そこでは、珟圚のむンフラストラクチャをチヌムずしお曞き盎したした。 私が芋た、そしおなんずかしお参加した最初の倧きなシステム。 それは玠晎らしかった。

iBinomに぀いお

アレクサンダヌアスタペンコ iBinomに぀いお教えおください...プロゞェクトがどのように衚瀺され、どのように開始されたかずいうアむデアに぀いお。

Ignatius Kolesnichenkoすべおが非垞にシンプルになりたした。 私は、1人の生物孊者ず䞀緒にGenotek瀟の蚭立に着手したmehmatの良き友人がいたした。 圌らは23andMeのようなサヌビスに぀いおでした。ナヌザヌがあなたのずころに来たら、あなたは圌から唟液を取り、それを分析し、圌に遺䌝性疟患の玠因のいく぀かを䌝えたす。 このサヌビスは、倧郚分が楜しいものです。぀たり、人々はただ楜しみのためだけにやっお来たす。 圌らはいくらかのお金を持っおおり、自分自身のためにそのような興味深い新しい情報を芋぀けるためにそれを䜿うこずをいずわない。 ある晩、私は友人ず話したした。圌は私に蚀った「芋お、私たちには生物孊者がいお、圌には1぀の仕事がありたす...あなたはそれに興味がありたすか」仕事はただゲノムの倉異を怜玢するこずでした゚ク゜ン分析。

...比范的蚀えば、12月にこれに぀いお議論し、2月にすべおがうたくいくようだずいうニュヌスを受け取りたした。 以前8時間でロヌカルに行ったこずを、30分で実行できたす。 そしお、どういうわけかプロトタむプが刀明したした。 そしお、圌らは蚀った「聞いお、実際に私たちはプロトタむプではありたせん、もちろん、私たちは興味がありたす。 収益化の方法を考えおいたす。 やっおみたしょう。」 私は考え、考え、参加する必芁があるず決めたした。

Yandexで働いお働いおいるずいう意味で利害の察立がありたしたが、䞀方ではそれが奜きで、もう䞀方では完党に別のこずに関しお非垞に興味深い仕事でもありたす。 そしお、そのような機䌚を逃すのはちょっず銬鹿げおいるので、私は個人的な時間を食べお、2぀のこずを䞀床に始めるこずにしたした。 実際、1幎ほど前から、倚かれ少なかれ意味のあるスタヌトアップを䜜っおいたす。

アレクサンダヌアスタペンコゞェノテクはただ存圚したすか

Ignatius Kolesnichenkoはい、䌚瀟は存圚したす。

アレクサンダヌ・アスタペンコそしお、そこには利益盞反はありたせんか

Ignatius Kolesnichenko圌女は少し違うこずをしたす。 いく぀かのアルゎリズムもありたすが、これはその䞻な専門分野ではありたせん。 ナヌザヌは圌らにやっお来お、圌から唟液分析を行い、それをデバむスに持っお行き、そこで分析する必芁がありたす。そしおもちろん、特定のコンピュヌタヌ分析を行い、矎しいサむトで結果を出したす。 ...」

アレクサンダヌ・アスタペンコあなたが蚀った23andMeのようなものですか

Ignatius Kolesnichenkoはい、これは23andMeのロシア語の類䌌物です。

アレクサンダヌアスタペンコ iBinomの仕組みに぀いお話したしょう。

Ignatius Kolesnichenkoヒトゲノムずは䜕ですか 人間のゲノムは、23個の断片からなる、非垞に長い長い配列です。 23個は染色䜓です。 各染色䜓はペアになっおいたす。 このシヌケンス30億文字皋床の党長には、興味のあるセクションがありたす。 ぀たり、原則ずしお、すべおが私たちにずっお興味深いかもしれたせんが、特別なセクションがありたす-いわゆるコヌディング領域、蚀い換えれば、遺䌝子。 それほど倚くはなく、30億ではありたせんが、5,000䞇です。 そしお、そこで䜕が起こるかを知る必芁がありたす。これらの遺䌝子が機胜するかどうか、突然倉異ずは䜕か、そしおそれらは䜕に圱響するのか。

最初の難しいタスクは、それをすべお読む方法です。 50〜40幎前の昔、圌らは1぀の䜜品を読むための簡単な手動方法を思い぀きたした。 私たちのDNAはすべお、ACTGずいう4文字の長い行ず考えるこずができたす。 アルゎリズムず分析の芳点から、DNAを文字ずしお芋るこずができ、これらが䜕らかの栞酞などであるずは思わないこずができたす。 そしお実際、それを読む必芁がありたす。 箄50幎前、私たちはそれをするこずを孊びたした。 確かに、1000文字を読むには、人は1日を過ごす必芁がありたす。 そしお、1000文字ではなく、5000䞇文字が必芁です これを行う方法は完党に䞍明です。 Human Genomeず呌ばれる倧きなプロゞェクトがあり、10億ドル以䞊が投資されたした。 そしお実際、このプロゞェクトの目暙は、ヒトゲノム党䜓を読み、組み立お、理解するこずでした。

しかし、もう1぀の問題がありたす。ここでは、それぞれ50文字、100文字を読むこずができ、さたざたな堎所からそのようなピヌスを読み取るこずができたすが、これらの堎所が実際にどこにあるのか、そしおそこからヒトゲノムをどのように組み立おるのかは非垞によくわかっおいたせん。 この分野の科孊は今どこにありたすか 科孊はこれらの断片を非垞に倧量か぀非垞に迅速に読むこずを孊びたしたが、繰り返したすが、それらがどこにあるのかはわかりたせん。 私たちは人間のゲノム党䜓、すべおの染色䜓を取り、それらを長さ100〜1000の小さな断片に分割し、それぞれを最初から最埌たで読みたす。 その埌、非垞に倚くの異なる読み取り倀があり、それらから党ゲノムを収集する必芁がありたす。 組み立おを可胜にするために、この手順は䜕床も繰り返されたす。少なくずも30回、倚くの堎合はそれ以䞊です。 各文字に察しお、ゲノムの各プロットは䜕床もカバヌされおいたす。 これを䞀床だけ行うず、これらのピヌスがどのように結合するかに぀いおの知識がなく、それらを接着するこずはできたせん。 したがっお、そのような郚分がたくさんあるはずです、圌らは倧きなコヌティングである。 そしお、いく぀かの魔法、耇雑なアルゎリズムを適甚する必芁がありたす。これらの断片のどれがゲノム党䜓を収集したす。 これは今日でも難しい課題です。぀たり、新しい生物のゲノムを組み立おるこずは非垞に困難です。 これは、ゲノムアセンブリず呌ばれるものです。

特定の人のゲノムを分析するのは少し簡単です。 たったく同じ分析が行われ、ゲノムから小さな断片が読み取られたすが、すでに興味深いコヌディング領域からは読み取られおいたす。 原則ずしお、ゲノム党䜓を読み取るこずはできたせんが、これも実行できたす。 さらに、すべおの人が互いに非垞に䌌おいるような玠晎らしいプロパティを䜿甚したす。 差異は1以䞋です。 したがっお、参照ヒトゲノムを取り、読み取り倀を取埗した堎合、読み取り倀から新しいゲノムを収集するこずはできたせんが、これらの読み取り倀を参照ゲノムずすぐに比范できたす。 実際、そこで出䌚う堎所を芋぀けお、圌らがどのように違うのかを芋おください。 だから倚かれ少なかれ、このゲノムの人間の突然倉異ず様々な倉化の分析が行われおいたす。

アレクサンダヌ・アスタペンコずころで、非垞に興味深いフレヌズは「理想的なヒトゲノム」です。 それは前䞖玀の半ばにずおも反響したす。

Ignatius Kolesnichenko理想的ではありたせんが、参照がありたす...

アレクサンダヌ・アスタペンコ珟圚の政治状況に䟝存しおいたすか

Ignatius Kolesnichenkoいいえ、それは珟圚の政治状況に䟝存したせん。 これは、玔粋に生物孊的な、むしろ生物情報孊䞊の科孊甚語です。

アレクサンダヌ・アスタペンコそれに肌の色にも䟝存したせんか

Ignatius Kolesnichenko実際にはさたざたな方法で。 さたざたなビルドがありたす。 盞察的に蚀えば、ペヌロッパの人々ずロシアの人々人口は異なりたす。 そしお、䞀般に、ロシアにいる平均的な人ずペヌロッパにいる平均的な人を収集するこずができ、それらはわずかに異なりたす。 ペヌロッパに䜏んでいる人を分析する堎合、アフリカの暙準ではなくペヌロッパの暙準ず比范する方が合理的です。

アレクサンダヌアスタペンコたたはロシアで。

Ignatius Kolesnichenkoたたはロシア。 そういう意味では、ロシアはただペヌロッパのようです。 ぀たり、私が知る限り、アフリカに少し近づいおいたす。 しかし、ただ小さな違いがあり、比范するこずができたす。 どこでも䜿甚されおいるその暙準ゲノムは、100人たたは1000人のたったく異なる人々のタむプに埓っお組み立おられたす。 圌らは100たたは1000人の異なる人々を連れお行き、圌らはすべお分析され、そのような共通のゲノムを収集したすべおのデヌタから䞀緒にされたした。 特定の人を1人連れお行った堎合、圌は倚くの異なる遺䌝性疟患にかかっおいる可胜性がありたすが、それらは単に劣性の圢態であるか、他の䜕らかの理由で珟れず、実際の基準では成功したせん。 このような暙準を収集するには、できるだけ倚くの人を連れお行く方が簡単です。 各ポむントで過半数を取埗する堎合、これが倧郚分である可胜性が最も高くなりたす。この時点で、人口で人気のある察立遺䌝子、人口で人気のある文字です。 そしお、ほずんどの堎合、それは正しく、正しく、たれなこずは間違っおおり、䜕かを匕き起こす可胜性がありたす。

これは最初の郚分にすぎないため、分析党䜓の構成を説明したす。 これは最初の困難な技術郚分であり、デバむスシヌケンサヌが発行したグレヌデヌタで、小さなシヌケンスを䜜成したす-読み取り倀。 あなたは単にこのシヌケンサヌにあなたの唟液たたは血液を寄付したす-任意のサンプル、あらゆる皮類の詊薬がそこにさらに詰められたす。 わかりたせんが、12時間動䜜し、読み取り倀をハヌドドラむブに曞き蟌みたす。 たくさんのコヌティングが斜されおいたす。 ゚キ゜ン分析人間の遺䌝子の分析の兞型的なデヌタ量は2〜30 GBです。

アレクサンダヌアスタペンコあなたの動画のいく぀かで200 GBの数字に出䌚いたした。

Ignatius Kolesnichenko通垞、200 GBは完党なゲノムです。 しかし実際には、実際の応甚における完党なゲノムは、誰にずっおもほずんど関心がありたせん。 むしろ、玔粋に科孊的な意味で興味深いものです。

アレクサンダヌアスタペンコ぀たり、実生掻では2〜30 GBです。

Ignatius Kolesnichenko倚かれ少なかれ、はい。 私たちがサヌビスを䜜ったずき、私たちは完党なゲノムでも䜜業できるようにしたかったのです。

さお、ゲノムの倉化を芋぀けたした。たずえば、参照ゲノムには文字Aがありたすが、䜕らかの理由でこの堎所に文字Gがありたす。 完党に理解できない情報。圌女ずどうするその埌、難しい郚分が再び始たりたす。科孊的な芳点から、それはたさにその起源にすぎたせん-突然倉異、それがどの病気に぀ながる可胜性があるか、責任のあるタンパク質が機胜するかどうかを理解したす。

はい、実際にタンパク質に぀いお少し話したしょう。これらの遺䌝子がありたすが、遺䌝子ずは䜕ですか DNAに関しおは、これはサブシヌケンスです。圌女は䜕をしおいるの圌女はタンパク質を゚ンコヌドしたす。タンパク質はアミノ酞で構成されおいたす-これらは別個の分子であり、各アミノ酞は、この䞀連の配列からのこのような条件付きの3文字によっお連続しお゚ンコヌドされたす。぀たり、長さ30のシヌケンスがあり、それを連続するトリプルに分割し、各トリプルが1぀のアミノ酞を担圓したす。そしお、これらの10個のアミノ酞はすでに䜕らかのタンパク質を圢成しおいたす。通垞、それらは10ではなく、遺䌝子は、私は知らないが、600ヌクレオチドず200アミノ酞です。タンパク質は私たちの䜓で倧きな圹割を果たしたす。圌らは、现胞の仕事のために、すべおの芏制を担圓しおいたす。぀たり、倚くのタンパク質が现胞内に浮遊し、觊媒ずしお様々な反応に関䞎し、倚くのこずを行いたす。タンパク質が壊れた堎合、どのように壊れたしたか倉異が発生したため、タンパク質のアミノ酞は別のものず同じではありたせん。タンパク質は折りたたたれたす。぀たり、圌にずっおどのように折りたたたれるか、どのような䞉次元構造を持぀かが重芁です。どういうわけか間違っお䞞たっおしたい、すべおが機胜しなくなりたす。

そしお、突然倉異がある堎合、すべおが壊れお䜕も機胜したせんが、身䜓はトリッキヌなものであり、100䞇局の保護があるので、特定の突然倉異は䜕にも぀ながりたせん。䞀般的に、理解するために各人が突然倉異を持っおいる、私は正確に芚えおいない、玄1。それにもかかわらず、すべおの人々は䜕ずか生きおおり、心配しないでください。これは、保護の局が非垞に倚いためです。最初の局1぀の染色䜓で䜕かが倉曎された堎合、2番目のペアの染色䜓は匕き続きこのタンパク質を゚ンコヌドでき、すべおが機胜したす。保護の第2局たずえば、䞡方の察立遺䌝子においお、タンパク質が壊れ、機胜しなくなり、このタンパク質には、ほが同じ機胜を実行する5人の兄匟がいたす。少し遅くなり、遅くなりたす。しかし、䞀般的に、すべおが機胜し続けたす。さらに高いレベルがありたす。チェヌン党䜓が壊れおも、おそらく䜓はそれなしで生きるこずができるでしょう、それはそれほど良くありたせんが、それはただ存圚したす。

アレクサンダヌ・アスタペンコ今クラスタヌに぀いお話しおいるのですか、それずも人に぀いおですか

Ignatius Kolesnichenkoいいえ、私たちは今、人に぀いお話しおいる。

アレクサンダヌアスタペンコ OK

Ignatius Kolesnichenkoこの知識の領域-突然倉異が私たちに起こったかどうか、そしおそれが䜕らかの遺䌝性疟患に぀ながるかどうかをどうやっお理解するか-は非垞に難しいです。人類、科孊の知識は非垞に限られおいたす。倚分数千の遺䌝性疟患、䜕らかの関係を知っおいたすが、この知識は非垞に狭いです。明らかに、そのような知識の䞀般的な領域は、珟圚研究されおいるものの100倍です。

さお、私たちは䜕をしおいたすか私たちは人類が知っおいるこずを取り入れ、それを分析に単玔に適甚したす。この知識がさたざたな圢匏で提瀺され、さたざたな方法で、さたざたな研究宀で受け取られる倚くのデヌタベヌスがありたす。私たちはそれらを最善の方法で集玄し、実際に、珟圚芋぀かっおいる倉異がどの遺䌝性疟患に぀ながるかに぀いおの情報を提䟛しようずしたす。

最埌に医垫のために䜕をしたすかクリニックの医垫はシヌケンサヌを䜿甚しお分析を泚文し、受信したデヌタはクラりドに泚がれたす。そしお、圌はこう蚀いたす。「ああ、この人に぀いおのデヌタがありたす。分析したしょう」私たちはそれらを分析し、次の情報を医垫に提䟛したす。これらの突然倉異のそれぞれが応答できるこず。これが私たちが今しおいるこずです。しかし、もう少し先に進むこずを考えおいたす。実際、倚くの医垫がこの方法で研究しおいたす。医垫は珟圚、特定の患者を抱えおおり、たずえば肝臓の特定の病気を研究しおいるため、これらの200の突然倉異すべおを監芖するこずに興味はありたせん。そしお圌は、この病気には遺䌝性の原因があるず瀺唆しおいたす。そしお、遺䌝的理由は、䟋えば、10の異なる堎合があり、圌はどれを知らないのです。したがっお、私たちは珟圚、医垫が「この病気のグルヌプを芋たい」ず蚀うこずができるシステムを完成させおいたす。たたは、「私の患者はこれらの症状があり、あなたは圌がどんな倉異を持っおいるか知っおいたす。これらの症状ず突然倉異から、この人がどんな病気になるのかを理解したしょう。たあ、病気をさたざたな突然倉異ず関連付ける基盀もありたす。ナヌザヌ、医垫に芋せお、なぜ私たちがそのような結論を䞋したのか、圌がどれほど真実であるのかを理解するために、この情報を䞀緒に収集する必芁がありたす。ここ。少し面倒ですが、どういうわけかわかりたした。たあ、病気をさたざたな突然倉異ず関連付ける基盀もありたす。ナヌザヌ、医垫に芋せお、なぜ私たちがそのような結論を䞋したのか、圌がどれほど真実であるのかを理解するために、この情報を䞀緒に収集する必芁がありたす。ここ。少し面倒ですが、どういうわけかわかりたした。たあ、病気をさたざたな突然倉異ず関連付ける基盀もありたす。ナヌザヌ、医垫に芋せお、なぜ私たちがそのような結論を䞋したのか、圌がどの皋床真実であるのかを理解するために、この情報を䞀緒に収集する必芁がありたす。ここ。少し面倒ですが、どういうわけかわかりたした。

アレクサンダヌ・アスタペンコ実際、ほずんどすべおが明らかです。そしお最埌に、技術コンポヌネントに切り替えたした。たずえば、数癟の突然倉異がありたすが、そのすべおが医垫にずっお興味深いわけではありたせん。ここで゚ラヌの䜕パヌセントが忍び蟌むこずができたすか蚌刞取匕所での蚌刞の売買を分析する機胜を探しおいるずき、それは䞀぀のこずです-たくさんのお金がありたすが、人の生掻はありたせん。ここで私たちは深刻な病気の蚺断に぀いお話しおいるが、これらの゚ラヌはいずれも同じ取匕所取匕よりもはるかに重芁です。このような゚ラヌの可胜性に぀いお教えおください。゚ラヌの数を枛らすための解決策はありたすか。

むグナティりス・コレスニチェンコはい、倚くの間違いがありたす。シヌケンサヌ自䜓も誀っおおり、これは䜕らかの圢で修正する必芁がありたす。アルゎリズムの芳点からも間違っおいたす。だから、たずえば、恐ろしく芋えるある皮の重倧な突然倉異を200個芋぀けたずしたしょう。しかし、実際の生掻では、人は健康であり、肝臓の問題しかありたせん。

アレクサンダヌ・アスタペンコそしお、あなたはノヌず蚀いたす。遺䜓安眮所ぞ-そしお遺䜓安眮所ぞえ

Ignatius Kolesnichenkoこれらの200の突然倉異...倚くの堎合、なぜ特定の疟患に実際に結び぀かないのかがわかりたせん。したがっお、医垫にずっお、これはむしろ助蚀的な情報です。圌は私たちのサヌビスを利甚しお、そのような突然倉異があり、それが特定の病気に぀ながるこずを発芋したした。医垫は考えたす。「さお、ここに病気がありたす。おそらくあなたが必芁ずするものです。原則ずしお、患者が治療する薬を凊方するこずができたす。」しかし、医者は愚か者ではなく、私たちを信じおいたせん。比范的蚀えば、圌は突然倉異から私たちが圌に蚀ったこずぞのこの連鎖関係を芋぀け、そうであるかどうかを確認するこずができたす。

䜿甚したベヌスず医垫がこのチェヌンを芋るために芋぀けたものを完党に䌝えようずしたす。このチェヌン党䜓を芋た堎合、圌は手動で再確認するこずができたす。特定の疟患に぀いおは、たずえば、私たちがもたらした3぀の倉異に興味がありたす。 3぀の突然倉異をチェックするのは簡単です。もちろん、これは簡単ではありたせんが、かなり可胜です。医垫は再確認するこずができたす、そしお、圌はすでに確信しおいたすはい、確かに、これらの3぀の突然倉異はこの病気に関連しおいたす。さお、そしお圌は責任を取り、患者を治療し始めたす。

同じアメリカでは、NGSNew Generation SequencingテクノロゞヌにはFDAの承認がありたせん。぀たり、これは医垫にずっおの単なる远加情報です。医垫は患者をより良く治療するためにそれを䜿甚したす。 sayingにあるように、「なぜそうではないのですか」すべおの医垫がこれを䜿甚しおいるわけではなく、私が理解しおいる限り、倚くの医垫はこれを信頌しおいたせん。将来、技術の粟床が向䞊し、ある時点で医垫がすべおを再確認する必芁がなくなるこずは明らかです。方法が正確になり、知識の量が十分であるずいうだけです。

これを前䞖玀の70幎代以降のプログラミングず比范したす。そうすれば、たずえば、優れたプログラマヌになるこずは䞍可胜であるず同時に、䞀郚のハヌドりェアの動䜜、メむンフレヌムの動䜜、アセンブラヌ蚀語を知らない、などず安党に蚀うこずができたす。確かに、圓時はそうでした。基本的なこずを知らない堎合は、䜕もする必芁がありたせん。十分なメモリがなく、十分なプロセッサがないため、これらすべおを最適化し、理解し、よく知る必芁がありたす。しかし、30〜40幎が経過し、今ではプログラマの90がAssemblerが䜕であるかを知らず、内郚ですべおがどのように機胜するのかほずんどわかりたせん。圌らは高い芖点からプログラミングを芋お、解決する必芁があるレベルで問題を解決し、さたざたな詳现や分野には取り組みたせん。

私は、バむオむンフォマティクスずバむオテクノロゞヌ、遺䌝病の分野でもこれが起こるず信じおいたす。今、私たちは非垞に、非垞に始たりであり、私たちの知識は非垞に乏しいです。遺䌝孊者は、良い方法で、チェヌン党䜓を知り、それがどのように機胜するかを理解しなければなりたせん。さもなければ、圌は間違いを犯す可胜性がありたす。

Pavel Pavlovシヌケンサヌの゚ラヌを芋぀けお远跡する方法を教えおください。

むグナティりス・コレスニチェンコたず、さたざたな自動方法がありたす。しかし、䞀般的には、実際の分析を詊みたす。すでに䜕らかの病気の人がいるクリニックや研究宀に来お、圌らは圌を分析し、特定の倉異を芋぀け、これらの倉異をチェックしたした。すでに怜蚌枈みの情報を取埗し、これらの怜蚌枈みの知識ずアルゎリズムがどのように䞀臎するかを調べたす。そうでない堎合、なぜですか修正方法

今、人々は、原則ずしお、私たちず同じこずをするこずができたす。問題は䜕ですか問題は、この研究宀ではバむオむンフォマティクスを手元に眮いおおく必芁があるこずです。バむオむンフォマティクス自䜓がタむプラむタヌのどこかでこれらすべおのアルゎリズムを起動し、すべおが完了するたで12時間埅機したす。次に、さたざたなデヌタベヌスやサむトで必芁な情報を怜玢したす。私たちの目暙は、第䞀に、人々が既に行う方法を知っおいるこずを迅速に行うこず、第二に、すべおの情報を集玄し、矎しい方法で衚瀺し、異なる統蚈を匕き出し、䞀般的にすべおを合理的な補品にたずめるこずです。

アレクサンダヌアスタペンコさお、手順に぀いお盎接話したら、これはどのように起こるのでしょうかたずえば、私は医者であり、ある皮のシヌケンスされたデヌタを持っおいたす。このデヌタはどのような圢匏30 GBなどですかそしお、突然倉異の分析ず怜玢を開始できるように、実際の生掻ではどのようにデヌタが転送されたすか

Ignatius Kolesnichenko実際には、ナヌザヌは既にディスク䞊にそれらを持っおいるか、どこかからこれらの30 GBをダりンロヌドしたす。そしお、それは私たちのりェブサむトにアップロヌドするだけで、最終的にS3になりたす。そしお、ナヌザヌがそれらをアップロヌドするずすぐに、分析を開始できたす。

アレクサンダヌアスタペンコそしお、これらの30 GBをWebむンタヌフェヌス経由でアップロヌドしたすか

むグナティりス・コレスニチェンコはい、むンタヌフェむスからアップロヌドしたす。しかし、実際には、これは難しい技術的タスクの1぀でした。接続が切断された堎合に継続できるような機䌚を実珟するこずです。

ポッドキャストのテキスト版は今埌数日間継続したす。

Source: https://habr.com/ru/post/J227161/


All Articles