過去1年間でTOP 30(0.3%のみ)を選択するために、Mybridgeチームはほぼ8,800のオープンソース機械学習プロジェクトを比較しました。これは非常に競争の激しいリストであり、2017年1月から12月の間に公開された機械学習、データセット、およびアプリケーションに最適なオープンソースライブラリが含まれています。 プロジェクトの品質を把握するために、Githubスターの平均数は3558であることに注意してください。
オープンソースプロジェクトは、科学者だけでなく役に立つこともあります。 既存のプロジェクトの上に素晴らしいものを追加できます。 昨年見逃したかもしれないプロジェクトをチェックしてください。
注意、カットの下にたくさんの写真とgifがあります。 fastTextは、単語表現を教え、文章を分類するためのライブラリです。これにより、機械学習法を使用して、任意のテキストにカテゴリを自動的に割り当てることができます。
[Githubの星11786]。 Facebook Researchのご厚意によります。
[
ミューズ :高速テキストに基づいた多言語の教師なしまたは教師付きの単語埋め込み。 Githubの星695個]
科学研究用のコードとデータ
Deep Photo Style Transfer [Githubの星9747] 。 時刻、天気、季節、芸術的変化の特徴の伝達を含む、さまざまなシナリオでの歪みの抑制とフォトリアリズムの保存に成功した、ある画像から別の画像への写真スタイルの転送のアプローチについて説明します。 メリットフジュンルアン博士 コーネル大学で。
Python用の世界で最も簡単な顔認識API。 このモデルは、
Labeled Faces in the Wildベンチマークで99.38%の精度を持っています。 また、コマンドラインを使用してフォルダー内の画像から顔を認識することができるシンプルなツールも提供します。 開発者
-Adam Geitgey [Githubの星8672] 。
機械学習
[Githubの星8113]でアートと音楽を生成します。
Sonnetは、複雑なニューラルネットワークを構築するためのTensorFlowベースの機械学習ライブラリです。
[Githubの星5731] 。 ディープマインドのマルコム・レイノルズの厚意による
deeplearn.jsは、Google BrainのNikhil ThoratによるWebGLで高速化されたJavaScriptオープンソースの機械学習ライブラリです。
TensorFlow
[Githubの4843つ星]による高速スタイル転送。 MITのLogan Engstrom。
有名アーティストのスタイルを一瞬で写真に追加しましょう! ビデオを作成することもできます。
AirSimは、Unreal Engineで作成された無人航空機、自動車、その他の車両用のシミュレータです。 物理的および視覚的に現実的なシミュレーションのためのオープンソースプラットフォームです。 目標は、ディープラーニング、コンピュータービジョン、自律型車両システムの誘導学習のアルゴリズムを使用したAIの研究と実験のためのプラットフォームを開発することです。
[Githubの星3861] 。 開発者-MicrosoftのShital Shah
機械学習の力は、大量のデータのパターンを研究する能力に関連しています。 強力な機械学習システムを作成するには、データを理解することが重要です。 ファセットプロジェクトは、データセットの理解と分析に役立つ信頼性の高い2種類の視覚化を提供します。ファセット概要とファセットダイブです。
可視化は、JupyterノートブックレポートまたはWebページ(Typescriptコードでサポートされている
Polymer Webコンポーネント)に簡単に統合できます。
[Githubの星3337] 。 Google Brain提供
FACETS概要レポートのサンプル画像のAI-coloring
[Githubの3310個の星]は、特定の色スタイルに従って色付けしたり、描画用に独自のスタイルを作成したり、サンプルイラストのスタイルを伝えたりできます。
Google Brainチームグループの科学作品「すべてを学習するための1つのモデル」の著者は、「さまざまな分野の問題を解決する深層学習の統一モデルを作成できますか?」
Googleがこれを行い、Tensor2Tensorを
公開しました 。コードは
GitHubで公開され
ています 。
[Githubで3087つ星 。
科学記事では、MultiModelのアーキテクチャについて説明しています。これは、異なるドメインからタスクを同時に学習できる深層学習の単一の汎用モデルです。
MultiModelアーキテクチャ特に、研究者はMultiModelをトレーニングして、8つのデータセットを同時にテストしました。
- WSJ音声認識エンクロージャー
- ImageNet画像データベース
- COCOのコンテキストでの通常のオブジェクトのベース
- WSJ解析ベース
- 英語からドイツ語への翻訳隊
- 逆前:ドイツ語から英語への翻訳コーパス
- 英語からフランス語への翻訳コーパス
- 逆前:フランス語から英語への翻訳コーパス
詳細は
こちら 。
[Githubの星2847] 。 提供:Jun-Yan Zhu博士、バークレー校
Faissは、類似性とクラスタリングベクトル
[Githubの2629つ星]を効率的に検索するためのライブラリです。 データサイエンスの分野のプログラマや専門家は、よく似たユーザープロファイルを見つけるか、似たような音楽を選択するという課題に直面することがよくあります。 ソリューションは、オブジェクトをベクトル形式に変換し、最も近いものを見つけることに還元できます。
Habréの詳細を
ご覧ください。最初と最後の画像が与えられると、アルゴリズムはYFCC100M(9500万枚の画像)からそれらの間の「最もスムーズなパス」を計算します。 ここで撮影。Fashion-MNIST
[Githubの2780スター]は 、MNISTが単純すぎるため、MNISTデータベース(「Mixed National Institute of Standards and Technology」の略)の代わりとして提案されています。 Fashion-MNISTのトレーニングとテスト用の画像サイズと構造は同じです。
MNISTは、手書きの数字サンプルの膨大なデータベースです。 このデータベースは、主にニューラルネットワークに基づく機械学習を使用して画像認識方法を調整および比較するために、米国国立標準技術研究所によって提案された標準です。 データは、事前に準備された画像の例で構成され、それに基づいてシステムのトレーニングとテストが実行されます。 データベースは、サイズが20x20ピクセルのNISTの元の白黒サンプルのセットを処理した後に作成されました。 NISTデータベースの作成者は、米国国勢調査局のサンプルセットを使用し、そこにアメリカの大学の学生が書いたテストサンプルを追加しました。 NISTセットのサンプルは正規化され、アンチエイリアス処理され、28x28ピクセルのグレーのハーフトーン画像に縮小されました。
MNISTデータベースには、トレーニング用の60,000個の画像とテスト用の10,000個の画像が含まれています。 トレーニングおよびテストサンプルの半分はNISTトレーニングキットから、残りの半分はNISTテストキットから採取しました。
科学文献で議論されているように、MNISTデータベースのトレーニング後、最小限のエラーを達成するために多くの試みが行われました。 記録的な結果は、畳み込みニューラルネットワークの使用を専門とする出版物に示されており、エラーレベルは0.23%になりました。 データベースの作成者自身がいくつかのテスト方法を提供しています。 元の作業では、サポートベクターメソッドを使用すると、エラーレベル0.8%を達成できることが示されています。
ファッションミストParlAIは、さまざまなダイアログ
[Githubの星2578]からのデータセットでAIモデルをトレーニングおよび評価するための基盤です。 Facebook ResearchのAlexander Millerのご厚意による
Facebook AI Research(FAIR)チームは、機械翻訳のための畳み込みニューラルネットワークの実装に関する印象的な結果を
公開しています。 彼女は、新しいツールであるfairseqは、従来のリカレントニューラルネットワークよりも9倍高速に動作しますが、精度はわずかに劣っていると主張します。
インタラクティブな画像生成
[Githubの星2369] 。
トレーニングなしのニューラルネットワークを使用した画像回復
[Githubの2188個の星 ]。 Skoltechの博士課程Dmitry Ulyanov提供
fer2013 / IMDBデータセット
[Githubの1967つ星]を使用した、リアルタイムの顔検出と感情+性別の分類。
性別分類精度(IMDB):96%。
感情の分類の精度(fer2013):66%。
DeepMindのWaveNetとtensorflowを使用した英語のエンドツーエンドの音声認識
[1961 Githubの星] 。
Unity Machine Learning Agentsを使用すると、研究者と開発者は、使いやすいPython APIを使用したUnityエディターを使用して、機械学習用のゲームとシミュレーション環境を作成できます。
視覚データの検索と分析のためのプラットフォーム。
Pix2pixHDは、フォトリアリスティックな合成または高解像度画像(2048x1024など)の変換用に設計されています。 セマンティックラベルカードをフォトリアリスティックな画像に変換したり、顔タグマップを使用してポートレートを合成するために使用できます。
誰でも機械学習用のモデルを作成できる、強力で直感的なWYSIWYGインターフェイス。
プロジェクトの目標は、音声のスタイルを送信するか、誰かの声を特定の人の声に変換することです。 このプロジェクトの仕事は、有名な英国の女優ケイト・ウィンスレットを声に変えることを目的としました。
免責事項上記の資料は研究目的のみです。 結果を使用して違法な目標を達成するには、刑事責任、行政責任、および(または)民事責任が伴う場合があります。 著者は、そのような事件について責任を負いません。