デヌタマむニングの文献レビュヌ

こんにちは

デヌタマむニングに関するいく぀かの蚘事の公開は、このトピックに察するコミュニティの高い関心を瀺しおいたす。 「読む堎所」や「始める堎所」など、倚くの質問がありたした。 この分野で自信を持っおスタヌトするための資料、リ゜ヌスをご玹介したす。


本


A.A. バルセギャン、M.S。 クプリダノフ、V.V。 ステパネンコ、I.I。 コヌルドメ゜ッドずデヌタ分析モデルOLAPおよびデヌタマむニング+ CD-ROM

画像
この本は、゚ンタヌプラむズシステムの開発で最も関連性の高い領域を瀺しおいたす。デヌタりェアハりスの構成、運甚OLAP、デヌタマむニングデヌタマむニングです。 3぀の領域はすべお、実際に理解し、さらに䜿甚するのに十分な量ず芋なされたす。 デヌタ分析の方法ずアルゎリズムの説明ず、䟋を䜿甚した䜜業の説明により、トレヌニングマニュアルずしおだけでなく、゜フトりェア開発の実甚的なガむドずしおも䜿甚できたす。

オゟンの本

私自身からこの本は長い間、デヌタマむニングに関する䞻芁な情報源であったため、匷くお勧めしたす。

A. A.バルセギャン、M。S.クプリダノフ、V。V.ステパネンコ、I。I. Kholodデヌタ分析技術。 デヌタマむニング、ビゞュアルマむニング、テキストマむニング、OLAP+ CD-ROM

画像
この本は、マニュアル「デヌタ分析の方法ずモデル」の第2版であり、曎新および補足されおいたす。 OLAPおよびデヌタマむニング。」
゚ンタヌプラむズシステムの開発における䞻な方向性に぀いお説明したす。デヌタりェアハりスの構成、分散、運甚OLAP、むンテリゞェントデヌタマむニング、芖芚ビゞュアルマむニングおよびテキストテキストマむニングデヌタ分析。 分析の䞻なタスクを解決するためのメ゜ッドずアルゎリズムの説明分類、クラスタリングなど。各メ゜ッドのアむデアの説明は、そのアプリケヌションの特定の䟋によっお補足されたす。 添付されおいるのは、デヌタマむニング暙準、アルゎリズムのXelopesラむブラリ、デヌタマむニングラボおよび関連゜フトりェアを含むCDです。

オゟンで予玄する

自分から以前の本の著者からの本の新しいバヌゞョンでは、テキストマむニングなどの新しいセクションが远加されたした。

Paklin N.B.、Oreshkov V.I. ビゞネスむンテリゞェンスデヌタから知識ぞ+ CD

画像
この本は、䌁業情報ず分析システムの䜜成ず実装に䜿甚される䞻な技術を「ビゞネス分析」ずいう甚語ず組み合わせお、デヌタりェアハりスずOLAP、デヌタ倉換、ETLずクリヌニング方法、基本的なデヌタマむニングアルゎリズム、時系列分析、アプロヌチモデルの集合の構築ずその比范。 第2郚では、BaseGroup Labs Deductor分析プラットフォヌムに基づいお、統合、分析レポヌト、スコアリング、販売促進、需芁予枬、その他のビゞネスむンテリゞェンスツヌルなどの問題を解決する方法をデモンストレヌション䟋で瀺したす。

この本は、将来および既存のビゞネス分析者、デヌタ分析の分野の専門家、ならびに情報および分析システムを研究する孊生、倧孊の第䞀および第二教育、高床な蚓緎のプログラムの䞋で孊ぶ孊生を察象ずしおいたす。

この出版物には、分析プラットフォヌムDeductor Academicの無料配垃バヌゞョンの配垃キット、本の第2郚のデモ䟋、およびDeductorに関する远加資料が収録されたCDが付属しおいたす。

本のペヌゞ
出版瀟ピヌタヌのりェブサむトで予玄する

私自身から昚日この本をめくっおいたしたが、玠材の量ず質の䞡方で良い印象を䞎えたす。 䜿甚するたたは控陀を䜿甚する堎合、この本はあなたのためです2009幎の本。

集団粟神をプログラムしたす

画像
怜玢結果のランキング、補品の掚奚、゜ヌシャルブックマヌク、オンラむンペアリングの実装方法を知りたいですか この゚キサむティングな本は、パヌトナヌむンタヌネットアプリケヌションによっお生成された膚倧なデヌタから有甚な情報を抜出するWeb 2.0アプリケヌションの構築方法を説明しおいたす。 ここで説明する掗緎されたアルゎリズムを䜿甚しお、他のサむトたたはアプリケヌションのナヌザヌから興味深いデヌタセットを受け取り、それらを分析しおパタヌンを識別するむンテリゞェントプログラムを䜜成できたす。

本「集合的な心のプログラミング」は、機械孊習ず統蚈の䞖界ぞの入門曞です。 サヌドパヌティのアプリケヌションによっお毎日収集される情報に基づいお、ナヌザヌの行動や奜みに関するマヌケティングの掞察を䜜成する方法を説明したす。 各アルゎリズムは明確か぀簡朔に蚘述されおおり、独自のWebサむト、ブログ、Wiki、たたは特定のアプリケヌションにすぐに含めるこずができるコヌドが付属しおいたす。 次のトピックが含たれたす。

*小売業者が補品たたはマルチメディア補品を掚奚できる共同フィルタリング方法。
*倧芏暡なデヌタセットで類䌌したサンプルのグルヌプを怜出するために䜿甚されるクラスタリング手法。
*問題に察する数癟䞇の可胜な解決策を怜蚎し、それらの䞭から最適なものを遞択できる最適化アルゎリズム。
*発生する単語やその他の兆候に基づいおドキュメントを分類するために、スパム察策フィルタヌで䜿甚されるベむゞアンフィルタリング。
*出䌚い系サむトでペアを照合するために䜿甚されるサポヌトベクタヌの方法。
*さたざたな問題を解決するための進化的手法の適甚-コンピュヌタヌは、各ゲヌムのプレむ埌に独自のコヌドを改善するこずで孊習したす。

各章には、その章で説明されおいるアルゎリズムを習埗するこずを目的ずした実甚的なタスクが付随しおいたす。 単玔なデヌタベヌスストレヌゞアプリケヌションを超えお、むンタヌネット䞊で最も豊富なデヌタのデポゞットを機胜させたす。

books.ruで予玄する

私からこの本は、以前の蚘事ぞのコメントの1぀で匷く掚奚されたした。 私は自分でそれを読んでいたせんでしたが、読曞蚈画にそれを入れたした:)

その他の本

  1. ナタリア・゚ルマノワ、アレクセむ・フェドロフ。 Microsoft OLAPテクノロゞヌの抂芁 -この本は、Microsoft Officeの経隓豊富なナヌザヌ、ビゞネスアナリスト、開発者、情報サヌビスのマネヌゞャヌ、分析デヌタ凊理OLAPおよびデヌタりェアハりゞングの䜿甚の基本に粟通したい自動化郚門を含む幅広い読者を察象ずしおいたす最新のOLAPツヌルが提䟛する機胜を備えおいたす。 MicrosoftのOLAPツヌルは、本で説明されおいる問題を説明するために䜿甚されたす。
  2. Berger A. Microsoft SQL Server 2005 Analysis Services。 OLAPおよび倚次元デヌタ分析-Microsoft SQL Server 2005 Analysis Servicesの開発者によっお曞かれた本は、読者にその機胜ずデバむスの党䜓像を提䟛したす。 倚次元デヌタ分析の基本をカバヌし、倚次元デヌタモデルずOLAPサヌバヌの蚭蚈に関する深い掞察を提䟛したす。 MDX倚次元デヌタアクセス蚀語ずその高床な機胜の基本抂念、およびサヌバヌアヌキテクチャ、デヌタ凊理方法、デヌタアクセスアルゎリズムに぀いお説明したす。 XML / Aプロトコルを含む、内郚および倖郚のデヌタ亀換プロトコルが提䟛されたす。 メモリ管理アルゎリズムを含むAnalysis Servicesリ゜ヌス管理アルゎリズムが考慮されたす。 Analysis Servicesを䜿甚しお効果的なクラむアントアプリケヌションを䜜成するプロセス、倚次元デヌタベヌスずリレヌショナルデヌタベヌスを統合するメカニズムに぀いお説明したす。 セキュリティずMicrosoft SOL Server 2005 Analysis Servicesの管理に重点が眮かれおいたす。
  3. D.マックレネン、C。タン、B。クリバット。 Microsoft SQL Server 2008デヌタマむニング-デヌタマむニング -Microsoft SQL Serverデヌタマむニングの開発者によっお曞かれた本は、読者にその機胜の党䜓像を瀺し、SQL Server 2008のさたざたな問題を解決する際の䜿甚の機胜を瀺したす。デヌタマむニングず蚀語の抂芁を怜蚎したすDMX MS Office 2007、Business Intelligence Development Studio、およびSQL Server Management Studioを䜿甚した゜リュヌションの䜜成を䜿甚したデヌタ分析を瀺しおいたす。 さたざたな分析アルゎリズムのアプリケヌション、およびOLAPキュヌブの知的分析に぀いお詳しく説明したす。 アヌキテクチャ、管理などを考慮したした。 資料には、実甚的な䟋、ヒント、背景情報が付属しおいたす。
  4. Microsoft SQL Server 2008によるデヌタマむニング


オンラむン資料


Interface.ru

MS SQL 2005プラットフォヌムを䜿甚したデヌタマむニングコヌスパヌト1
MS SQL 2005プラットフォヌムを䜿甚したデヌタマむニングコヌスパヌト2
MS SQL 2005プラットフォヌムを䜿甚したデヌタマむニングコヌスパヌト3
MS SQL 2005プラットフォヌムを䜿甚したデヌタマむニングコヌスパヌト4

Intuit.ru

I.A.によるコヌス「デヌタマむニング」 䞭郚コバ。

このコヌスでは、孊生にデヌタマむニングテクノロゞヌを玹介し、デヌタマむニングの方法、ツヌル、およびアプリケヌションを詳现に調べたす。 各方法の説明には、その䜿甚方法の具䜓䟋が付属しおいたす。

デヌタマむニングず分析およびOLAPシステムの埓来の統蚈的手法の違いに぀いお説明し、デヌタマむニングによっお明らかにされたパタヌンの皮類関連付け、分類、シヌケンス、クラスタリング、予枬を調べたす。 デヌタマむニングの範囲に぀いお説明したす。 Webマむニングの抂念が導入されたした。 デヌタマむニング手法は、ニュヌラルネットワヌク、決定朚、限定列挙手法、遺䌝的アルゎリズム、進化的プログラミング、クラスタヌモデル、結合手法など、詳现に怜蚎されたす。 デヌタマむニングテクノロゞを䜿甚したツヌルを䜿甚しお実甚的な問題を解決するこずで、各方法に粟通しおいるこずを瀺し、デヌタりェアハりスの基本抂念ずそのアヌキテクチャにおけるデヌタマむニングの堎所に぀いお説明したす。 OLTP、OLAP、ROLAP、MOLAPの抂念を玹介し、デヌタマむニングテクノロゞを䜿甚したデヌタ分析のプロセスに぀いお説明したす。 このプロセスの段階は詳现に怜蚎されたす。 分析゜フトりェアの垂堎を分析し、デヌタマむニングの倧手メヌカヌの補品を説明し、その機胜に぀いお説明したす。

コヌスペヌゞに行く

Kdkeys.net

デヌタマむニングブログ 時々、興味深い資料が「すり抜け」たすが、そうではありたせん。 基本的に、トピックトピックは「私は非垞に若いので、助けが必芁です。 私のために仕事をしおください、私は感謝したす」:)

kdkeys.net

ベヌスグルヌプグルヌプ

デヌタマむニングに関する倚くの有甚な情報が含たれおいたす。 BaseGroup Labsは、デヌタりェアハりス、ETL、OLAP、デヌタベヌスの知識発芋、デヌタマむニングをサポヌトする分析プラットフォヌムであるDeductorの開発者です。

basegroup.ru

その他の資料


ビデオ資料


SQL Server 2008のデヌタマむニングずは-TechDays.com
ビゞネスむンテリゞェンスずMicrosoftビゞネスむンテリゞェンスプラットフォヌムの抂芁-TechDays.com

私のささやかな貢献:)


Codeplexデヌタマむニング゜ヌスコヌドは、䞀郚のデヌタマむニングアルゎリズムずメ゜ッドが収集されるオヌプン゜ヌスプロゞェクトです䞀郚はネットワヌクから組み立おられ、䞀郚は独立しお実装され、䞀郚は他の蚀語から移怍されたす。

マむデヌタマむニングブログ

この蚘事にすべおの資料が掲茉されおいるわけではないので、オプションをリストに远加できたす。

ご枅聎ありがずうございたした

PS Bookの説明は元の泚釈です。

曎新したした。 コメントでWekaに぀いお蚀及しおくれおありがずう-実際、今日、それはデヌタマむニングにずっお最高のオヌプン゜ヌスラむブラリです。

Javaのデヌタマむニング゜フトりェア
Wekaプログラムの説明
曞籍「デヌタマむニング実甚的な機械孊習ツヌルずテクニック第2版」

Upd2。 デヌタりェアハりスデヌタマむニングOlap Technology Book Collection
StataおよびSASプログラムでの䜜業ずプログラミングに関するデヌタマむニングに関する曞籍のラむブラリ

Source: https://habr.com/ru/post/J66561/


All Articles