こんにちは、Habr。
データマイニングのトピックがコミュニティ
にとって興味深いことを非常に嬉しく思います。
このトピック(および、必要に応じて一連のトピック)では、ビジネスだけでなくロシア語でのデータマイニングの使用例について説明します。 なぜこれについて書いているのですか? 私は、ロシア科学アカデミーのコンピューティングセンター(ロシア科学アカデミーのコンピューティングセンター)と密接に関連する会社で働いています。これにより、優れた研究部門を持ち、数学の国内の成果を応用して新しいプロジェクトを開発することができます。 このトピックでは、科学よりもビジネスの方が多くなりますが、科学に興味がある場合は、
mmro.ruまたは
www.machinelearning.ruにアクセスしてください。
それでは、行きましょう:
今日、ほとんどすべての大企業で、長年にわたって収集および保存されている膨大なデータのクラウドがあります。 データマイニングの主なタスクは、特定のビジネス上の問題を解決する生データ内の重要な依存関係を見つけることです。
例1 小売(小売チェーン)。
Kopeyka、Perkrestok、Pyaterochka、Auchanなどの大規模な取引ネットワークには、ロシア連邦全体に数百の店舗、数万のアクティブな商品があります。 各時点(日または時間)での特定の各店舗の各製品(SKU)の販売データは、会社の会計システムに保存されます。
流通ネットワークは、毎日店舗に商品を注文する必要があります。 つまり たとえば、[5000 X 10 000]がマトリックス内の毎日の値である必要があります-この製品をいくら運ぶか?
流通ネットワークの注文が実際の需要よりも少ない場合、不足により損失を受け取り(マークアップ値を失います)、ネットワークが実際の需要よりも多くの商品を注文する場合、倉庫に商品を保管するコスト、凍結した資金のために損失します、有効期限後の商品の損傷。 これら2種類の損失は、それぞれ在庫切れおよび在庫超過と呼ばれます。
どうする? 各店舗および各製品の在庫移動の蓄積された履歴に基づいて、前例から学び、考慮に入れる予測モデルを構築できます。
1.週ごとの季節性(たとえば、ウォッカは木曜日に販売され、エネルギーは金曜日にさらに販売されます)
2.年間の季節性(たとえば、夏にビールを買う)
3.祝日(たとえば、ソビエトシャンパンは、3月8日、12月31日、2月23日の平均よりも100倍多く販売されています)
4.プロモーション(たとえば、9月のペシコラの販売の急増は、毎年の季節性ではなく、ブリトニーとのプロモーションの効果です:))
データマイニングタスクでは、モデルを操作および構築する前にデータを正しくクリアすることが重要です。 したがって、販売の場合、実際の販売からではなく、「回復した需要」から学ぶことが重要です。 これは何ですか
お菓子を1か月間均一に販売したが、先週配信されず、売上が0だったとします。これは、需要がなかったことを意味しません(そして、来月の最後の週にも需要がなくなるでしょう)。 したがって、このような状況では、販売が不足している場所で需要を回復することが重要です。
また、新製品(歴史のない製品)がある場合はどうなりますか? この場合、製品グループの履歴を確認することが重要です。 たとえば、「アイスティーリプトンピーチ」ティーの外観は「コールドティー」製品グループで予測できますが、「歴史上の新製品の出現がグループ全体の売上にどのように影響したか」という要素を考慮することを忘れないでください。
同じことが新しい店舗でも起こります。新しく開いた店舗で注文する製品の数は? 「類似した」店舗を見つけて、最初にその履歴に基づいて予測し、その後徐々に新しい店舗の履歴に切り替える必要があります。
これらはすべて、データミニニングでデータを操作するタスクです。
小売業の毎日の予測システムはギガバイト(およびテラバイト)のデータを処理して、予測を行い、質問に答えます:金融コストを削減し、可能な限り(予測)の需要を考慮するために、特定の各製品が各特定の店舗で注文される量。
あなたが1-2店舗と数千のポジションを持っている場合-人はあなたがどのマシンよりも優れていると予測しますが、WallMartと棚に数十万の製品がある場合-アナリストや製品の専門家の軍隊はこの問題の解決策に対処できません。それが小売チェーンで非常に近い理由ですビジネスプロセスの自動化に注意してください。
事実:予測モデルを改善すると、流通ネットワークのコストを売上高の1〜2%削減できます。 最大のロシアのネットワークの売り上げが10億ドルからであるという事実を考えて、今、それがどんな種類のお金であるかについて考えてください。
小売チェーンに関するこの例1では、これで終わりだと思います。 興味があれば-質問やコメントを書いて-答えます。 全般的に気に入った場合は、次回、テレコムについて、また、数千万から数億人の加入者を想定して、「顧客ロイヤルティの向上」の問題をどのように解決するかについてお話しします。