最近、ハッカソンに参加したhh.ru履歴書のデータセットの分析
に関する記事に出会いまし
た 。 このため、履歴書データを自分で操作することを考えました。 さらに、もう少しあります。 履歴書に示すことができる最も興味深い専門分野を選択しました-「情報技術、インターネット、通信」。
カットの下には、さまざまなIT専門分野の人々が受け取る金額、大学で最もお金を欲している卒業生、雇用主であるITスペシャリストが最も遅れている卒業生、ユーザーがYandexやMailメールユーザーよりも多くのGoogleメールを獲得しているかを調べる多くのグラフがあります。他の多くの情報。

以下で説明するものはすべて、それがどうあるべきかという私のビジョンです。 チャートは完全に客観的であると主張せず、実際の状況を反映しています。 どこでも間違いを犯す可能性があります。
私はロシアの履歴書を専門分野「情報技術、インターネット、テレコム」から取得しました。これは過去1年にわたって更新されました。 さらに、すべてのグラフについて、以下の指標は国全体の絶対的なカットではなく、hh.ruに存在する部分についてのみであることに留意する必要があります。 偏っている場合があります。
合計で566 178人のIT専門家の履歴書が分析に参加しています。 すべてのグラフはクリック可能です。
専門分野の人数
専門分野「情報技術、インターネット、通信」では、最大3つの専門分野を選択できます。 グラフは、何人がどの専門分野を選択するかを示しています。

希望の給与を隠す人の数
履歴書を作成するとき、パッチを省略できます。 ご覧のとおり、IT担当者の約40%がこれを使用しています。

専門分野別の男女の分布

ITにおける男性の優位性は、誰にも驚くことではありません。 システム管理者、ネットワーク担当者、主要な技術者など、女性が少ないのはなぜですか?
専門分野別希望給与の分配
それでは、ロシア全土のさまざまな専門分野の男性と女性がどれだけのお金を望んでいるか見てみましょう。
次のチャートは箱ひげ図、または私たちの意見では口ひげのある箱です。 このようになります。 ボックス内の線は中央値です。 つまり、半分の人はこの金額より多くを受け取り、残りの半分は少ないです。 ほとんどすべてのチャートで中央値に署名しようとしました。 ボックスは四分位範囲(IQR)であり、すべての履歴書の50%が含まれます:1番目の四分位(25%)から3番目の四分位(75%)まで。 言い換えれば、履歴書の25%がボックスの左の境界よりも少ないお金を望み、25%がボックスの右の境界よりも多くのお金を望んでいます。 口ひげは、他のほぼすべてのデータも制限します。すべての履歴書の0.35%は、左の境界線よりも少ない金額を望み、0.35%は右の口ひげの境界線よりも多くを望みます。 示された間隔を入力しなかった人はすべて異常値であり、別々の点でマークされています。

モスクワとサンクトペテルブルクでは、私たちの国の他の地域よりも多くのIT専門家がいて、そこでの支払いレベルが全国平均よりも高いことは周知の事実です。 したがって、私はこれらの都市に対して、専門分野ごとの給与の分配を含む別々のスケジュールを作成しました。
モスクワの専門分野別給与分配

サンクトペテルブルクでの専門分野別の給与分布

3つのグラフすべてで、男性と女性の間の金銭的補償に対する同じ期待がテスター間で見られます。 ちなみに、女の子は他の多くの人よりもこのIT分野に参入したいと思っています。
モスクワとサンクトペテルブルクでは、技術上司の女性の中央値が高いことは注目に値します。 しかし、この専門分野の男性と女性の数別に分布図を見ると、2番目のものがはるかに少ないことがわかります。
他の専門分野と比較したロシアのIT専門家の給与

ITの給与は、原材料の抽出、コンサルティング、経営陣に次いで2番目であることがわかります。 28の職業地域のうち24で、女性はより少ないお金(中央値)を望んでいます。 残り-同様に。
地域ごとのITスペシャリストの分布
グラフは、国ごとのITスペシャリストの実際の分布ではなく、hh.ruにある履歴書のみを反映していることを再度明確にします。 地域でのサイトの使用レベルは異なります。

1人の欠員に該当する履歴書の数
このスケジュールでは、その年に更新されたすべてのアクティブな空席と履歴書を受け取り、各地域で履歴書の数を空席の数で割った。 また、IT担当者の数が1000人未満の地域も除外しました。

モスクワ地方が先導していることがわかります。 モスクワ自体は含まれません。 ほとんどの場合、これは多くのIT担当者、特に訪問者が周辺に定住しており、仕事のほとんどが都市自体にあるためです。
履歴書の総数に対するIT履歴書の割合
次のグラフでは、この地域の履歴書の総数に占めるIT専門家の割合を計算しました。

サンクトペテルブルクとレニングラード地域とモスクワとモスクワ地域の興味深い違い。 最も可能性が高いのは、モスクワ地域に、Mytishchi、Khimki、Lyubertsyなど、地域に属しているが都市に近いIT専門家向けの大きな巣穴が存在するためです。
地域ごとのITでの希望給与の分布

ITで最も人気のある主要なスキル
履歴書では、重要なスキルを示すことができます。 次のグラフは、すべてのIT担当者のトップスキルを示しています。

専門分野「プログラミング、開発」の主要スキル
開発者専用の基本的なキースキルを見るのは興味深いです。

キャリアスタートスペシャライゼーションの主要なスキル

主なスキルの期待

IT専門分野別の年齢分布

若者はしばしばウェブやおもちゃに行きます。 これはITへの優れたエントリーポイントだと思います。
給与の実務経験への依存

この命令は、20年以上働いている人によってのみ違反されています。 これはおそらく、このカテゴリには別の分野からIT部門に来た人が多いためです。 人々はしばしば履歴書にこの専門分野に関連する経験だけでなく示すことを好むので。
可視性ステータスによる履歴書の配布

希望する移動時間

ほとんどは、仕事にかかる時間は問題ではないことを示しています。 サンクトペテルブルクとモスクワでは、人々はこの「重要ではない」ことにある程度気づいているため、この項目を選択する頻度は少なくなります。
最寄りの地下鉄駅
概要では、最寄りの地下鉄駅を示すことができます。 ほとんどの人がいるモスクワを見てみましょう。

Python gmapにテキストラベルを配置する簡単な方法を見つけられなかったため、マーカーでマークされたステーションは個別に示されます。

これらの駅のほとんどは、混雑した場所から市内に入る主要なポイントです。
IT担当者が使用するモバイルオペレーター
RossvyazのWebサイト
でDEFコードの
データベースをダウンロードし、それを少しとかして履歴書の電話番号にマッピングしました。

どのようなメールを使用していますか
このグラフでは、1つの会社のさまざまなドメインを1つのグループにまとめました。 ちなみに、チャートに表示されていない奇妙な事実は、Yandex。Mailに関するもので、電子メールアドレスの大部分がya.ruではなくyandex.ruドメインであることを示しています。

私はいつも、最もクールな男はGmailを使用し、平均的な男はYandexを使用し、残りはMail.ruを使用すると考えていました。 次に、これら3つのグループの給与の予想を見てみましょう。

だから、もっとお金が欲しいなら、あなたは何をすべきか知っている。
大学ごとの希望給の分布
さて、今、どの大学の卒業生が最もお金が欲しいか見てみましょう。 調査したサンプルから1000人未満のすべての機関を排除しました。

どの企業で最も長く働いていますか?
職歴では、この会社での勤務期間を指定できます。 500人以上のITスペシャリストが通過したすべてのものを取りました。

IT組織はあまり見られないことがわかります。 これは、実務経験では関連する経験だけが示されているわけではないためです。
会社での経験がある場合の希望給与の分配
見てみましょう、企業が最もお金を望んでいる経験を持つ人々。 モスクワとピーターを別々に連れて行きます。
モスクワ:

サンクトペテルブルク:

グラフを描く過程で、私はより多くの新しいアイデアを得ることができましたが、何に焦点を合わせることにしました。 この投稿がうまくいけば、続けます。
グラフの描画では、
Python 、
Jupyterノートブック 、
Pandas 、
Seaborn 、
Apache Hiveなどに助けられました。
質問してください。
どうもありがとう。
UPD :1つの組織の異なるスペルを組み合わせて、最後の3つのグラフを少しきれいにしました