データ視覚化を使用する理由と方法



医学研究者は、テキストだけが薬の指示にある場合、人はそれから情報の70%だけを学ぶことを発見しました。 指示に写真を追加すると、人はすでに95%を獲得しています。

当社は、長年にわたってデータ視覚化ツールの開発とサポートを行っており、幅広いプラットフォームとテクノロジーをカバーしています。 そして、これは理にかなっています。なぜなら、視覚化ツールは開発市場で常に要求され続けているからです。 そして、私たちはこの人気の理由を知っています。

データの視覚化とは何ですか?


まず、データの視覚化とは何か、どのような方法が使用されているか(日常生活を含む)を知る必要があります。

最も単純な、したがって最も一般的な視覚化方法はグラフです。

データの視覚化は、さまざまな情報の配列を視覚的に表現したものです。 視覚化にはいくつかのタイプがあります。

データ視覚化を使用する理由


視覚情報はよりよく知覚され、視聴者に自分の考えやアイデアをすばやく効果的に伝えることができます。 生理学的に、視覚情報の知覚は人間にとって基本です。 以下を確認する多くの研究があります。


読者に大陸の名前を覚えてもらうと、この写真が頭の中に現れます



グラフ上で、読者は最小値と最大値をすばやく見つけることができます



以下の手順は、理解して従うのがはるかに簡単で迅速です。

事実と研究に関する詳細は、 こちらの興味深いインフォグラフィックをご覧ください

明らかに、人は視覚情報を正確に処理する傾向があります。 脳による優れた処理に加えて、データの視覚化にはいくつかの利点があります。


グラフの助けを借りて、読者が赤いインジケータに簡単に注意を引くことができます



重要なデータをチャートで簡単に確認できます。



美的に魅力的なグラフィックスにより、データのプレゼンテーションは壮観で思い出深いものになります

最高の視覚化書籍の著者であるEdward Tuftyは 、データを表示するためのツールとしてそれを説明しています。 視聴者に方法論ではなく本質について考えるよう促す。 データの内容の歪みを回避します。 小さなスペースに多くの数字を表示する; 一貫性のある統合された全体で大きなデータセットを表示します。 視聴者にデータの断片を比較するよう促す; 合理的に明確な目標を達成する:説明、調査、整理、または装飾(「定量的情報の視覚的表示」、エドワードタフテ)。

データ視覚化の使用方法


視覚化の成功は、そのアプリケーションの正確さ、つまりチャートの種類の選択、その正しい使用とデザインに直接依存します。

視覚化の成功の60%は、チャートの種類の選択、30%-適切な使用、10%-その正しいデザインに依存します

適切な種類のチャート


グラフを使用すると、データキャリーが最も完全で正確であるという考えを表現できます。したがって、適切なタイプのダイアグラムを選択することが非常に重要です。 選択は、アルゴリズムに従って行うことができます。


視覚化の目標は、情報の主なアイデアの実装です。これは、選択したデータを表示するために必要なものであり、達成する必要がある効果です。情報の関係を特定し、データの分布を表示し、構成し、データを比較します。

最初の行には、データの関係を示し、データを配布するという目標を持つグラフが表示されます。2番目の行には、データの構成と比較を示すことが目標です

データ内の関係は、それらが互いに依存する方法、つまりそれらの間の関係です。 関係を使用すると、変数間の依存関係の有無を識別できます。 情報の主なアイデアに「参照する」、「いつ減少/増加する」というフレーズが含まれている場合、データの関係を正確に示すよう努める必要があります。
データの分布は、データが何かに対してどのように配置されているか、数値の特定の連続した領域にいくつのオブジェクトが分類されるかです。 この場合の主なアイデアには、「x〜yの範囲」、「濃度」、「頻度」、「分布」というフレーズが含まれます。
データの構成は 、全体の全体像を分析し、全体の割合を構成するコンポーネントを比較するためのデータの組み合わせです。 構成のキーフレーズは、「x%にマウント」、「シェア」、「全体の割合」です。
データの比較 -いくつかの指標を比較するためにデータを結合し、オブジェクトが互いにどのように関連しているかを識別します。 また、時間とともに変化するコンポーネントの比較でもあります。 比較する際のアイデアのキーフレーズは、「大/小」、「等しい」、「変化」、「増加/減少」です。

視覚化の目標を定義したら、データ型を決定する必要があります。 それらはタイプと構造が非常に異なる場合がありますが、最も単純なケースでは、連続的な数値データと時間データ、離散データ、地理データと論理データを区別します。 連続数値データには、たとえばy = 2xなどの関数のグラフなど、ある数値の別の数値への依存に関する情報が含まれています。 連続時間データには、毎日測定される温度のグラフなど、一定期間に発生するイベントに関するデータが含まれます。 離散データには、カテゴリ値の依存関係、たとえば、異なる店舗での商品の販売数のグラフが含まれる場合があります。 地理データには、場所、地質、その他の地理的指標に関連するさまざまな情報が含まれています。鮮明な例は、一般的な地理マップです。 論理データは、たとえばファミリのファミリツリーなど、コンポーネントの相対的な論理配置を示します。

連続的な数値および時間データ、離散データ、地理的および論理的データのグラフ

目的とデータに応じて、それらに最適なスケジュールを選択できます。 多様性のために多様性を避け、「単純であるほど良い」という原則に基づいて選択することが最善です。 特定のデータには特定のタイプのダイアグラムのみを使用しますが、他の場合には、最も一般的なグラフが適しています。

折れ線グラフ、領域を含むグラフ、およびヒストグラムには、1つのカテゴリの1つの引数に複数の値を含めることができます。

積み上げ値と完全積み上げのグラフ

適切なスケジュールを選択する場合、 この図とGene Zhelyaznyの本「Speak the diagram language」に基づいて編集された次の表を参考にしてください。



チャートの適切な使用


チャートのタイプを正しく選択するだけでなく、それを正しく使用することも重要です。


このようなグラフは、スパゲッティと比較して、いくつかの図にうまく分割できます



誤ったスケールは、データの認識に悪影響を及ぼします。 前者の場合、スケールが誤って選択され、後者の場合、スケールが反転します


正しいグラフィックス


適切に設計されたグラフのように目に喜ばれるものはなく、グラフィカルな「ゴミ」の存在ほどダイアグラムを損なうものはありません。 基本的な設計原則:


チャート上の補助線は、データの主要な概念から注意をそらすものであってはなりません。


結論


視覚化は、データを認識および分析するためのアシスタントである、考えやアイデアをエンドユーザーに伝えるための強力なツールです。 しかし、他のすべてのツールと同様に、適時に適切な場所に適用する必要があります。 そうしないと、情報がゆっくりと認識されるか、誤って認識される場合があります。

グラフには同じデータが表示され、主な視覚化エラーが左側に表示され、右側に修正されています。

巧みに使用することで、データの視覚化により、素材を印象的で楽しく思い出深いものにすることができます。

この記事のPSチャートは、 DevExtremeを使用して作成されました

Source: https://habr.com/ru/post/J240325/


All Articles