通常、データ構造とテーブルをコンパイルするとき、誰も列の順序を気にしません。 実際、ポイントは何ですか? 必要に応じて、SELECTの列の順序を変更できますが、何を心配する必要がありますか? そのため、列の順序がテーブルのサイズに大きく影響する可能性があるため、心配する必要があります。 はい、データが同じであっても、テーブルのサイズは列の順序に依存する場合があります。
この理由は何ですか? CPUデータのアライメントなどがあり、データ構造の低レベルのサイズはそれに依存します。 列の順序を意識的に選択することで、データサイズを最適化できます。 信じられない? 試してみましょう:
test=
この例には6つの列があります。 3つの整数列と3つのvarchar列(次々)。 このテーブルに1,000万行を追加します。
test=
テーブルの合計サイズは574 MBです。
test=
これらの列の場所を変更してみましょう。 次の例では、varchar列の後に整数列が続きます。 これは3回繰り返されます。
test=
次に、1000万行を追加します...
test=
...そしてテーブルは大幅に増加します:
test=
テーブル内のデータは変更されていません-この効果を示すために特別に選択されただけです。 「abcd」ではなく「abc」と書いた場合、サイズの違いは見られませんが、4文字の文字列は小さなバッファーに収まりません。
おわりに
この実験から導き出せる重要な結論は、同じデータ型を隣同士に詰めることは間違いなく意味があるということです。 さらに、テーブルの先頭に整数列をパックすることが理にかなっていることがわかりました。 多くの場合、データ構造がそうでない場合よりもわずかに小さいため、これによりパフォーマンスが数パーセント向上することがあります。
翻訳者から:
投稿者:Hans-JürgenSchönig。 オリジナルはこちらから入手できます 。