Type something to search...
Redshift入門

Redshift入門

この記事では以下のことが学べます。

  • Redshift概要
  • データウェアハウスとは
  • Redshiftの構成
  • Redshiftのバックアップ方法

Redshiftとは

AWSで提供されているペタバイト級のデータを扱えるデータウェアハウスのことです。 大量のデータを高速に扱うことができるため、分析用途に利用されます。

補足:データウェアハウスとは

複数のシステムからデータを収集・結合・蓄積し、分析に使用するデータベースのことです。このデータを用いて分析を行いシステム効率化や経営改善などの意思決定に利用されます。 データウェアハウス上のデータは基本的に削除・更新は行われず、どんどん蓄積されていきます。なので通常のデータベースよりも多くの容量が求められるわけですね。

Redshiftの構成

Redshiftは大量のリクエストを分散させ並列で処理を行うクラスタ構成になっています。
クラスタは1つLeaderノードと、複数のComputeノードから構成されています。
以下LeaderノードとComputeノードの概要になります。

Leaderノードとは

Redshiftの司令塔的な役割を担っているノードです。アプリケーションなどからのリクエストを後述するComputeノードへ割り振り、Computeノードから返ってきた結果を取りまとめてアプリケーションへ返す役割を果たしています。

Computeノードとは

Leaderノードから割り振られたリクエストを処理するノードです。1つのComputeノードはCPU、メモリ、ストレージを搭載しています。 Redshiftのパフォーマンスを向上させたい際はComputeノードの数を増やします。

Redshiftのバックアップ

Redshiftでは、スナップショットを取ることでバックアップをとります。スナップショットはRedshiftのディスクイメージをAmazon S3へ保存します。 このスナップショットを取るタイミングを自分で設定して自動で取得することも可能です。
なお、自動で取得したスナップショットは一定時間を超えると削除されます。
手動でスナップショットを取ることもでき、こちらは保存期間を無期限に設定することが可能です。

クロスリージョンスナップショット

スナップショットを異なるリージョンへ保存することです。 異なるリージョンへ取ったスナップショットを元にRedshiftクラスタを再構築することができるので、大規模災害や異なるリージョンへRedshiftクラスタを構築したい際に活用します。

最後に

以上、簡単にはなりますがRedshiftの概要になります。
AWS資格の勉強や実務での調査が必要な際などに少しでも役立てば幸いです。

Related Posts