Cassandraの内部的な処理の流れ

実行環境

$ cassandra -v
2.1.0

$ cqlsh --version
cqlsh 4.1.1

処理の流れ

Cassandraにinsert文でデータを入れる時、

insert into カラムファミリ名 (key名, カラム名1, カラム名2, ...) values (キー値, 値1, 値2, ...);

のようなクエリを書きます。この時内部的な処理の流れは、

  • 1. クエリを解釈
  • 2. 実行
  • 3. SSテーブルを作る
  • 4. SSテーブルを読み込み

となります。

  • Cassandraが扱いやすいデータの形は「バイナリデータ」
  • Cassandraが持っているバイナリデータ = SSテーブル
  • とあるデータ量のinsertにかかる時間
    • SSテーブル作成:1〜2時間
    • SSテーブル読み込み:数秒
  • SSテーブル拡張子例:tar.gz
  • クエリのinsertには時間がかかる
    • 予めSSテーブルを作成し、それを読み込ませるようにすればだいぶ高速化出来る
    • SSテーブルを読み込ませるツール:SSテーブルローダー

シェアする

  • このエントリーをはてなブックマークに追加

フォローする