目的は会社のミーティングについていくためです。(前のミーティングでクラウドの話でたけど結構話わからなかった。)
[質問事項]
- 「PaaS の場合、アプリケーション負荷によって、自動的にサーバがスケールされる」とあるが、料金体系はどうなっているのか?スケールしたら高価格になるのか?
[メモ]
- Amazon EC2 では仮想マシンの単位でハードウェア資源を追加する
- PaaS では OS ミドルウェア は利用者に対し隠蔽されている
- Force.com では開発ツールが限定されている
- Google App Engine は Python, Java(?) に限定される
- 「規模の経済」= データセンタの規模が大きくなればなるほど、処理コストが安くなる
- 「PUE」= Power Usage Effectivenes = データセンタの電力消費効率の指標。DC 全体の消費電力 ÷ サーバなどの機器消費電力。1.0 に近いほど冷却施設などに電力がかかっていない。日本標準:2.3 - 2.5 Google: 1.21
- 「コンテナ」= サーバを2500台程度収納できる入れ物。水冷式を採用。
- 「GFS」= Google File System = 64KB のブロック(チャンク)に分割して、複数のサーバに分散させている。バックアップのため、1チャンクにつき2つの複製を作っている。MapReduce と呼ばれるソフトウェアを利用し、GFS のデータを高速処理する。
- 「キーバリュー型データストア」= キーとバリューの組み合わせとして保存。RDBMSと比較して、構造が単純なためデータ入出力が高速。(RDBMS ではインデックス付け、排他ロックを行うため)
- 「ACID特性」= Atomicity(原子性), Consisitency(一貫性), Isolation(独立性), Durability(永続性)。RDBMSでは, A (処理が「完了」か「未実行」のどちらかであること), C(データの矛盾がないこと), I(処理間の依存関係がないこと), D(処理結果はシステムに障害が発生しても完全に保存されること)
- 分散データ処理では一貫性の問題がある。あるデータを更新しても、更新されるデータは元データのみであり、即座に複製のデータまでは更新されないため。
- 「CAP定理」= Consistency(データ一貫性を保つ事), Availability(可用性を保つこと), Partition(システムを分散させること)のうち、同時には 2 つしか実現できない。
- 「BASE」= Basically Availability (可用性優先), Soft-state(システム連携をなるべく緩く), Eventual(いつかはすべてのデータ複製の同期がとれる、いずれはデータ一貫性がとれるようにデータ処理を行う)。