2010年3月31日水曜日

TrueCloudへ質問してみた纏め2

■True_Cloud
CPUおよびメモリ容量のスペックアップを行いました!
1クラウドノードあたりCPUは 0.4GHzから 0.6GHz へ、メモリ容量は 256MBから375MBへスペックアップです!
ぜひご利用ください!
http://bit.ly/bDHQ32
#True_CLOUD

■豊月
あれCPUのCore数とClock数に関する解答まだですか?
http://goo.gl/f915
したから3つめの質問です

■True_Cloud
ありがとうございます!
TrueCLOUD サーバーに仮想的に割り当てられた仮想CPUと実際のサーバーマシンに搭載されている実CPUのクロック周波数の間には直接の関連はありません。
詳細はFAQをご参照くださいませ! http://bit.ly/dpU41m

■豊月
お宅への3度目の説明になりますが、10.8Ghz相当と言っても5.2Ghz*2コアと2.6Ghz*4コアでは、Programからみると全く別の環境です。Core数が解らない以上マルチスレッドで書いた方が有効なのかシングルで書いた方がいいのか解りません。
故にProgramの作り方が解らない以上、お宅のCloudでどういう風に作ればいいか解らず、利用の検討も出来ません

■True_Cloud
ありがとうございます!
FAQにも記載させていただいておりますが、仮想CPUに割り当てられるCPUクロック周波数分の演算能力はすべて1コア換算の演算能力になります。
ただあくまで仮想的に割り当てられるものですので実CPUの1コア分の周波数とイコールではありません

■豊月
お宅への4度目の説明になりますが、10.8Ghz相当と言っても5.2Ghz*2コアと2.6Ghz*4コアでは、Programからみると全く別の環境です。Core数が解らない以上マルチスレッドで書いた方が有効なのかシングルで書いた方がいいのか解りません

■True_Cloud
申し訳ありません。
こちらからのご返答は先のとおりになります。さらに詳細なご回答をご希望でしたらぜひフォームよりお問い合わせいただければと思いますのでよろしくお願いいたします!
http://bit.ly/cyY24T

■豊月
すいませんがこの疑問は私だけの物ではありません。多くの開発者が同じく疑問を持っています。
少しTwitterで検索していただければ解ると思います。以前私がした質問に多くの方が同意しています。なのに掲示しないのは何故なのでしょうか?

■True_Cloud
了解いたしました!
ではもう少々わかりやすい表現方法が無いか検討させていただきたいと思います! ご意見ありがとうございます!

以上。
・・・わかりやすい表現ってただコア数表示するか、10.8Ghzの算出計算式乗せれば終わるのにね。
相変わらず国内の「自称Cloud」は微妙なのばかりだ・・・

一個前の質問
TrueCloudへ質問してみた纏め

2010年3月19日金曜日

2010年3月19日の気になる記事

グーグル、Native Clientをx86-64とARMにも。同一バイナリが主要なCPUで動作へ
http://www.publickey1.jp/blog/10/native_clientx86-46armcpu.html

Hadoop による Web 広告システムの構築と運用 :ヨーロッパでの事例_1
http://agilecat.wordpress.com/2010/03/19/hadoop-%E3%81%AB%E3%82%88%E3%82%8B-web-%E5%BA%83%E5%91%8A%E3%82%B7%E3%82%B9%E3%83%86%E3%83%A0%E3%81%AE%E6%A7%8B%E7%AF%89%E3%81%A8%E9%81%8B%E7%94%A8-%EF%BC%9A%E3%83%A8%E3%83%BC%E3%83%AD%E3%83%83/


Installing and using Apache Cassandra With Java Part 1 (Installation)
http://www.sodeso.nl/?p=80

Installing and using Apache Cassandra With Java Part 2 (Data model)
http://www.sodeso.nl/?p=108

2010年3月15日月曜日

2010年3月15日の気になる記事

マイクロソフトはIE9のHTML5対応に本気で取り組んでいる模様
http://www.publickey.jp/blog/10/ie9html5.html

Gmailのパワーユーザーへ。もうすぐ速くなります
http://jp.techcrunch.com/archives/20100314gmail-slow/

2010年3月11日木曜日

2010年3月11日の気になる記事

コンピュータサイエンス史上最大の課題「並列処理による性能向上」~情報処理学会創立50周年記念全国大会の招待講演
http://www.publickey.jp/blog/10/50.html

WTF is a SuperColumn? An Intro to the Cassandra Data Model
http://arin.me/blog/wtf-is-a-supercolumn-cassandra-data-model

Hadoop Hacks Night詳細レポート[前編]
http://gihyo.jp/news/report/2010/03/1101

4 Months with Cassandra, a love story
https://www.cloudkick.com/blog/2010/mar/02/4_months_with_cassandra/

Cassandraのインターフェース
http://dann.g.hatena.ne.jp/dann/20100309

【クラウドコンピューティング】 Scale-outアンチテーゼ 思いついた反論、というか疑問
http://blog.virtual-tech.net/2010/03/scale-out.html

2010年3月10日水曜日

2010年3月10日の気になる記事

アイデンティティ フェデレーション ってなに?
http://agilecat.wordpress.com/2010/03/10/%E3%82%A2%E3%82%A4%E3%83%87%E3%83%B3%E3%83%86%E3%82%A3%E3%83%86%E3%82%A3-%E3%83%95%E3%82%A7%E3%83%87%E3%83%AC%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3-%E3%81%A3%E3%81%A6%E3%81%AA%E3%81%AB%EF%BC%9F-cloud/

【Google App Engine】 WSSEチケット認証でGoogleDocsとFederationさせる
http://blog.virtual-tech.net/2010/03/google-app-engine-wssegoogledocsfederat.html

Cassandra Wiki Operations
http://wiki.apache.org/cassandra/Operations

up and running with cassandra
http://blog.evanweaver.com/articles/2009/07/06/up-and-running-with-cassandra/

How To Configure Cassandra On A CentOS Media Temple DV Server
http://www.socialtimes.com/2010/03/how-to-configure-cassandra-centos-media-temple-dv/

2010年3月8日月曜日

2010年3月8日の気になる記事

MySQL+Memcachedの時代は過ぎ、これからはNoSQLなのか、についての議論
http://www.publickey.jp/blog/10/mysqlmemcachednosql.html

2010年3月5日金曜日

2010年3月5日の気になる記事

クラウドという言葉がわけわからないので、分類してみた
http://d.hatena.ne.jp/nowokay/20100305#1267722878

「本当のクラウド」とは何か (1/3)
http://www.itmedia.co.jp/enterprise/articles/1003/04/news010.html

どっちを読んでも微妙。

2010年3月3日水曜日

2010年3月3日の気になる記事

Revisiting EC2 Instance IDs
http://www.jackofallclouds.com/2010/02/revisiting-ec2-instance-ids/

Anatomy of an Amazon EC2 Resource ID
http://www.jackofallclouds.com/2009/09/anatomy-of-an-amazon-ec2-resource-id/

2010年3月1日月曜日

2月の収穫物

■2月の収穫
2月 4日 (木)BLEACH 43巻、サマーウォーズ 2巻、屍鬼 7巻、手紙蜂 9巻
2月 5日 (金)一太郎2010
2月 8日 (月)範馬刃牙 22巻
2月 10日 (水)ラプンツェルの翼 4巻
2月 11日 (木)3x3EYES 13、14巻
2月 17日 (水)月光条例 8巻
2月 19日 ボクを包む月の光 8巻
2月 20日 (土)S.H.フィギュアアーツ 仮面ライダー空我ライジングアルティメットフォーム
2月 23日 (火)Aventura 5巻、まりあ†ほりっく6
2月 24日 (水).hack//Link 3巻
2月 26日 (金)ポケットモンスタースペシャル 34巻
2月 27日 (土)MG ガンダムアストレイ レッドフレーム改

■3月以後の予定
3月 3日 (水)Blu-ray サマーウォーズ
3月 5日 (金).hack//Link 絶対包囲パック
3月 6日 (土)ポケモンレンジャー 光の軌跡
3月 9日 (火)1+1 9巻
3月 10日 (水)3x3EYES 15、16巻
3月 19日 (金)BRD 2012
3月 25日 (木)MANGA REALIZATION バオー来訪者
3月 26日 (金)つめたく、あまい。、未来日記 10巻、未来日記パラドクス
3月 29日 (月)アルトネリコ3攻略本
4月 25日 (日)ザ・ワールド・セカンド

TwitterがCassandraを使った理由と移行方法

相変わらずの意訳な上に要点のみの抜き出しです。
間違っていたらTwitterでもコメントでいいのでがんがん指摘してください。

===============
Twitterではデータ量、データ増加量が急加速している。
今まではMySQLとmemcashedで運用してきたが、特に運用要員の面で費用が莫大になってしまった。
その為により自動的でより高い分散容易性、より高い可用性を必要とした。

選択肢として上ったのが下記の二つ。
・MySQL Clusterの今以上の自動化
・KVS(HBase、Voldemort、MongoDB、MemcacheDB、Redis、Cassandra、HyperTable)への移行

次の検証を行う事で選択肢の絞り込みを行った
・新規Node追加の容易性
・SPoFの有無
・Scalingに伴いデータ書き込みもScalingするか
・管理作業はどれ程必要か
・OSSである場合、健全な運営団体を伴っているか
・準備、移行に必要な時間と労力はどれ程か
・それを取り扱う為に新たな技術を学ぶ必要があるか
等々

結果的にCassandraに絞られ、Cassandraの検証を開始した。
検証では特に書き込みに重点を置いた。
現在大量のmemcachedを利用しているが、中長期的にみてDBの前にCacheを置かずに運用出来るかも検証した。

結果、Cassandra採用の要因となったのは
・SPoFがない事
・書き込み能力がScalingする事
・Cassandraを支える母体が健全である事
今後Twitterの全てのシステムをCassandraに載せ替えるつもりだが完全移行までには時間がかかる。現段階では維持が最も重要で最も維持が困難なTweetとReTweetのテーブルをCassandraに移行している。これが追われた後は簡単だ。

この既存データの移行に関しては元々Twitter側にそれに適したシステムがあるのでそれを利用する。この機能を利用して漸進的に機能拡張を行っていく。

Twitterが今後行う移行作業は次の通り
1.CassandraとMySQLの両方にデータを書き込む。同時に各々の書き込みが即停止出来る様にしておく
2.徐々にCassandraへの書き込みを行う
3.バグの調査
4.Cassandraへの書き込みの停止
5.新規システムのバグ修正を行い、再度適用を行う
6.2へ戻る
上記作業が終了した次を行う

1.MYSQLのバックアップ
2.Cassandraへのデータインポート ※1
3.データのインポートが終わったら読込をCassandraから行う様にする
4.満足がいく性能がでれば徐々にCassandraからの読込に切り替え、MySQLの利用を停止していく。駄目ならMySQLに戻して再度調整を行う。
※1 BinaryMemtableを利用したが高速すぎてネットワークI/Oを食いつぶしてしまう為にやめて通常のThriftに戻した。この状態だと一週間かかる。もし無限のネットワーク帯域があれば7時間で終わるだろう。

上記手段を用いて移行を完遂する。

元ネタ
Cassandra @ Twitter: An Interview with Ryan King

2010年3月1日の気になる記事

Twitter が Cassandra を選んだ理由
http://agilecat.wordpress.com/2010/03/01/twitter-%E3%81%8C-cassandra-%E3%82%92%E9%81%B8%E3%82%93%E3%81%A0%E7%90%86%E7%94%B1-mynosql-nosql-cloud-cloudcomputing-twitter-cassandra/