はじめて、というのはうそで、、data=writeback にするの忘れてたら痛い目みたというお話。
以下の通り。
とあるアプリで猛烈に TokyoTyrant をシバくものをプログラマさんが作りました。
ぼくはいつもどおりにサーバ一式を用意しました。
めでたくリリースされました。
しかし数日たち、、日に日にエラーがましまし。。
アプリケーションサーバ不足は追加により、すぐに解消しました。
それでも夜の混雑時にはエラーがでたり、鈍重になります。
モニタリングしているグラフをみると、WAIT CPU がひどい状態です。
そういえば、と思ってみると、TokyoTyrant を動かしているサーバの
casket.tch をおいているパーティションを data=writeback にしていませんでした。
幸いなことにちょうど、メンテ予定日が設けられていました。
メンテ時に TokyoTyrant を停止し、writeback でマウントしなおし、TokyoTyrant を再開しました。
その後 WAIT CPU は消えさりました。
めでたしめでたし。
15:00 にメンテ開始、16:00に再開
図1
図2
図3
0 件のコメント:
コメントを投稿