熱暴走

こないだインストールしたインフラサーバが昨夜、make buildworld中にいきなり落ちる。もう鍵がしまっていたのでサーバ室に入れず、今朝再起動してみてみたらなんと

Jul 23 22:45:44 epdc root: WARNING: system temperature too high, shutting down soon!
Jul 23 22:46:14 epdc root: WARNING: system temperature too high, shutting down soon!
Jul 23 22:46:24 epdc kernel: acpi_tz0: WARNING - current temperature (88.0C) exceeds safe limits

ぎゃあ熱暴走だった。(←実際には暴走せず、きちんとshutdownされてたけど)

とりあえず風通しのよいところに移動。
http://www.usamimi.info/~sakura/cgi-bin/blog/article.php?id=164
を参考にさせてもらって、/boot/loader.confに「coretemp_load="YES"」を追加し、「sysctl -v hw.acpi.thermal.tz0.temperature」を毎分ログることにした。ログファイルは/etc/newsyslog.confできちんとローテートする。

(追記)「sysctl -v hw.acpi.thermal.tz0.temperature」はacpi経由で取得する温度で、coretempモジュールをkldloadしてなくても取れる。coretemp経由での取得は「dev.cpu.0.temperature」である。
参考:http://gihyo.jp/admin/clip/01/fdt/200708/19