昨日の日記にリンクを張った論文、AICなんて言葉が出ていますが、これ、赤池の情報量基準(クライテリア)でして、今では、統計的検定の有力な手法、世界中の研究者がこの基準を使って研究しています。
赤池さん、研究者以外にはほとんど知られていないんですけど、この発見、非常に価値が高いと思いますよ。ノーベル賞級、と言えば判りやすいかな。
たいていの研究、因果関係を調べることを目的としてます。つまり、ある要素(たとえば月の位置)がある現象(たとえば地震)の原因であるのかどうか、なんてことを調べるのですね。その方法として、現象を数字(地震の回数とか)で表して、その原因となりそうなもの(これも数値化して)を使って式で表します。この式に過去のデータを入れ、係数を調整したとき、最も誤差が少ない式が確からしい。でも、原因になりそうな要素をどんどんと増やしていくと、誤差はどんどん減ってしまいます。たとえ意味のない原因でも、係数を調整しますので、たまたま当ることもある。
赤池さんは、これをどこで打ち切れば良いかという合理的基準を提示したんですね。で、それが、情報量。情報量というと、情報工学の世界の話で、統計学者は、知識としては知っていても、あまり利用しない。そういう、ちょっと外の世界の知見を使うってのが、大発見にしばしば繋がります。
もう一つ、赤池さんに感心することは、この方、セメントキルンの変動解析もされているんですね。学者は、象牙の塔にこもりがちだけど、セメント工場で実際に運転されているセメントキルンを実際に解析して、本を書かれています。
セメントキルンは、直径数メートル、長さ数十メートルの鉄管で、中にレンガが敷き詰めてあって、ガスバーナーで高温に熱しています。この中を、石灰や粘土の粉を通してやることで、セメントが出来るわけです。ところが、これを安定に運転することが難しい。温度が足らなければセメント、生焼けになって強度が出ません。焼きすぎるとガス代馬鹿になりません。
こういう工場の仕事って、研究をする人、馬鹿にしがちなんですね。馬鹿にする理由は、工場の人間簡単なことで悩んでいる馬鹿、だからじゃなくて、複雑すぎて、結果が出にくい。自分の馬鹿さ加減を知ってるが故の逃げなんですね。しかし、複雑な現象を解く手法、これが出来れば、現実の世界では大きな価値があります。
赤池さんはそれをやっちゃったんですね。大したものです。