概要
前回、走行中の北陸新幹線車両台車部の着雪量推定モデルの作成という機械学習コンペに参加した時の提供データの前処理と検討について、一部紹介しました。
今回は、その続きです。
無いデータは事前に予測しておく!
- 天気(晴、雨etc)-> 日照時間 -> 日射量の推定
- 天気の情報から、日射量を予測しておく
- 雪が融けるかもしれないので、地上における日射エネルギー量は知りたい
- 降水量 -> 降雪量 の推定
本記事ではこの部分を紹介
します- 降水量から、積雪量を予測しておく
- 雪の量を予測しないことにはね、どうしようもないよね
- 台車着雪量の推定
2. 降水量から降雪量を予測する!
雪がどれくらい降っているのか、新幹線の台車に着雪する雪の量を予測するうえで、当然、必要となる情報です。
考え方によっては、もし提供されている天気や気温といった気象条件から、線形に近い予測ができるのであれば、降雪量をわざわざ予測する必要なんてありません。
だって、その特徴量を学習してくれるものが機械学習なのだから。
しかし、最終的には台車への着雪量を予測したいのですが、その予測経験式(後で紹介)は非線形ではないものの、対数やら指数やらが混ざってきます。
そのため、目的変数に対して相関係数が高い説明変数が用意できるに越したことはないです。
そこで、降雪量そして降雪量から推定できる着雪量の経験式も、予測と可視化を試みる。
JR西日本から提供された資料の式。。。は間違っていた
JR西日本から提供された資料に、以下の関係式が示されていた。
降水量は使用できる気象情報なので、ありがたく使わせてもらって降雪量を推定してみる。
降雪量(mm) = 降水量(mm) * ( 53.6 exp(0.488*気温) + 37.0 ) / 1e3
(雪氷研究大会(2010・仙台)講演要旨集)
早速、この関係式を用いて可視化してみた。
全然あってないやん!
これは、もしかしたらinputが降水量
なので、天気が雨の時も降雪量に換算してしまうのが問題なのか・・・?
ということで、天気が雪
の時だけこの式を適用するようにして、改めて可視化してみた。
ぜんぜん合ってない!!!! (*ノ゚Д゚)ノ三 三 三 ┫:・'∵:.┻┻:・'.:∵
これは。。。。式が間違ってるんじゃないか・・・・?
そこで、そもそも式が間違ってると考え、検証した。
式の再現
JR西日本からは、以下のような資料が提供されていた。
雪密度と気温の関係(経験式)は、以下の式であらわされるようだ。
ρs = 53.6 exp(0.488 * Ta) + 37.0
これを可視化した。
うん、reference先の論文(野口ら, 氷雪研究会, 2010)とグラフの様子は一致した。
ここで重要なことは、水の密度1000kg/m3と比較して、雪密度は2桁近くも小さい
という事実である。
したがって、降水量と比較すると、かならず降雪量のほうが大きな値となる。
しかしながら、JR西日本から提供された資料ではそうなっていない。
にも関わらず、先ほど求めた推定降雪量は降水量よりも小さな値となっているので、そもそも式がおかしいことに思い至る。
実際に、JR西日本から示された以下の計算式では、雪密度 psはおよそ50kg/m3 なので、
降雪量X(cm) = ps * 降水量Y(mm) / 10000
~ 0.005 * 降水量Y(mm)
~ 0.050 * 降水量Y(cm)
うん。
Y > 0 なので、必ず降雪量X(cm) < 降水量Y(cm)という関係になっています。
これは、雪密度が水密度より小さいことと矛盾しています。
計算式の再考
降雪した雪が溶けて水になっても、質量は変わらない。
したがって、状態変化前と変化後で、以下の等式が成立するはず。
雪密度p(kg/m3) * 積雪深X(cm) * 面積1(m2) = 1000(kg/m3) * 降水量Y(mm)*0.1 * 面積1(m2)
結果として、
積雪深 X(cm) = 100 / 雪密度 p(kg/m3) * 降水量 Y(mm)
となるはず。早速、これで降雪量の推定して、富山の観測値と比較してみる。
うん、イイ感じに予測できていますね。。。。。
これは JR西日本の資料が間違っている
ね。。。。
次回は
列車の走行速度などから、地面から舞い上がる飛雪流量と台車への着雪量を推定してみます。
それでは。