深層学習を用いてデータから自動的に95%予測区間の帯を求める,深層分位点回帰の実装を最近行いました。十分な情報量を持つデータから生成される帯は,未想定イベントが発生しない限り,サンプルパスの95%をカバーし,推移しうる未来を予測できるようになります。想定される応用対象は,例えば需要予測やウイルス感染者数の予測などランダム要素が多い時系列データです。
We have recently implemented deep quantile regression that automatically generates 95% prediction interval bands for time series data. The band generated by data with a sufficient amount of information will covers 95% of the sample pathes of the random process and predict future, unless unexpected critical events occur. The application targets are demand, virus infection status, and jam traffic, and so on, for example.
図1 ノイズ付きコサイン波に適用した場合の結果:青点が時系列データで,黄色が神様の視点でのデータです。赤は95%予測区間の帯で,緑は中央値の点推定です。読み込ませた区間が[0,2π]だけですが,振幅の程度などノイズ付きにしては黄色の線が予測線(赤、緑)と近いのがわかります。
ベースとしているモデルは,LSTMという時系列を扱うためのモデルですから,数値の時系列だけでなく,ベクトル値の時系列も扱えます。例えば人の移動に関するデータを読み込ませて,95%の確率で発生するであろう範囲を提示することができると思います。当方で考えられる応用例は,トラフィック制御,人の行動推定,経済系予測(株価予想や需要予想など)があります。一方で,特徴が捉えにくいノイズや宝くじのようなランダム性の強い対象はおそらく何もわからないと思います。