時系列データで予測区間付き回帰を行う keras - 学習する天然ニューラルネット

概要

時系列のデータについて、1時刻先を推定する回帰問題を扱った。
点推定ではなく正規分布を仮定した分布を推定した。
2σ区間を予測区間とした。
電力使用量のデータを用いて実験した。

概要
問題意識
アイデアの概要
データの説明
モデルの説明
結果
まとめ

2019/03/01追記

もっとちゃんとやりました。

aotamasaki.hatenablog.com

問題意識

例えば異常検知を考える。予測した値と実測した値が大きく異なったら、なんらかの異常が生じていると判断できるだろう。しかし、その違いがどれぐらい大きければ異常なのか、異常度はどれぐらいなのかを判断するのは難しい。そこで確率分布が必要となる。値を予測する代わりに、確率分布を推定すれば、実測した値を確立で評価できる。興味があるのは点ではなく分布である。ニューラルネットワークでは点推定が前提であることが多いが、今回は分布を推定した。

アイデアの概要

正規分布を仮定する。普通の正規分布と異なる点は、パラメータが時間に依存する点である。ではこの各時刻のパラメーターを推定するニューラルネットワークをそれぞれ構築すればいいのでは？というアイデア。

f:id:aotamasaki:20181104100634p:plain

2σ程度の誤差は正常であると許容するものとして、予測区間を設定した。

データの説明

こちらから取得した。

UCI Machine Learning Repository: ElectricityLoadDiagrams20112014 Data Set

これは電力使用量のデータで15分ごとに記録されている。

あるユーザーのデータだけに注目して、入力とした。時系列の長さは192点分(2日に相当)、ある時刻における次元は1である。

数日を抜き出してみるとこんな感じで周期的に上下していることがわかる。

f:id:aotamasaki:20181104100740p:plain

学習時及び推論時は下図のように、灰色の矩形を入力、1時刻後の分布(のパラメーター)を出力するようにした。(テスト用に時系列の最後の1割は学習に用いなかった)

f:id:aotamasaki:20181104100813p:plain

モデルの説明

f:id:aotamasaki:20181104100634p:plain

前述したアイデアを達成するために2つのネットワークを用意した。

平均値推定用のネットワークと分散推定用のネットワークである。どちらもRNNの一種であるGRUを用いていて、最後の内部状態を取り出してFCにつないでいる。

f:id:aotamasaki:20181104100923p:plain

f:id:aotamasaki:20181104100924p:plain

しかし、ここで問題が発生する。次時刻の分散など教師データには存在しない。ただ、平均値が推定できているのであれば、それとの誤差はなんらかの規則性をもっているであろうと仮定した。

そこで分散の代わりに二乗誤差系列を推定することで、次時刻の想定される二乗誤差を分散の代わりに用いる。学習のアプローチとしては以下のような感じである。

f:id:aotamasaki:20181104101014p:plain

ここで注意していただきたいのは、二乗誤差系列を入力には使わないということ。あくまで、電力使用量の系列を入力として次時刻の二乗誤差を推定する。

こうすることで、推論時には、電力使用量の系列だけを用いればいいので処理が楽である。

シンプルなモデルなのでのソースコードもこんな感じ

def ret_model(est="mu"):
    """
    GRU
    FC
    FC
    mu もしくは var
    """
    
    
    # hyper parameter
    LATENT = 20
    FC=10
    
    # ネットワークの定義
    inputs = Input(shape=(NUM_timesteps, NUM_input_dim))
    # (, NUM_timesteps, NUM_input_dim)
    gru=GRU(LATENT)(inputs)
    # (, LATENT)
    fc=Dense(FC,activation="relu")(gru)
    # (, FC)

    #最終層は推定するものによって変える
    if est is not "mu":
        output=Dense(NUM_output_dim,activation = "sigmoid")(fc) #varは絶対に0を下回らないのでsigmoidを噛ませる
    else:
        output=Dense(NUM_output_dim)(fc)
    
    model = Model(inputs,output)
    
    model.summary()
    
    return model