1140729 meeting
前言
本週實驗主要以結合 autoFRK
與 SSSDS4
模型為主。所有實驗皆使用完整版 autoFRK
進行預測,而非使用 MRTS
。
本週進行的實驗分為三個情境(設想)。
所有已知地點經過
autoFRK
重新預測,使用當期的地點重新預測當期之值,直接將結果交由SSSDS4
模型向後預測。此實驗用於確認,假設
autoFRK
可預測準確,則經SSSDS4
預測未來後是否仍可維持高準確率?將未知地點每期先經由
autoFRK
補值,後再交由SSSDS4
向後預測。此實驗用於與前一實驗比較,以確認未知地點捕值是否仍能有高準確率?
將已知地點先經由
SSSDS4
向後預測,再交由autoFRK
為未知地點每期補值。此實驗用於與前一實驗比較,用於確認
autoFRK
與SSSDS4
的預測先後順序是否會影響實驗結果。且此實驗由於不會將過去缺失值補齊,故在預測速度應會快於前一實驗。
實驗 1
autoFRK
預測值 (250 天)Method Value MSE 2.208425763 RMSE 2.208425763 MSE% 0.007850246 RMSE% 0.007850246 MAE 1.058653390 MAE% 0.003772132 SSSDS4
預測值 (250 + 10 天)Method Value MSPE (All) 25.643074 MSPE (Future) 22.201488 MAPE (All) 3.847528 MAPE (Future) 3.777283 MSPE% (All) 0.092841 MSPE% (Future) 0.078886 MAPE% (All) 0.013823 MAPE% (Future) 0.013367
實驗 2
autoFRK
預測值 (250 天,僅預測缺失地點)Method Value MSPE 3.876077622 RMSPE 1.968775666 MSPE% 0.013798632 RMSPE% 0.117467580 MAPE 1.406543020 MAPE% 0.005010491 SSSDS4
預測值 (250 + 10 天)Method ALL Locs & All Time Known Locs & All Time Unknown Locs & All Time ALL Locs & Future Known Locs & Future Unknown Locs & Future ALL Locs & Past Known Locs & Past Unknown Locs & Past MSPE 125.489044 124.578705 129.390610 124.660667 122.997314 131.789291 125.522163 124.641937 129.294662 RMSPE 11.202189 11.161483 11.374999 11.165154 11.090415 11.479952 11.203668 11.164315 11.370781 MAPE 8.593054 8.562331 8.724644 8.801373 8.733807 9.090941 8.584720 8.555482 8.709991 MSPE% 0.446431 0.443675 0.458241 0.437042 0.431520 0.460707 0.446807 0.444162 0.458142 RMSPE% 0.668155 0.666090 0.676935 0.661092 0.656902 0.678754 0.668436 0.666455 0.676862 MAPE% 0.030651 0.030567 0.031012 0.030911 0.030694 0.031840 0.030640 0.030561 0.030979
實驗 3
(尚未開始)
結論
觀察 autoFRK
後發現,其補值作法先經由 KNN 選定附近 3 個坐標點,並取平均候補值。若需改進 SSSDS4
使其包含空間性,或許可解借鑑 KNN 方法,由鄰近點組成新資料框後再行訓練,最後再填回缺值;又或許由鄰近點組成新資料框後再行訓練,並使用類似隨機森林之方法,訓練多次後找出擬合最佳之模型,惟須注意單一 SSSDS4
模型訓練時間過久,若採用此方法則需改進現有模型,降低其訓練時間。
結語
運行環境
- 本機作業系統:Windows 11 24H2
- 程式語言:Python 3.12.9
- 計算平臺:財團法人國家實驗研究院國家高速網路與計算中心臺灣 AI 雲
- 作業系統:Ubuntu
- Miniconda
- GPU:NVIDIA Tesla V100 32GB GPU
- CUDA 12.8 driver
- 程式語言:Python 3.10.16 for Linux
延伸學習
- 我測試此項目的 Github 儲存庫 。
參考資料
Juan Lopez Alcaraz 、 Nils Strodthoff(2022)。Diffusion-based time series imputation and forecasting with structured state space models。Transactions on Machine Learning Research。參考自 https://openreview.net/forum?id=hHiIbk7ApW
SSSD(2022)。GitHub。參考自 https://github.com/AI4HealthUOL/SSSD
SSSD_CP(2024)。GitHub。參考自 https://github.com/egpivo/SSSD_CP
近兩年小時值查詢(無日期)。環境部 - 空氣品質監測網。參考自 https://airtw.moenv.gov.tw/CHT/Query/InsValue.aspx