1140304 meeting
$SSSD^{S4}$ 模型輸入與輸出探討

封面圖片是 $SSSD^{S4}$ 模型的運作過程,2024 年 2 月 28 日擷取自 Github 。
$SSSD$ 模型的資料集
我嘗試使用原作者於 Github 上所提供的範例,使用 MuJoCo 資料集進行訓練。由原作者的 Github ,我們可以知道這是從 NRTSI 中所提取的資料集。 NRTSI 提供一系列適用於訓練時間序列模型的資料集,除了提供打包成 .npy
格式的訓練集、測試集檔案外,也提供其他用於填補時間序列的方法。
以上週 meeting 中的 $SSSD^{S4}$ 輸入資料 train_mujoco.npy
,我們可以得到
- 此資料是 NumPy 的陣列類型,並且是 $8000 \times 100 \times 14$ 的三維陣列。
- 依據 config 設定,所填補的結果皆為 $500 \times 14 \times 100$ 的陣列。
以下為用於測試的 Python 腳本與執行結果。
載入模組、設定函數與參數。
|
|
查看 Mujoco 資料集的訓練集
|
|
|
|
查看模型填補結果 imputation0.npy
|
|
|
|
查看模型遮罩 mask0.npy
|
|
|
|
查看 original0.npy
檔案
|
|
|
|
比對測試集
測試集矩陣資訊如下。
|
|
|
|
繪製預測圖
由 NRTSI 的論文中,我們可以得知 MuJoCo 的資料集包含 14 個維度的特徵值, 100 個時間點與 2,000 次實驗。
因此,我們可以將上述資料繪製如下。
上圖繪製了第 10 次實驗的第 3 個特徵值,取前 100 筆資料。
|
|
運行環境
- 作業系統:Windows 11 24H2
- 程式語言:Python 3.12.9
延伸學習
- 在 Python 中使用 NumPy 進行檔案的讀取與寫入
- 我測試此項目的 Github 儲存庫 。
參考資料
Juan Lopez Alcaraz 、 Nils Strodthoff(2022)。Diffusion-based time series imputation and forecasting with structured state space models。Transactions on Machine Learning Research。參考自 https://openreview.net/forum?id=hHiIbk7ApW
SSSD(2022)。GitHub。參考自 https://github.com/AI4HealthUOL/SSSD
Shan, Siyuan 、 Li, Yang 和 Oliva, Junier B.(2023)。Nrtsi: Non-recurrent time series imputation。ICASSP 2023-2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 1–5。IEEE。
NRTSI(2023)。GitHub。參考自 https://github.com/lupalab/NRTSI/tree/main/codes_regularly-sampled