1140227 多變量分析
作業 1,製作美國、日本和歐洲汽車里程的箱形圖(從左到右)。
目錄
前言
本次作業要求畫出教科書中的美國、日本和歐洲汽車里程的箱形圖。
自 https://github.com/QuantLet/MVA/tree/master/QID-1485-MVAboxcar 可下載資料集 carc.txt
以及生成圖片的 MVAboxcar.R
檔案。
資料集
我們可以在 R 中使用
|
|
讀取資料集,以下是資料集 carc.txt
的部份資訊。
V1 | V2 | V3 | V4 | V5 | V6 | V7 | V8 | V9 | V10 | V11 | V12 | V13 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 4099 | 22 | 3 | 2 | 2.5 | 27.5 | 11 | 2930 | 186 | 40 | 121 | 3.58 |
2 | 4749 | 17 | 3 | 1 | 3.0 | 25.5 | 11 | 3350 | 173 | 40 | 258 | 2.53 |
3 | 3799 | 22 | NaN | NaN | 3.0 | 18.5 | 12 | 2640 | 168 | 35 | 121 | 3.08 |
4 | 9690 | 17 | 5 | 2 | 3.0 | 27.0 | 15 | 2830 | 189 | 37 | 131 | 3.20 |
5 | 6295 | 23 | 3 | 3 | 2.5 | 28.0 | 11 | 2070 | 174 | 36 | 97 | 3.70 |
… | … | … | … | … | … | … | … | … | … | … | … | … |
由教科書中的表 22.3 ,我們可以知道上述資料集共有 13 個參數與 74 個車輛種類,每個參數說明如下:
變數 | 符號 | 說明 |
---|---|---|
$X_1$ | P | 價格 |
$X_2$ | M | 每加侖行駛英里數 |
$X_3$ | R78 | 1978 年維修記錄, 5 分標準, 5 最佳, 1 最差 |
$X_4$ | R77 | 1977 年維修記錄, 5 分標準, 5 最佳, 1 最差 |
$X_5$ | H | 頭部空間,英吋 |
$X_6$ | R | 後座腿部空間,英吋 |
$X_7$ | Tr | 行李箱空間,立方英尺 |
$X_8$ | W | 重量,磅 |
$X_9$ | L | 車長,英吋 |
$X_{10}$ | T | 轉彎直徑,英尺 |
$X_{11}$ | D | 排氣量,立方英吋 |
$X_{12}$ | G | 最高檔齒輪比 |
$X_{13}$ | C | 公司總部, 1 代表美國, 2 代表日本, 3 代表歐洲 |
箱形圖
以下是於 Github 的 QuantLet/MVA 中繪製箱形圖的範例。
|
|
由於僅需要繪出不同地區汽車與里程的箱形圖,因此只使用 M = x[, 2]
和 C = x[, 13]
兩參數。其中, M
代表每加侖行駛英里數 (miles) , C
代表汽車製造商的公司總部 (Company headquarter) 。
上述程式碼是原作者於 2016 年上傳到 Github 的程式碼,我們現在可以以更精簡的寫法完成繪製,程式碼如下。
|
|
運行環境
- 作業系統:Windows 11 24H2
- 程式語言:R 4.4.2
參考資料
- Wolfgang karl härdle, léopold simar. (2015). Applied Multivariate Statistical Analysis (4th ed.). Springer. https://link.springer.com/book/10.1007/978-3-662-45171-7
- Quantnet. (2025, January 27). MVA. Github. https://github.com/QuantLet/MVA