全球時空資料:NASA GES DISC 資料探索與下載
GES DISC 為 NASA 旗下科學資料中心,負責保存地球科學相關資料,並免費向所有使用者開放,是取得時空資料的絕佳地方。
這是一個經典的數理統計學證明,也就是兩隨機變數和的變異數,是否會等於兩變數各自變異數的和。
封面圖片由 ChatGPT 生成。
梯度下降是現今多數模型都會使用到的迭代方法,能夠幫助模型找到適合的參數。但對於現在的大數據時代,龐大的資料對梯度下降所帶來的後果就是巨大的時間成本,如何快速且不失準確性的計算參數是現今應要考慮的目標之一。
封面圖片由 ChatGPT 生成。
為什麼需要抽樣的方法呢?抽樣對資料分析有什麼好處?我們在建立模型時,有時候會發現需要訓練的資料量實在是太多,導致模型的訓練時間被拉長。而抽樣的目的在於,從龐大的母群體(population ,母體)中選取具有代表性的有限樣本(sample),並依據選取的樣本進行統計,從而反推樣本所在的母群體的性質或特性。
從以上敘述,我們可以知道樣本是母體的子集合。而如何從母體中找出合理的子集合作為樣本,就是抽樣方法(sampling method)。由於抽樣的樣本與母體仍會存在數量上的差異,我們希望經由抽樣選擇的樣本所計算出的樣本統計量(sample statistic),能夠靠近母體統計量(population statistic),並儘量降低因抽樣所造成的偏誤(bias)。
封面圖片由 ChatGPT 生成。
邏輯迴歸(logistic regression),又稱為邏輯斯迴歸、羅吉斯迴歸,是由線性迴歸(linear regression)變化而成的一種二元分類模型。與線性迴歸模型不同的是,線性迴歸會找出一條能夠穿越所有數據點的迴歸線,且每個點到迴歸線的平方和是最小的,稱為最小平方法(least squares method);而邏輯迴歸模型的目標則是找出一條迴歸線,使迴歸線能夠明確地將所有數據點分為兩類。