隨筆 #6 - 從震後大火到拆除
從大火到拆除,理工一館 D 棟的觀察隨筆。
封面圖片由 ChatGPT 生成。
梯度下降是現今多數模型都會使用到的迭代方法,能夠幫助模型找到適合的參數。但對於現在的大數據時代,龐大的資料對梯度下降所帶來的後果就是巨大的時間成本,如何快速且不失準確性的計算參數是現今應要考慮的目標之一。
封面圖片由 ChatGPT 生成。
為什麼需要抽樣的方法呢?抽樣對資料分析有什麼好處?我們在建立模型時,有時候會發現需要訓練的資料量實在是太多,導致模型的訓練時間被拉長。而抽樣的目的在於,從龐大的母群體(population ,母體)中選取具有代表性的有限樣本(sample),並依據選取的樣本進行統計,從而反推樣本所在的母群體的性質或特性。
從以上敘述,我們可以知道樣本是母體的子集合。而如何從母體中找出合理的子集合作為樣本,就是抽樣方法(sampling method)。由於抽樣的樣本與母體仍會存在數量上的差異,我們希望經由抽樣選擇的樣本所計算出的樣本統計量(sample statistic),能夠靠近母體統計量(population statistic),並儘量降低因抽樣所造成的偏誤(bias)。
封面圖片由 ChatGPT 生成。
邏輯迴歸(logistic regression),又稱為邏輯斯迴歸、羅吉斯迴歸,是由線性迴歸(linear regression)變化而成的一種二元分類模型。與線性迴歸模型不同的是,線性迴歸會找出一條能夠穿越所有數據點的迴歸線,且每個點到迴歸線的平方和是最小的,稱為最小平方法(least squares method);而邏輯迴歸模型的目標則是找出一條迴歸線,使迴歸線能夠明確地將所有數據點分為兩類。