https://raw.githubusercontent.com/Josh-test-lab/website-assets-repository/refs/heads/main/posts/1140904%20jotting/cover%20image.webp

隨筆 #6 - 從震後大火到拆除

Josh 發佈於 2025-09-04 更新於 2025-09-21 收錄於隨筆照片集

從大火到拆除，理工一館 D 棟的觀察隨筆。

https://raw.githubusercontent.com/Josh-test-lab/website-assets-repository/refs/heads/main/posts/From%20Gradient%20Descent%20to%20Stochastic%20Gradient%20Descent/cover%20image.webp

從梯度下降到隨機梯度下降

Josh 發佈於 2025-08-30 更新於 2025-08-31 收錄於機器學習

封面圖片由 ChatGPT 生成。

梯度下降是現今多數模型都會使用到的迭代方法，能夠幫助模型找到適合的參數。但對於現在的大數據時代，龐大的資料對梯度下降所帶來的後果就是巨大的時間成本，如何快速且不失準確性的計算參數是現今應要考慮的目標之一。

https://raw.githubusercontent.com/Josh-test-lab/website-assets-repository/refs/heads/main/posts/Sampling%20Methods/cover%20image.webp

抽樣方法

Josh 發佈於 2025-08-12 更新於 2025-08-15 收錄於機器學習統計分析

封面圖片由 ChatGPT 生成。

為什麼需要抽樣的方法呢？抽樣對資料分析有什麼好處？我們在建立模型時，有時候會發現需要訓練的資料量實在是太多，導致模型的訓練時間被拉長。而抽樣的目的在於，從龐大的母群體（population ，母體）中選取具有代表性的有限樣本（sample），並依據選取的樣本進行統計，從而反推樣本所在的母群體的性質或特性。

從以上敘述，我們可以知道樣本是母體的子集合。而如何從母體中找出合理的子集合作為樣本，就是抽樣方法（sampling method）。由於抽樣的樣本與母體仍會存在數量上的差異，我們希望經由抽樣選擇的樣本所計算出的樣本統計量（sample statistic），能夠靠近母體統計量（population statistic），並儘量降低因抽樣所造成的偏誤（bias）。

https://raw.githubusercontent.com/Josh-test-lab/website-assets-repository/refs/heads/main/posts/Logistic%20Regression/cover%20image.webp

邏輯迴歸

Josh 發佈於 2025-07-23 更新於 2025-07-31 收錄於機器學習

封面圖片由 ChatGPT 生成。

前言

邏輯迴歸（logistic regression），又稱為邏輯斯迴歸、羅吉斯迴歸，是由線性迴歸（linear regression）變化而成的一種二元分類模型。與線性迴歸模型不同的是，線性迴歸會找出一條能夠穿越所有數據點的迴歸線，且每個點到迴歸線的平方和是最小的，稱為最小平方法（least squares method）；而邏輯迴歸模型的目標則是找出一條迴歸線，使迴歸線能夠明確地將所有數據點分為兩類。

https://raw.githubusercontent.com/Josh-test-lab/website-assets-repository/refs/heads/main/posts/Methods%20for%20Selecting%20Models/cover%20image.png

挑選模型的方法

Josh 發佈於 2025-07-20 更新於 2025-07-20 收錄於機器學習統計分析

如何判斷、比較多個模型，並從中選出對統計分析、機器學習最佳的那個呢？簡單的模型可能無法較好的擬合模型，而過於複雜的模型也可能出現「過擬合」，導致模型在未來資料上的預測能力不佳。

https://raw.githubusercontent.com/Josh-test-lab/website-assets-repository/refs/heads/main/posts/Bellman-Ford%20Algorithm/cover%20image.png

貝爾曼-福特演算法

Josh 發佈於 2025-07-17 更新於 2025-07-18

為了解決戴克斯特拉演算法中無法計算路徑為**負**權重的，貝爾曼-福特演算法（Bellman-Ford Algorithm）就此誕生。貝爾曼-福特演算法會對 $V$ 個節點做 $V - 1$ 次鬆弛操作，重複鬆弛所有邊，進而持續改善、找尋最短路徑。

https://raw.githubusercontent.com/Josh-test-lab/website-assets-repository/refs/heads/main/posts/1140716%20jotting/0.jpg

隨筆 #5

Josh 發佈於 2025-07-17 更新於 2025-09-21 收錄於隨筆照片集

https://raw.githubusercontent.com/Josh-test-lab/website-assets-repository/refs/heads/main/posts/Image%20compression%20tool/cover%20image.png

圖片壓縮工具

Josh 發佈於 2025-07-15 更新於 2025-07-16 收錄於工具 Python

在平時建立網站頁面時，我們會發現有時候有些頁面需要讀取一段時間才能出現，而有些頁面卻沒有。經過比較不同網頁後得出一個結論，網頁內的圖片如果大小過大，會造成網頁讀取速度較慢，因此萌生出要找到一款能夠壓縮目前網站目錄下所有圖片工具。但找來找去，網路上都沒有找到合適的應用程式，最後決定自己製作一款能夠壓縮所有圖片的程式。

https://raw.githubusercontent.com/Josh-test-lab/website-assets-repository/refs/heads/main/posts/k-means%20clustering/cover%20image.png

k-平均聚類分析

Josh 發佈於 2025-07-11 更新於 2025-09-21 收錄於機器學習

k-平均聚類分析（k-means clustering），在中文地區常被稱為 k-平均演算法，簡稱 k-means。這是一種將 $n$ 個資料點分成 $k$ 個群集（clusters）的分群方法，使得每一個點都能歸屬於距離它最近的群集中心（centroid）。

https://raw.githubusercontent.com/Josh-test-lab/website-assets-repository/refs/heads/main/posts/Methods%20of%20Normalization/cover%20image.png

標準化的方法

Josh 發佈於 2025-07-09 更新於 2025-07-09 收錄於機器學習

在進行統計分析時，往往會接觸到各種類型的資料，而這些資料可能具有不同的單位與數值範圍。為了消除單位差異所帶來的影響，並提升資料之間的可比性，常需透過適當的尺度轉換來進行標準化處理，也就是讓它們在同一個尺度下進行分析。根據應用需求的不同，標準化的方法也各式各樣，不同方法所帶來的差異，甚至可能左右後續的統計推論與模型表現。