author
發佈日期 / 更新日期

紅樓夢人物分析

中國古典小說是中國文學中不可或缺的重要部份,在歷史上有許多值得進行探勘的名著。其中《紅樓夢》被譽為中國古典小說的代表作之一,並且具有很高的探究性,小說中人物的命運和許多事件間有著密切而複雜的關係,需要經過深入的研究才能理解其真正含義。

隨筆 #7 - Adobe Acrobat Reader 離線安裝檔下載

最近重新安裝操作系統時,要安裝 PDF 檢視器,依過往習慣選擇安裝 Adobe Acrobat Reader ,才發現竟找不到 Adobe Acrobat Reader 的離線安裝檔案。之所以會發現這個,是因為在下載 Adobe Acrobat Reader 安裝檔時,發現所下載的檔案僅 1.55 MB ,完全不符合以往安裝軟體時的檔案大小,安裝時才發現是線上的檔案下載器,對於離線安裝的使用者來說非常不方便。

從梯度下降到隨機梯度下降

封面圖片由 ChatGPT 生成。

梯度下降是現今多數模型都會使用到的迭代方法,能夠幫助模型找到適合的參數。但對於現在的大數據時代,龐大的資料對梯度下降所帶來的後果就是巨大的時間成本,如何快速且不失準確性的計算參數是現今應要考慮的目標之一。

抽樣方法

封面圖片由 ChatGPT 生成。

為什麼需要抽樣的方法呢?抽樣對資料分析有什麼好處?我們在建立模型時,有時候會發現需要訓練的資料量實在是太多,導致模型的訓練時間被拉長。而抽樣的目的在於,從龐大的母群體(population ,母體)中選取具有代表性的有限樣本(sample),並依據選取的樣本進行統計,從而反推樣本所在的母群體的性質或特性。

從以上敘述,我們可以知道樣本是母體的子集合。而如何從母體中找出合理的子集合作為樣本,就是抽樣方法(sampling method)。由於抽樣的樣本與母體仍會存在數量上的差異,我們希望經由抽樣選擇的樣本所計算出的樣本統計量(sample statistic),能夠靠近母體統計量(population statistic),並儘量降低因抽樣所造成的偏誤(bias)。

邏輯迴歸

封面圖片由 ChatGPT 生成。

前言

邏輯迴歸(logistic regression),又稱為邏輯斯迴歸、羅吉斯迴歸,是由線性迴歸(linear regression)變化而成的一種二元分類模型。與線性迴歸模型不同的是,線性迴歸會找出一條能夠穿越所有數據點的迴歸線,且每個點到迴歸線的平方和是最小的,稱為最小平方法(least squares method);而邏輯迴歸模型的目標則是找出一條迴歸線,使迴歸線能夠明確地將所有數據點分為兩類。