/images/website/avatar.png
發佈日期 / 更新日期

機器學習初認識

機器學習(machine learning, ML)是人工智慧(artificial intelligence, AI)領域中的一個子領域,它使電腦能夠通過資料學習並進行預測或決策,而不需要人為一步一步計算。在傳統的資料分析與程式設計中,往往都需要要求開發者為每個分析的事件編寫具體規則。而機器學習依賴於資料,通過訓練模型自動識別規則或找到模式。隨著數位化時代的到來,每天都有大量的資訊、數據被產出、收集,無論這些資料集是否具有價值,又或是存在著不明顯且隱藏的資訊,我們都能嘗試使用機器學習找出這些資訊並加以利用。機器學習技術在各行各業中都有著重要應用,如金融、醫療、製造、以及自動駕駛等。

【心得】國中學生職涯試探 - 化工群

職涯試探對於還處於迷茫階段的國中學生來說,是一次能夠找尋自己喜歡方向的活動。

透過參與不同職群的活動,一方面培養興趣,另一方面也能了解各行業的工作內容與運作方式、原理,並從實作中學習。

這一次參加的化工群職涯探索是由花蓮高工在周末時到校舉辦製作光敏章的探索活動。每位小朋友除了能學到課本上的知識是如何應用到生活中,也透過豐富的想像力創造出屬於自己的印章,體會動手實作與創意表達的樂趣。

在網站首頁新增依發佈或更新日期排序的按鈕

前言

有時候在瀏覽網站時,就想看最近有更新的文章。但因為本站使用的是 Hugo ,而 Hugo 是靜態網頁生成器,首頁中的文章訊息在網站生成的一刻都寫死了,無法做到動態切換。這時,我們就可以利用生成一個類似於首頁的頁面,透過按鈕切換不同頁面,達到類似動態網頁的效果,完成文章排序功能。

主成分分析(PCA)

主成分分析(Principal Component Analysis, PCA)是常見的降維(dimension reduction)方法,是將原先線性相依(linearly dependent)的資料集經由正交轉換(orthogonal transformation)後變成若干個線性獨立(linearly independent)的新變數表示的資料,使資料集經投影到新變數上損失的資訊量最小,並依新變數的變異數(variance)大小依次稱為第一主成分、第二主成分等。 PCA 常用於將高維度的資料映射到低維度空間,同時盡可能在降維過程中保留原始資料的重要特徵與訊息。

認識混淆矩陣

在機器學習中,我們能建立各式各樣的模型,從簡單的線性迴歸到複雜的神經網路模型等。這些模型可以應用於不同的領域,例如影像辨識、語言生成、金融預測等。不同的模型各有其優勢與適用場景,例如線性迴歸適合處理資料集與目標變數的擬合與分析,而深度學習則能處理複雜的非線性的資料集。然而,如何判斷一個模型的好壞呢?單純依賴準確率(Accuracy)可能不足以評估模型的表現,特別是在類別分佈不均的情境下。因此,我們使用 **混淆矩陣(Confusion Matrix)** 來分析分類模型的效能。

資料集探索與分析

封面圖片為 ChatGPT 生成的關於資料分析的圖片,提示詞為 “A modern data analysis concept illustration featuring a futuristic workspace. The image includes multiple data charts, graphs, and dashboards displayed on transparent holographic screens. A diverse team of analysts and data scientists collaborate, analyzing trends and insights on large monitors. The scene has a sleek, high-tech atmosphere with glowing blue and purple hues, reflecting a professional and cutting-edge environment.” 。

前言

本次使用的資料集為 Swiss bank notes ,是銀行間用於判斷舊瑞士法郎(Franc)的資料集。本文自 https://github.com/QuantLet/MVA/tree/master/QID-1530-MVAscabank56 中下載 bank2.dat 資料集,並使用 R 語言進行分析。

在 Hugo 中將文章上鎖

前言

有時候某篇文章有瑕疵或是涉及的資訊不想讓所有人都看到,但我們又希望文章能在網頁上供特定人士觀看。這時候,文章密碼就派上用場啦!