應用數學與數據科學碩士
課程簡介
-
課程期限
本課程正常修業期限為2年,最長修業期限為3年。
-
授課方式
面授課程
-
授課語言
中文/英文
-
學術領域 / 知識範疇
數學與數據科學
-
課程介紹
本課程致力於培養應用數學與數據科學高級人才,以供應工商業界、研究機構、以及學術界的人才需求,並發展在跨領域研究中所需要的應用數學與數據科學相關的理論與應用,推動大數據處理在各行業中的整合應用,為粵港澳大灣區提供大數據分析人才。
學習計劃
入學資格
具有數學、物理、計算機、工程、統計、經濟、生物、醫學或相關專業的學士學位。
研究方向
在導師的指導下主要從(但不限於)以下三個研究方向進行畢業論文的選題:
· 應用數學
· 數據挖掘
· 機器學習
表(一): 必修科目(21學分)
科目中文名稱 | 種類 | 學分 | 備註 |
數據科學中的數學方法 | 必修 | 3 | 第一、二學期修讀完成 |
數值線性代數 | 必修 | 3 | |
數據科學開源工具 | 必修 | 3 | |
應用統計分析 | 必修 | 3 | |
數據挖掘 | 必修 | 3 | |
機器學習 | 必修 | 3 | |
時間序列分析 | 必修 | 3 |
表(二):選修科目(9學分)
科目 | 種類 | 學分 | 備註 |
應用數學高級專題 | 選修 | 3 | 選擇3門選修科目修讀並 |
數據科學高級專題 | 選修 | 3 | |
數據科學程序設計 | 選修 | 3 | |
數碼圖像處理 | 選修 | 3 | |
數據可視化與可視分析 | 選修 | 3 | |
數據倉庫與數據挖掘 | 選修 | 3 | |
隨機過程 | 選修 | 3 | |
多媒體信號與系統 | 選修 | 3 | |
數據庫系統 | 選修 | 3 |
* 大學有權取消開辦修讀人數不足之科目
表(三):其他必修科目(3學分)
科目 | 種類 | 學分 |
文獻綜述與選題報告 | 必修 | 2 |
學術專題項目 | 必修 | 1 |
表(四):學位論文 (6學分)
科目 | 種類 | 學分 |
論文 | 必修 | 6 |
科目簡介
必修科目:
數據科學中的數學方法(3 學分)
本課程將主要介紹數據科學中常用的數學方法,主要內容包括:凸優化的定義、概念,以及凸分析和一些結果,凸優化在概率統計、計算幾何以及數據擬合中的廣泛應用,求解凸優化問題的數值方法,包括牛頓法以及內點法。
數值線性代數(3 學分)
本課程首先簡要回顧線性代數中的基礎概念和理論。在此基礎上將主要介紹數值計算中的常見問題, 如:問題的條件數及算法穩定性分析、高斯消去法及LU分解、 Gram-Schmidt正交法、最小二乘問題、特徵值問題、奇異值分解以及基本的迭代法等,並同步介紹相關算法的實現。
數據科學開源工具(3 學分)
本課程將主要講授Python語言的基本語法以及控制結構,進而介紹數據分析中常用的模塊如:Numpy, Pandas, Mathplotlib, Sqlit3, Sklearn等的使用。最後介紹應用Python來進行常見的數據分析操作,如抓取網絡數據、正則表達式、存儲數據及訪問,迴歸與分類,聚類分析,PCA主成分分析,以及時間序列分析與預測等。此外,本課程也將涵蓋其他開源工具的使用,包括SQL語句、Shell編程、Julia程序語言、OpenCV等。
應用統計分析(3 學分)
本課程將主要介紹數據科學中常用的概率統計模型和方法,如概率論的基礎理論,隨機事件的概率問題,數字特徵,統計量,離散型和連續型隨機變量的分佈模型,數據收集和分類,大數定理和中心極限定理,點估計和區間估計,常用假設檢驗法,回歸模型,方差分析,多元統計分析,貝葉斯統計等。
MIMZ05 數據挖掘(3 學分)
本課程介紹最新的數據挖掘技術及其應用。 本課程的宗旨是幫助學生瞭解數據挖掘技術的原則和重要性,主要關注數據挖掘的技術發展及其相關學科,如人工智能和機器學習。本課程的主題包括數據科學的概念和技術,如數據統計描述、數據可視化、數據預處理、數據倉庫、頻繁的模式挖掘和關聯規則分析、分類和監督學習、聚類和非監督學習、變量選擇。此外,通過 Python 實現相關算法也是必要的。
MIMZ06 機器學習(3 學分)
本課程將廣泛地介紹機器學習、數據挖掘、統計模式識別等內容。主題包括:(一)監督學習(參數/非參數算法,支持向量機,核函數,神經網絡)。(二)無監督學習(聚類,降維,推薦系統,深度學習推薦)。(三)在機器學習的最佳實踐。
MIMZ07 時間序列分析(3 學分)
本課程為學生全面介紹時間序列分析的基礎知識和分析實際數據的方法。課程將學習時間序列的分解、滑動平均、指數滑動平均等方法,以及相關係數、平穩性等基礎知識。另外,課程將介紹巴斯擴散模型、Holt-Winters 指數平滑模型、一般線性模型、Harmonic季節模型、隨機遊走、滑動平均過程、自回歸過程、自回歸條件異方差模型等傳統時間序列模型。課程中的模型都會用來擬合實際的數據,幫助對模型更好地理解和使用。將採用R語言來做圖和分析數據。這些內容有助於時間序列理論研究和解釋現實世界的數據。
選修科目
應用數學高級專題(3 學分)
本課程將主要介紹應用數學中的實用專題,例如數學物理反問題的计算方法。課程主要涵蓋截斷奇異值分解、Tikhonov正則化方法、變分正則化,以及統計反問題計算方法(馬爾可夫鏈蒙特卡洛採樣以及貝葉斯推斷)等一系列數學反問題常用方法。另外,課程也會介紹一些數學反問題的實際應用,包括CT、卷積與圖像去模糊應用等。
數據科學高級專題(3 學分)
本課程介紹數據科學的最新理論和應用, 如深度學習及其在計算機視覺和自然語言處理中的應用。深度學習是機器學習的一個分支,它與現代神經網絡的發展和應用有關。深度學習算法以最大化給定任務的性能的方式提取數據分層高級表示形式。課程將涵蓋一系列主題,從基本神經網絡、卷積和循環網絡結構、深度無監督和強化學習,以及應用到自然語言處理和計算機視覺等領域。
數據科學程序設計(3 學分)
本課程重點介紹基於深度學習的算法、模型以及編程實踐。課程採用PyTorch作為深度學習框架, 涵蓋NumPy、Pandas、機器學習理論、測試/訓練/驗證數據拆分、模型評估、張量、神經網絡理論(感知機、網絡、激活函數、成本/損失函數、反向傳播、梯度)、人工/深度神經網絡(ANN / DNN),卷積神經網絡(CNN),循環神經網絡(RNN,LSTM,GRU),自然語言處理以及PyTorch中使用GPU訓練等內容。
數碼圖像處理 (3 學分)
本課程旨在介紹數碼圖像處理及模式識別的基本原理、方法及其應用。內容包括數碼圖像的預處理、特徵提取、分析;統計模式識別,結構模式識別及其在不同領域中的應用。學生應根據所學內容,選讀相關論文並給出相應報告。
數據可視化與可視分析 (3 學分)
本課程將主要介紹數據分析處理中常用的可視化技術, 包含對不同特徵分佈的數據進行多緯度展示,學習常用的Python繪圖模塊如Matplotlib與Seaborn等。
數據倉庫與數據挖掘 (3 學分)
本課程旨在介紹數據倉庫和數據挖掘的基本原理和技術,內容包括數據倉庫(Data Warehouse)和聯機分析(OLAP)技術,數據預處理技術(數據的清理、集成、轉換和歸約),數據挖掘技術(分類、預測、關聯和聚類),以及數據挖掘的應用和發展趨勢。
隨機過程 (3 學分)
隨機過程主要研究隨時間變化的隨機現象。本科目從工程應用的角度講授隨機過程的基本理論及其應用。內容主要包括隨機過程的基本概念、泊松過程、更新過程、馬爾可夫鏈、排隊論等。本課程培養學生使用隨機過程理論對隨機現象進行建模分析的能力。
多媒體信號與系統 (3 學分)
本科目將介紹多媒體信號的表達與處理技術, 包括各種表達多媒體信號的方法, 如: 時域, 頻域, 時-頻域及特徵域。這些表達都可用於多媒體信號的區分。亦會討論多媒體信號的濾波設計以及一些自適應的處理技術, 如隱藏Markov模型, 隨機場模型, 狀態空間模型等。
數據庫系統 (3 學分)
本科目介紹有關數據庫設計、實現和管理的基本理論。希望學生們通過這門課程的學習能夠:正確理解有關數據庫設計的概念,並且可以按照數據庫設計的步驟來完成設計;利用現有的關係數據庫管理系統來實現相應的數據庫設計方案;對於已經建立好的數據庫進行管理和維護,實現資源共享,同時維護數據的一致性。并介紹空間數據庫的概念與原理。
學習要求
1. 第一、二學期修讀完成學習計劃規定的表(一)中 7 門必修科目,共計 21 學分。 2. 第二、三學期修讀完成學習計劃規定的表(二)中列明的 3 門選修科目,共計 9 學分。 3. 學生學習完每一門科目,將按照教師要求與學院規定進行考覈。
學習時間
1. 科目修讀時間爲 18 個月,論文寫作時間不少於 6 個月。本課程最長修業期為 36 個月。 2. 課堂一般安排於週一至週五日間。
畢業資格
學生須符合下列各項規定,並經大學學術及教學委員會通過可獲頒發應用數學與數據科學碩士學位﹕ 在所屬課程之修業期內完成及通過學習計劃的要求,各科目成績(不含學位論文成績)累計平均積點不低於 2.50; 遵守大學的修讀守則; 繳清指定費用及歸還所借的大學財物。 如學生及格完成上述課程設置表的科目,累計平均積點不低於 2.50,但未能在規定時間內完成學位論文或通過論文答辯,則只可取得結業證書。 【所有課程大綱及學習計劃,均以澳門特別行政區公報所載為準】