《數(shù)據(jù)挖掘與應(yīng)用:以SAS和R為工具(第二版)》是數(shù)據(jù)挖掘領(lǐng)域的經(jīng)典教材,基于北京大學(xué)光華管理學(xué)院“數(shù)據(jù)挖掘與應(yīng)用”課程。書中系統(tǒng)、全面地介紹了數(shù)據(jù)挖掘領(lǐng)域的理論、技術(shù)工具以及實(shí)踐方法。主要內(nèi)容包括:數(shù)據(jù)挖掘方法論、數(shù)據(jù)理解和數(shù)據(jù)準(zhǔn)備、缺失數(shù)據(jù)、關(guān)聯(lián)規(guī)則挖掘、多元統(tǒng)計(jì)降維、聚類分析、線性回歸和廣義線性回歸、回歸模型規(guī)則化、神經(jīng)網(wǎng)絡(luò)、決策樹、支持向量機(jī)、模型評(píng)估、模型組合、協(xié)同過濾等?!性诿糠N數(shù)據(jù)挖掘技術(shù)后,均輔以大量醫(yī)療、金融、營銷、保險(xiǎn)、政府部門等應(yīng)用案例,并均配有相關(guān)應(yīng)用的SAS和R語言代碼,以及視頻課程二維碼?!〉诙娓拢旱诙嬖陬^一版的基礎(chǔ)上,增加了缺失數(shù)據(jù)、回歸模型中的規(guī)則化和變量選擇、卷積神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、協(xié)同過濾這5章內(nèi)容。在已有各章內(nèi),本書亦增加了新的內(nèi)容和示例。近些年來,R因?yàn)槠渥杂?、免費(fèi)、開源,已經(jīng)發(fā)展為數(shù)據(jù)分析領(lǐng)域強(qiáng)大的軟件之一。因此,本書除了繼續(xù)展示SAS程序,還增加了R程序。