本書介紹了互聯(lián)網(wǎng)環(huán)境下文本類型數(shù)據(jù)的分析方法,探討了當(dāng)前主流的文本挖掘技術(shù),以及這些技術(shù)在商業(yè)環(huán)境中的具體應(yīng)用。本書從算法原理和應(yīng)用場景兩方面分別對在線文本分析技術(shù)進行了介紹:從算法原理的角度,以數(shù)據(jù)挖掘和機器學(xué)習(xí)的相關(guān)知識為基礎(chǔ),介紹了以文本建模、文本分類、文本聚類、序列標(biāo)注為主要任務(wù)的文本分析方法,并對當(dāng)前主流的深度學(xué)習(xí)方法與文本分析的結(jié)合進行了討論。從應(yīng)用場景的角度,討論了文本分析技術(shù)的幾個重要實踐領(lǐng)域,包括信息檢索、內(nèi)容摘要、口碑分析、社交網(wǎng)絡(luò)分析以及智能系統(tǒng)。