目 錄
第1章 概論\t1
1.1 研究的背景和意義\t1
1.2 文本挖掘相關技術概述及研究現(xiàn)狀\t2
1.2.1 文本分類概述及研究現(xiàn)狀\t3
1.2.2 文本聚類概述及研究現(xiàn)狀\t5
1.2.3 信息抽取概述及研究現(xiàn)狀\t6
1.2.4 文本檢索概述及研究現(xiàn)狀\t7
1.3 文本挖掘領域亟待解決的問題\t8
1.4 本書的研究內容與結構安排\t11
參考文獻\t13
第2章 基于統(tǒng)計語言模型的短文本計算\t18
2.1 引言\t18
2.2 文本信息處理基礎知識\t19
2.2.1 文本的表示\t19
2.2.2 特征選擇\t21
2.3 基于N-gram的特征提取和RPCL的短文本聚類算法\t22
2.3.1 相關工作\t23
2.3.2 算法描述\t23
2.3.3 實驗及分析\t28
2.4 小結\t31
參考文獻\t31
第3章 面向廣告推薦和情感分析的Web文本信息抽取\t35
3.1 引言\t35
3.2 信息抽取常用算法和模型\t36
3.2.1 N-gram語言模型\t36
3.2.2 隱馬爾可夫模型\t37
3.2.3 最大熵模型\t38
3.3 基于隱馬爾科夫模型的半監(jiān)督中文復合詞抽取算法\t41
3.3.1 相關工作\t42
3.3.2 算法描述\t42
3.3.3 實驗及分析\t46
3.4 基于最大熵和LMR模板的中文情感詞抽取算法\t48
3.4.1 相關工作\t49
3.4.2 算法描述\t50
3.4.3 實驗及分析\t51
3.5 小結\t55
參考文獻\t55
第4章 基于監(jiān)督和半監(jiān)督的文本情感分類\t59
4.1 引言\t59
4.2 常用的監(jiān)督和半監(jiān)督文本分類算法\t60
4.2.1 常用文本分類算法\t61
4.2.2 半監(jiān)督文本分類算法\t63
4.3 文本情感分類的研究現(xiàn)狀\t66
4.3.1 主客觀分類\t66
4.3.2 情感極性分類\t66
4.4 基于帶先驗的最大熵歌詞情感分類\t68
4.4.1 相關工作\t68
4.4.2 歌詞語料集統(tǒng)計信息\t69
4.4.3 算法描述\t71
4.4.4 實驗及分析\t74
4.5 基于圖的半監(jiān)督學習文本情感分類算法\t76
4.5.1 算法描述\t77
4.5.2 實驗及分析\t79
4.6 小結\t82
參考文獻\t82
第5章 文本觀點檢索研究\t89
5.1 引言\t89
5.2 相關研究\t89
5.3 文本觀點檢索系統(tǒng)設計與評測\t90
5.3.1 COAE2008觀點檢索任務、數(shù)據及相關評測指標\t91
5.3.2 文本觀點檢索系統(tǒng)\t92
5.4 小結\t96
參考文獻\t96
第6章 總結與展望\t99
6.1 本文的工作總結\t99
6.2 未來的工作展望\t101