注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡認證與等級考試數(shù)據分析實用技術:阿里云大數(shù)據分析師ACP認證培訓教程

數(shù)據分析實用技術:阿里云大數(shù)據分析師ACP認證培訓教程

數(shù)據分析實用技術:阿里云大數(shù)據分析師ACP認證培訓教程

定 價:¥55.00

作 者: 趙強 著
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787121419232 出版時間: 2021-09-01 包裝: 平裝
開本: 16開 頁數(shù): 264 字數(shù):  

內容簡介

  本書關注大數(shù)據分析師所需掌握的最重要的基礎能力。首先,本書闡述了大數(shù)據分析師的職業(yè)特點。其次,根據數(shù)據分析經常涉及的技術要求,按順序介紹了什么是數(shù)據庫,如何使用數(shù)據庫,大數(shù)據環(huán)境下的分布式數(shù)據庫Hadoop、阿里云MaxCompute,以及相對應的數(shù)據庫查詢語言SQL、MapReduce、Hive、Pig等基本的編程技術。為了提高數(shù)據分析工作的質量與效率,本書還詳細介紹了數(shù)據項目質量控制的理論和實踐,其中涉及了數(shù)據預處理、數(shù)據脫敏和臟數(shù)據處理的技能知識,同時介紹了在數(shù)據項目中SQL編程的優(yōu)秀實踐方法。作為一本介紹數(shù)據分析的入門書籍,本書詳細介紹了數(shù)據分析中常見的方法(如EDA),包括指標計算的一些常見形式。在企業(yè)環(huán)境中,數(shù)據分析常常以項目的形式出現(xiàn),本書也向讀者介紹了數(shù)據分析項目是如何承接、分解和實施的。最后,本書還向讀者介紹了常用的數(shù)據挖掘技術,如決策樹、聚類分析和關聯(lián)分析,讓讀者對算法在數(shù)據分析中的應用有直觀的了解。本書可作為阿里云大數(shù)據分析師ACP認證培訓的教材,也可作為高校大數(shù)據相關專業(yè)的學生教材,還可供希望從事大數(shù)據分析工作的讀者閱讀參考。

作者簡介

  趙強,杭州決明數(shù)據科技有限公司負責人,從事大數(shù)據應用與教育近20年,現(xiàn)為加拿大約克大學舒立克商學院MBA特聘教授,阿里云大學特聘專家教授。曾服務于世界500強企業(yè)中的零售、銀行、電信企業(yè)和全球性的管理咨詢公司,參與了眾多國際企業(yè)營銷和數(shù)據戰(zhàn)略規(guī)劃的制定和決策。對云計算與大數(shù)據應用結合有深刻體會,了解企業(yè)的需求,能夠幫助企業(yè)制定優(yōu)化的云計算大數(shù)據應用方案,樂于交流,愿意分享,在培訓教育行業(yè)有一定知名度。

圖書目錄

目 錄
第1章 大數(shù)據分析領域職業(yè)介紹
1.1 職業(yè)路徑
1.1.1 大數(shù)據職業(yè)生態(tài)
1.1.2 大數(shù)據工程師職業(yè)方向
1.1.3 大數(shù)據分析師職業(yè)方向
1.1.4 大數(shù)據工作入門
1.2 技能要求
1.2.1 基本職業(yè)素養(yǎng)
1.2.2 從數(shù)據中挖掘金礦
1.2.3 大數(shù)據工程師的技能要求
1.2.4 大數(shù)據分析師的技能要求
1.3 工作情況
1.3.1 典型的工作狀態(tài)
1.3.2 大數(shù)據職業(yè)的現(xiàn)狀
1.4 職業(yè)前景
1.4.1 大數(shù)據職業(yè)的發(fā)展
1.4.2 大數(shù)據的未來
1.4.3 大數(shù)據職業(yè)的規(guī)劃
第2章 初識大數(shù)據
2.1 大數(shù)據的基礎知識
2.1.1 什么是大數(shù)據
2.1.2 大數(shù)據為什么重要
2.1.3 大數(shù)據的維度
2.2 大數(shù)據的類型
2.2.1 結構化數(shù)據與非結構化數(shù)據
2.2.2 幾個大數(shù)據的例子
2.3 大數(shù)據的行業(yè)應用
2.4 企業(yè)面臨的大數(shù)據挑戰(zhàn)類型
2.4.1 大數(shù)據從何而來
2.4.2 企業(yè)如何獲取大數(shù)據
2.4.3 大數(shù)據的存儲問題
2.4.4 大數(shù)據對分析人才的要求
2.4.5 大數(shù)據帶來的挑戰(zhàn)類型
第3章 數(shù)據庫基礎
3.1 數(shù)據庫簡介
3.1.1 數(shù)據管理技術發(fā)展史
3.1.2 數(shù)據庫的應用
3.1.3 數(shù)據庫系統(tǒng)概述
3.2 關系型數(shù)據庫
3.2.1 數(shù)據模型概述
3.2.2 關系數(shù)據模型
3.2.3 E-R數(shù)據模型
3.2.4 關系型數(shù)據庫的設計原則
3.3 數(shù)據倉庫
3.3.1 數(shù)據倉庫的歷史
3.3.2 數(shù)據倉庫系統(tǒng)的組成
3.3.3 ETL
3.3.4 數(shù)據倉庫與操作型數(shù)據庫的關系
3.4 Hadoop與分布式數(shù)據存儲
3.4.1 大數(shù)據對存儲技術的挑戰(zhàn)和Hadoop的起源
3.4.2 Hadoop生態(tài)圈及系統(tǒng)架構
3.4.3 Hadoop應用場景
3.4.4 Hadoop局限性
3.5 阿里云MaxCompute
3.5.1 MaxCompute簡介
3.5.2 MaxCompute的基本概念
3.5.3 MaxCompute數(shù)據的導入導出
3.5.4 MaxCompute SQL
3.5.5 函數(shù)
3.5.6 MaxCompute MapReduce
3.5.7 MaxCompute權限與安全
3.6 常用Linux指令簡介
3.6.1 安裝和登錄指令
3.6.2 文件處理指令
3.6.3 系統(tǒng)管理相關指令
3.6.4 網絡操作指令
3.6.5 系統(tǒng)安全相關指令
3.6.6 其他指令
第4章 數(shù)據分析工具與語言
4.1 SQL基礎
4.1.1 SQL簡介
4.1.2 MySQL數(shù)據類型
4.1.3 數(shù)據定義語言
4.1.4 數(shù)據操作語言
4.1.5 join
4.1.6 數(shù)據表的合并、交集
4.1.7 SQL實用函數(shù)
4.2 MapReduce
4.2.1 MapReduce Job
4.2.2 MapReduce主程序
4.2.3 MapReduce主程序運行詳解
4.2.4 MapReduce數(shù)據流與控制流詳解
4.2.5 MapReduce小結
4.3 Hive
4.4 Pig
4.5 HDFS
4.5.1 HDFS的相關概念
4.5.2 HDFS的基本操作
4.5.3 HDFS常用的Java API介紹
第5章 數(shù)據可視化
5.1 數(shù)據可視化概念
5.1.1 數(shù)據可視化的定義與原則
5.1.2 數(shù)據可視化的設計思路
5.2 數(shù)據可視化元素
5.2.1 表格
5.2.2 柱狀圖
5.2.3 折線圖
5.2.4 餅圖
5.2.5 地圖
5.2.6 散點圖
5.2.7 其他常見圖
5.3 數(shù)據可視化設計原則
5.4 DataV設計
5.5 BI報表設計
第6章 數(shù)據項目質量控制
6.1 數(shù)據質量控制理論
6.1.1 數(shù)據質量的五個維度
6.1.2 臟數(shù)據類型
6.2 評估數(shù)據的質量及其對項目的影響
6.2.1 數(shù)據如何創(chuàng)造價值――DIK
6.2.2 數(shù)據質量問題對企業(yè)創(chuàng)造價值的影響
6.3 數(shù)據預處理
6.3.1 數(shù)據預處理的五大步驟
6.3.2 數(shù)據清洗場景
6.3.3 臟數(shù)據清洗過程
6.3.4 臟數(shù)據與臟數(shù)據清洗的基本方法
6.3.5 臟數(shù)據處理的案例
6.3.6 SQL處理臟數(shù)據示例
6.4 數(shù)據脫敏
6.4.1 確定數(shù)據脫敏對象
6.4.2 隱私數(shù)據泄露類型
6.4.3 隱私數(shù)據脫敏的要求
6.4.4 常見的數(shù)據脫敏算法
6.5 數(shù)據項目質量控制的類型
第7章 數(shù)據編程基礎
7.1 面向分析的數(shù)據編程范例
7.1.1 數(shù)據項目的特點
7.1.2 數(shù)據項目編程的流程
7.1.3 面向分析的數(shù)據編程范例
7.2 編程效率和程序運行效率
7.2.1 編程效率
7.2.2 程序運行效率
7.3 編程質量控制流程
第8章 數(shù)據項目設計與執(zhí)行
8.1 數(shù)據分析項目計劃管理流程
8.2 數(shù)據項目設計方法
8.2.1 項目目標
8.2.2 背景調查
8.2.3 分析范圍
8.2.4 分析結果交付形式
8.3 數(shù)據分析項目的分類
8.4 項目前分析和項目績效考評
第9章 數(shù)據分析技術
9.1 指標體系
9.1.1 績效指標(KPI)的定義
9.1.2 企業(yè)構建指標體系
9.1.3 平衡計分卡常見指標
9.2 數(shù)據分析
9.2.1 數(shù)據分析的定義
9.2.2 數(shù)據分析的目的
9.2.3 數(shù)據分析的作用
9.3 探索性數(shù)據分析(EDA)
9.3.1 EDA簡介
9.3.2 單一變量探索性分析
9.3.3 多變量探索性分析
9.4 探索性數(shù)據分析應用案例
9.4.1 情況介紹
9.4.2 數(shù)據介紹
9.4.3 EDA探索分析遵循銀行政策情況
9.4.4 EDA探索分析懶惰的銀行客戶代表
9.4.5 EDA探索分析銀行客戶代表是否執(zhí)行了有效的溝通
9.5 EDA中的指標變換形式
9.5.1 總量指標
9.5.2 相對指標
第10章 常用數(shù)據挖掘技術
10.1 決策樹
10.1.1 決策樹概述
10.1.2 信息熵
10.1.3 ID3算法
10.1.4 C4.5算法
10.1.5 CART算法
10.2 聚類分析
10.2.1 聚類概述
10.2.2 樣本間距離
10.2.3 K-means聚類
10.2.4 群體距離
10.2.5 層次聚類
10.2.6 聚類算法的評估
10.3 關聯(lián)分析
10.3.1 關聯(lián)規(guī)則量化指標
10.3.2 Apriori算法

本目錄推薦

掃描二維碼
Copyright ? 讀書網 afriseller.com 2005-2026, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號