課程背景:
我們正生活在一個信息爆炸的時代。全球主干通信網每天傳輸數萬兆兆字節數據。醫療保健業由醫療記錄、病人監護和醫學圖像產生大量數據。搜索引擎支持的數十億次Web搜索每天處理數萬兆兆字節數據。社團和社會化媒體已經成為日趨重要的數據源,產生數字圖像、視頻、網絡博客、網絡社區和形形色色的社會網絡。產生海量數據的數據源不勝枚舉。
數據的爆炸式增長、廣泛可用和巨大數量使得我們的時代成為真正的數據時代。急需功能強大和通用的工具,以便從這些海量數據中發現有價值的信息,把這些數據轉化成有組織的知識。這種需求導致了數據挖掘的誕生。這個領域是年青的、動態變化的、生機勃勃的。數據挖掘已經并且將繼續在我們從數據時代大步跨入信息時代的歷程中做出貢獻。
在本課程中,您將學習如何使用Tableau數據可視化工具進行數據挖掘及可視化工作。Tableau是Tableau軟件公司創建的一個數據可視化程序。它能夠查詢各種數據集,包括關系型數據庫、電子表格和基于云的資源,以生成圖形、交互式可視化和其他可視化分析工具。本課程將基于Tableau對新冠疫情數據進行挖掘及可視化展示,以此鍛煉學員的數據分析意識。
課程大綱
一: 為什么我們需要數據挖掘?
1、 什么是數據挖掘?——海量數據中尋找有價值的信息
2、 數據挖掘如何改變我們的生活?——推薦系統及精準營銷
3、 數據挖掘對企業的意義——用戶是業務的中心,用戶數據是關鍵資產
二:Tableau功能介紹
1、 工具準備
a) Tableau使用概述
b) 安裝Tableau
2、 連接及準備數據
a) 數據文件連接
b) 數據庫連接
三:創建**個儀表盤
1、 排序
2、 分層與分組
a) 分層
b) 分組
3、 參數設置
4、 語法操作
a) 主要功能函數簡介
b) 快速表計算簡介
5、 可視化
a) 地圖
b) 條形圖
c) 折線圖
d) 餅圖
e) 嵌套條形圖
f) 熱圖
g) 散點圖
h) 甘特圖
i) 直方圖
j) 詞云
6、 設計動態儀表盤
a) 新建一個儀表盤
b) 使用儀表盤的注意事項
三:Tableau實戰演練
1、 應用Tableau構建新冠疫情數據儀表盤
2、 應用Tableau分析特朗普的推特數據