課程描述INTRODUCTION
數(shù)據(jù)挖掘與大數(shù)據(jù)技術
日程安排SCHEDULE
課程大綱Syllabus
數(shù)據(jù)挖掘與大數(shù)據(jù)技術
課程簡介:
本次課程將介紹數(shù)據(jù)挖掘與大數(shù)據(jù)技術的基本理論和體系架構,通過大型數(shù)據(jù)挖掘和大數(shù)據(jù)處理項目案例闡述數(shù)據(jù)挖掘和大數(shù)據(jù)項目的實施過程和方法。通過實際應用案例講解數(shù)據(jù)清洗、數(shù)據(jù)預處理、數(shù)據(jù)挖掘算法等重要概念。詳細講解構建數(shù)據(jù)挖掘體系的核心方法和技術,并結合實際項目搭建數(shù)據(jù)挖掘環(huán)境。熟悉主流數(shù)據(jù)挖掘廠商及相關軟件產(chǎn)品的操作和使用。
課程特點:
1、 培訓過程中將以大型項目案例為背景,逐步講解整個數(shù)據(jù)挖掘的設計過程和實施方法
2、 課程將以深入淺出的案例讓學員輕松掌握數(shù)據(jù)挖掘相關概念和技術
3、 課程的重點是項目實施,將深入探討數(shù)據(jù)挖掘項目的實施問題,逐一解決項目實施過程中所遇到的問題和處理技巧
4、 結合動手實驗和小而精的例子,使學員充分理解數(shù)據(jù)挖掘架構設計和相關實施工具的使用
課程大綱:
專題一:數(shù)據(jù)挖掘基礎知識
內容一:數(shù)據(jù)挖掘基本概念
1、 數(shù)據(jù)挖掘的來源
2、 數(shù)據(jù)挖掘的定義
3、 數(shù)據(jù)挖掘的應用領域
4、 數(shù)據(jù)挖掘的行業(yè)背景
內容二:BI的架構
1、BI體系介紹
2、數(shù)據(jù)倉庫介紹
3、ETL介紹
4、多維數(shù)據(jù)庫介紹
5、前端展現(xiàn)介紹
6、數(shù)據(jù)挖掘模型介紹
內容三、數(shù)據(jù)挖掘在行業(yè)中的應用
1、現(xiàn)代企業(yè)數(shù)據(jù)挖掘需求概述
2、電信行業(yè)案例分析
3、金融行業(yè)案例研究
4、銷售行業(yè)案例分析
5、BI系統(tǒng)數(shù)據(jù)更新與維護
介紹數(shù)據(jù)挖掘基本概念,BI體系架構, 數(shù)據(jù)挖掘工具介紹及其應用,針對電信等行業(yè)提供行業(yè)解決方案和案例分析。
專題二:數(shù)據(jù)挖掘架構設計與完整流程詳解
內容一:九種數(shù)據(jù)挖掘算法
1、 九種挖掘算法應用的背景
2、 決策樹算法與模型設計
3、 聚類算法與模型設計
4、 關聯(lián)規(guī)則算法與模型設計
5、 貝葉斯算法與模型設計
6、 時間序列算法與模型設計
7、 其他挖掘算法與模型設計
內容二:常用挖掘模型詳解
1、決策樹算法詳解及工具實現(xiàn)
2、聚類算法詳解及工具實現(xiàn)
3、關聯(lián)規(guī)則算法詳解及工具實現(xiàn)
4、貝葉斯算法詳解及工具實現(xiàn)
5、時間序列算法詳解及工具實現(xiàn)
6、數(shù)據(jù)挖掘模型評估
內容三:數(shù)據(jù)挖掘的流程
1、數(shù)據(jù)清洗準備
2、數(shù)據(jù)預處理
3、選擇數(shù)據(jù)挖掘模型
4、數(shù)據(jù)挖掘模型訓練
5、更新算法模型
6、模型評估
7、部署與應用
內容四:DMX語言
1、DMX語法結構
2、使用DMX創(chuàng)建挖掘模型
3、使用DMX將挖掘結果導出
4、使用DMX進行挖掘模型參數(shù)設置
九種數(shù)據(jù)挖掘算法與模型詳解,數(shù)據(jù)挖掘的設計與實施流程,數(shù)據(jù)挖掘查詢語言的使用等,重點對決策樹算法、關聯(lián)規(guī)則算法、聚類算法等給出詳細設計和處理流程。
專題三:大數(shù)據(jù)處理優(yōu)化部分
內容一:大數(shù)據(jù)的特點
1、什么是大數(shù)據(jù)
2、大數(shù)據(jù)的特點
3、大數(shù)據(jù)在行業(yè)中的應用
內容二:大數(shù)據(jù)優(yōu)化方法詳解
1、大數(shù)據(jù)分區(qū)處理
2、使用中間表和臨時表
3、分批次處理與并行計算
4、建立廣泛的索引
5、建立緩存機制
6、使用文本和二進制格式進行處理
7、定制強大的清洗規(guī)則和出錯處理機制
8、建立視圖或者物化視圖
9、其他優(yōu)化方法總結
內容三:數(shù)據(jù)倉庫中大數(shù)據(jù)的處理方式
1、數(shù)據(jù)倉庫中的大數(shù)據(jù)特點
2、數(shù)據(jù)倉庫中的大數(shù)據(jù)的處理方式
3、分布式數(shù)據(jù)倉庫的特點及應用
內容四:大數(shù)據(jù)高級應用
1、大型項目中大數(shù)據(jù)的優(yōu)化案例分析
2、使用大數(shù)據(jù)優(yōu)化工具
3、數(shù)據(jù)倉庫中的大數(shù)據(jù)性能調優(yōu)技巧
4、未來大數(shù)據(jù)的發(fā)展方向
大數(shù)據(jù)的概念、特點以及大數(shù)據(jù)的優(yōu)化方法,數(shù)據(jù)倉庫項目中大數(shù)據(jù)的處理方式以及大數(shù)據(jù)的高級應用等,針對大型數(shù)據(jù)倉庫項目提供了完備的大數(shù)據(jù)優(yōu)化解決方案。
專題四:數(shù)據(jù)挖掘與大數(shù)據(jù)項目案例分析
內容一:中國電信數(shù)據(jù)挖掘項目
1、項目介紹
2、復雜多系統(tǒng)多數(shù)據(jù)源的特點
3、ODS的使用
4、整體項目架構設計
5、數(shù)據(jù)挖掘算法選取
6、數(shù)據(jù)挖掘模型設計
7、數(shù)據(jù)挖掘處理流程
8、數(shù)據(jù)抽取策略的制定
8、挖掘模型的更新技巧
內容二:Search Funnel數(shù)據(jù)挖掘項目
1、項目介紹
2、項目中的海量數(shù)據(jù)
3、數(shù)據(jù)挖掘算法
4、數(shù)據(jù)挖掘模型構建
5、數(shù)據(jù)的預處理技術
6、對挖掘模型進行訓練
7、展示數(shù)據(jù)挖掘模型結果
8、數(shù)據(jù)挖掘模型評估
內容三:MSN大數(shù)據(jù)處理項目
1、項目介紹
2、項目中的超海量數(shù)據(jù)
3、大數(shù)據(jù)處理所遇到的問題
4、使用并行處理和計算
5、大數(shù)據(jù)項目中的數(shù)據(jù)挖掘模型處理
6、項目中的報表展現(xiàn)
7、大數(shù)據(jù)處理思路總結
內容四:AdventureWorks整體項目案例
1、案例介紹
2、ETL流程詳解
3、OLAP流程詳解
4、前端報表流程詳解
5、數(shù)據(jù)挖掘流程詳解
總結
大型數(shù)據(jù)倉庫與數(shù)據(jù)挖掘項目設計和實施,重點對項目架構設計和數(shù)據(jù)完整處理流程做重點分析和詳細介紹,針對大型數(shù)據(jù)挖掘項目,提供了完備的解決方案,給出完整設計思路和數(shù)據(jù)處理技術應用。
數(shù)據(jù)挖掘與大數(shù)據(jù)技術
轉載:http://szsxbj.com/gkk_detail/257420.html
已開課時間Have start time
- 張曉誠
大數(shù)據(jù)營銷內訓
- 數(shù)字經(jīng)濟基礎和企業(yè)數(shù)字化轉 盧森煌
- 數(shù)字化轉型與新質生產(chǎn)力 盧森煌
- 管理者數(shù)據(jù)能力晉級 宋致旸
- 大數(shù)據(jù)時代下服務營銷新思維 秦超
- 商業(yè)銀行數(shù)據(jù)治理體系建設實 馬慶
- 數(shù)字金融與智能金融下的智慧 盧森煌
- 《小紅書運營策劃與執(zhí)行》 黃光偉
- 《企業(yè)數(shù)據(jù)管理與數(shù)據(jù)資產(chǎn)化 張光利
- 《零售行業(yè)社群團購運營》 陳蕊
- 企業(yè)區(qū)塊鏈技術的應用場景與 李璐
- 大數(shù)據(jù)行業(yè)的現(xiàn)狀與熱點 徐全
- 數(shù)字媒體和數(shù)字教學 鐘理勇