課程描述INTRODUCTION
· 高層管理者· 中層領(lǐng)導(dǎo)· 其他人員
日程安排SCHEDULE
課程大綱Syllabus
業(yè)務(wù)數(shù)據(jù)分析師
培訓(xùn)背景
「CDA 數(shù)據(jù)分析師人才行業(yè)標(biāo)準(zhǔn)」是面向全行業(yè)數(shù)據(jù)分析及大數(shù)據(jù)相關(guān)崗位的一套科
學(xué)化、專業(yè)化、正規(guī)化、系統(tǒng)化的人才技能準(zhǔn)則。CDA數(shù)據(jù)分析師認(rèn)證考試是評(píng)判「標(biāo)準(zhǔn)化人才」的*考核路徑。CDA考試大綱規(guī)定并明確了數(shù)據(jù)分析師認(rèn)證考試的具體范圍、內(nèi)容和知識(shí)點(diǎn),考生可按照大綱要求進(jìn)行相關(guān)知識(shí)的學(xué)習(xí),獲取技能,成為專業(yè)人才。
知識(shí)要求
針對(duì)不同知識(shí),掌握程度的要求分為【領(lǐng)會(huì)】、【熟知】、【應(yīng)用】三個(gè)級(jí)別,考生應(yīng)按照
不同知識(shí)要求進(jìn)行學(xué)習(xí)。
1.領(lǐng)會(huì):考生能夠領(lǐng)會(huì)了解規(guī)定的知識(shí)點(diǎn),并能夠了解規(guī)定知識(shí)點(diǎn)的內(nèi)涵與外延,了
解其內(nèi)容要點(diǎn)和它們之間的區(qū)別與聯(lián)系,并能做出正確的闡述、解釋和說(shuō)明。
2.熟知:考生須掌握知識(shí)的要點(diǎn),并能夠正確理解和記憶相關(guān)理論方法,能夠根據(jù)不
同要求,做出邏輯嚴(yán)密的解釋、說(shuō)明和闡述。此部分為考試的重點(diǎn)部分。
3.應(yīng)用:考生須學(xué)會(huì)將知識(shí)點(diǎn)落地實(shí)踐,并能夠結(jié)合相關(guān)工具進(jìn)行商業(yè)應(yīng)用,能夠根
據(jù)具體要求,給出問(wèn)題的具體實(shí)施流程和策略。
考試范圍
PART 1 數(shù)據(jù)分析概念與統(tǒng)計(jì)學(xué)基礎(chǔ) (占比 30%)
a. 數(shù)據(jù)分析概念、方法論、流程(占比 5%)
b. 描述性統(tǒng)計(jì)分析(占比 12%)
c. 推斷性統(tǒng)計(jì)分析(占比 8%)
d. 方差分析(占比 2%)
e. 一元線性回歸分析(占比 3%)
PART 2 SQL 數(shù)據(jù)庫(kù)基礎(chǔ) (占比 15%)
a. SQL 及關(guān)系型數(shù)據(jù)庫(kù)基本概念(占比 1%)
b. SQL 數(shù)據(jù)類型、運(yùn)算符、函數(shù)(占比 3%)
c. SQL 查詢語(yǔ)句(占比 5%)
d. SQL 連接語(yǔ)句(占比 5%)
e. SQL 其它語(yǔ)句(占比 1%)
PART 3 數(shù)據(jù)采集與處理 (占比 15%)
a. 數(shù)據(jù)采集方法(占比 5%)
b. 市場(chǎng)調(diào)研(占比 2%)
c. 數(shù)據(jù)預(yù)處理方法(占比 8%)
PART 4 數(shù)據(jù)建模分析 (占比 40%)
a. 主成分分析法(占比 4%)、因子分析法(占比 2%)
b. 系統(tǒng)聚類法(占比 2%)、K-Means 聚類法(占比 3%)
c. 對(duì)應(yīng)分析(占比 2%)、多維尺度分析(占比 2%)
d. 多元回歸分析法
多元線性回歸(占比 10%)
邏輯回歸(占比 10%)
e. 時(shí)間序列(占比 5%).
考試形式與試卷結(jié)構(gòu)
考試方式:VUE線上考試,隨約隨考
考試題型:客觀題(單選+多選)
考試時(shí)間:120 分鐘
考試成績(jī):分為 A、B、C、D 四個(gè)層次,A、B、C 為通過(guò)考試,D 為不通過(guò).
注:考試未通過(guò)者可進(jìn)行一次補(bǔ)考,補(bǔ)考費(fèi)用為六折優(yōu)惠。每個(gè)等級(jí)科目補(bǔ)考各限一次。
課程大綱
PART 1
數(shù)據(jù)分析概念與統(tǒng)計(jì)學(xué)基礎(chǔ)
1、數(shù)據(jù)分析概述
【領(lǐng)會(huì)】
數(shù)據(jù)分析和數(shù)據(jù)挖掘的概念
強(qiáng)調(diào)商業(yè)數(shù)據(jù)分析中對(duì)業(yè)務(wù)的理解
商業(yè)數(shù)據(jù)分析和預(yù)測(cè)的本質(zhì)
數(shù)據(jù)分析的8個(gè)層次
大數(shù)據(jù)對(duì)傳統(tǒng)小數(shù)據(jù)分析的拓展
【熟知】
明確數(shù)據(jù)分析目標(biāo)及意義
數(shù)據(jù)分析的過(guò)程
數(shù)據(jù)分析與數(shù)據(jù)挖掘的常用方法
CRISP-DM、SEMMA 方法論
數(shù)據(jù)分析中不同人員的角色與職責(zé)
2、描述性統(tǒng)計(jì)分析
【領(lǐng)會(huì)】
數(shù)據(jù)的計(jì)量尺度
數(shù)據(jù)的集中趨勢(shì)、離中趨勢(shì)和數(shù)據(jù)分布的概念
統(tǒng)計(jì)圖的概念
各種統(tǒng)計(jì)圖的含義和畫(huà)法
【熟知】
衡量數(shù)據(jù)集中趨勢(shì)、離中趨勢(shì)和數(shù)據(jù)分布的常用指標(biāo)及計(jì)算方法統(tǒng)計(jì)圖形的繪制、圖形元素的調(diào)整、可視化效果,主要涉及條形圖、線圖、直方圖、盒須圖、散點(diǎn)圖、氣泡圖、馬賽克圖、玫瑰圖及其多種圖形整合。明確統(tǒng)計(jì)圖形對(duì)統(tǒng)計(jì)指標(biāo)表達(dá)上的對(duì)應(yīng)關(guān)系
【應(yīng)用】
根據(jù)不同數(shù)據(jù)類型選用不同的統(tǒng)計(jì)指標(biāo)來(lái)進(jìn)行數(shù)據(jù)的集中趨勢(shì)、離中趨勢(shì)和數(shù)據(jù)分布的衡量,不同統(tǒng)計(jì)圖的使用場(chǎng)景。會(huì)寫(xiě)數(shù)據(jù)分析報(bào)告和結(jié)合業(yè)務(wù)需求對(duì)報(bào)告進(jìn)行合理解釋,對(duì)業(yè)務(wù)?出建設(shè)性意見(jiàn)建議。
3、抽樣估計(jì)
【領(lǐng)會(huì)】
隨機(jī)試驗(yàn)、隨機(jī)事件、隨機(jī)變量的概念
總體與樣本的概念
抽樣估計(jì)的理論基礎(chǔ)
正態(tài)分布及三大分布的函數(shù)形式和圖像形式
抽樣的多種組織形式
確定必要樣本容量的原因
【熟知】
隨機(jī)事件的概率
抽樣平均誤差的概念與數(shù)學(xué)性質(zhì)
點(diǎn)估計(jì)與區(qū)間估計(jì)方法的特點(diǎn)與優(yōu)缺點(diǎn)
全體總體與樣本總體
參數(shù)和統(tǒng)計(jì)量
重復(fù)抽樣與不重復(fù)抽樣
抽樣誤差的概念對(duì)總體平均數(shù)和總體成數(shù)的區(qū)間估計(jì)方法
必要樣本容量的影響因素
中心極限定理的意義與應(yīng)用
【應(yīng)用】
隨機(jī)變量及其概率分布
全部可能的樣本單位數(shù)目的概念及其在不同抽樣方法下的確定
抽樣平均誤差在實(shí)際數(shù)據(jù)分析中的計(jì)算方法
4、假設(shè)檢驗(yàn)
【領(lǐng)會(huì)】
假設(shè)檢驗(yàn)的基本概念
其基本思想在數(shù)據(jù)分析中的作用
假設(shè)檢驗(yàn)的基本步驟
假設(shè)檢驗(yàn)與區(qū)間估計(jì)的聯(lián)系
假設(shè)檢驗(yàn)中的兩類錯(cuò)誤
【熟知】
P值的含義及計(jì)算
如何利用P值進(jìn)行檢驗(yàn)
z檢驗(yàn)統(tǒng)計(jì)量
t檢驗(yàn)統(tǒng)計(jì)量
F檢驗(yàn)統(tǒng)計(jì)量
c2檢驗(yàn)統(tǒng)計(jì)量的函數(shù)形式和檢驗(yàn)步驟
【應(yīng)用】
實(shí)現(xiàn)單樣本t檢驗(yàn)
兩獨(dú)立樣本t檢驗(yàn)的步驟和檢驗(yàn)中使用的統(tǒng)計(jì)量與原假設(shè)
兩種檢驗(yàn)應(yīng)用的數(shù)據(jù)分析場(chǎng)景。
5、方差分析
【領(lǐng)會(huì)】
方差分析的相關(guān)概念
單因素方差分析的原理
統(tǒng)計(jì)量構(gòu)造過(guò)程
【熟知】
單因素方差分析的基本步驟
總離差平方和(SST)的含義及計(jì)算
組間離差平方和(SSA)的含義及計(jì)算
組內(nèi)離差平方和(SSE)的含義及計(jì)算
單因素方差分析的原假設(shè)
【應(yīng)用】
實(shí)現(xiàn)單因素方差分析的步驟
對(duì)方差分析表的分析以及多重比較表的分析
6、簡(jiǎn)單線性回歸分析
【領(lǐng)會(huì)】
相關(guān)圖的繪制與作用
相關(guān)表的編制與作用
相關(guān)系數(shù)定義公式的字母含義
估計(jì)標(biāo)準(zhǔn)誤差與相關(guān)系數(shù)的關(guān)系
【熟知】
相關(guān)關(guān)系的概念與特點(diǎn)
相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別與聯(lián)系
相關(guān)關(guān)系的種類
相關(guān)系數(shù)的意義以及利用相關(guān)系數(shù)的具體數(shù)值對(duì)現(xiàn)象相關(guān)等級(jí)的劃分
回歸分析的概念
回歸分析的主要內(nèi)容和特點(diǎn)
建立一元線性回歸方程的條件
應(yīng)用回歸分析應(yīng)注意的問(wèn)題
估計(jì)標(biāo)準(zhǔn)誤差的意義及計(jì)算
【應(yīng)用】
運(yùn)用簡(jiǎn)捷法公式計(jì)算相關(guān)系數(shù)
相關(guān)分析分析中應(yīng)注意的問(wèn)題
回歸分析與相關(guān)分析的區(qū)別與聯(lián)系
PART 2
SQL數(shù)據(jù)庫(kù)基礎(chǔ)
1、SQL 基礎(chǔ)概念
【領(lǐng)會(huì)】
關(guān)系型數(shù)據(jù)庫(kù)基本概念、屬性
主鍵
外鍵
E-R 圖
ANSI-SQL 以及不同的數(shù)據(jù)庫(kù)實(shí)現(xiàn)的關(guān)系
【熟知】
邏輯運(yùn)算符
比較運(yùn)算符
算術(shù)運(yùn)算符
通配符
2、SQL 查詢語(yǔ)句
【應(yīng)用】
select 語(yǔ)句
包括查詢單列
多列,去重,前 N 列
from 語(yǔ)句、where 語(yǔ)句、group by 語(yǔ)句、having 語(yǔ)句、order by 語(yǔ)句、子查詢
SQL 聚合函數(shù),包括 count、sum、avg、max、min 等
3、SQL 連接語(yǔ)句
【領(lǐng)會(huì)】
表的連接類型,包括內(nèi)連接(等值、不等值)、外連接(左、右、全)、交叉連接(笛卡
爾連接)
查詢的集合操作,只包括并集操作
【應(yīng)用】
inner join 的用法
left/right/full join 的用法
cross join 的用法
union 的用法
4、其它 SQL 語(yǔ)句
【領(lǐng)會(huì)】
表的創(chuàng)建
視圖及索引的概念及創(chuàng)建
數(shù)據(jù)插入、更新、刪除
【領(lǐng)會(huì)】
高級(jí)函數(shù),如 Oracle 或 Hive 中的 row number over partition by、正則匹配等
PART 3
數(shù)據(jù)采集與處理
1、數(shù)據(jù)采集方法
【領(lǐng)會(huì)】
一手?jǐn)?shù)據(jù)與二手?jǐn)?shù)據(jù)來(lái)源渠道
優(yōu)劣勢(shì)分析
使用注意事項(xiàng)
【熟知】
一手?jǐn)?shù)據(jù)采集中的概率抽樣與非概率抽樣的區(qū)別與優(yōu)缺點(diǎn)
【運(yùn)用】
概率抽樣方法,包括簡(jiǎn)單隨機(jī)抽樣、分層抽樣、系統(tǒng)抽樣、分段抽樣
明確每種抽樣的優(yōu)缺點(diǎn)
根據(jù)給定條件選擇最可行的抽樣方式
計(jì)算簡(jiǎn)單隨機(jī)抽樣所需的樣本量
市場(chǎng)調(diào)研
【熟知】
市場(chǎng)調(diào)研的基本步驟(?出問(wèn)題、調(diào)查收集材料、分析預(yù)測(cè)問(wèn)題)
單選題及多項(xiàng)選擇題的設(shè)置
數(shù)據(jù)編碼及錄入
數(shù)據(jù)預(yù)處理方法
【熟知】
數(shù)據(jù)預(yù)處理的基本步驟,包括數(shù)據(jù)集成(不同數(shù)據(jù)源的整合)、數(shù)據(jù)探索、數(shù)據(jù)變換(標(biāo)
準(zhǔn)化)、數(shù)據(jù)歸約(維度歸約技術(shù)、數(shù)值歸約技術(shù)),這部分內(nèi)容不需要涉及計(jì)算,只需要根
據(jù)需求明確可選的處理技術(shù)即可。
【應(yīng)用】
數(shù)據(jù)清洗,包括填補(bǔ)遺漏的數(shù)據(jù)值(根據(jù)業(yè)務(wù)場(chǎng)景使用常數(shù)、中位數(shù)、眾數(shù)等方法,不
涉及多重查補(bǔ)的方法)、平滑有噪聲數(shù)據(jù)(移動(dòng)平均)、識(shí)別或除去異常值(單變量根據(jù)中心
標(biāo)準(zhǔn)化值,多變量使用快速聚類),以及解決不一致問(wèn)題(熟知概念即可),查重(只考核
SQL 的語(yǔ)句,不涉及 R、SAS 等其它語(yǔ)言)。
PART 4
數(shù)據(jù)建模分析
總體要求
領(lǐng)會(huì)模型基本原理,數(shù)值模型操作流程,懂得模型應(yīng)用場(chǎng)景,能夠完成數(shù)據(jù)建模分析報(bào)告。1、描述性數(shù)據(jù)分析/挖掘方法——主成分分析
【領(lǐng)會(huì)】
主成分分析的計(jì)算步驟
主成分分析中對(duì)變量自身分布和多變量之間關(guān)系的假設(shè)以及模型設(shè)置
【熟知】
適用于主成分分析的變量度量類型。通過(guò)分析結(jié)果,選取合適的保留主成分的個(gè)數(shù),注意區(qū)分兩種不同的分析目的(盡量壓縮變量、避免共線性情況下保留更多信息)保留主成分
個(gè)數(shù)的評(píng)判標(biāo)準(zhǔn)的差異。
【應(yīng)用】
在深入理解主成分的意義的基礎(chǔ)之上,在遇到業(yè)務(wù)問(wèn)題時(shí),有能力決定是否使用主成分分析方法;有能力決定何時(shí)采用相關(guān)系數(shù)計(jì)算方法和協(xié)方差矩陣計(jì)算方法;有能力解釋主成分得分的結(jié)果;根據(jù)變量分布情況進(jìn)行函數(shù)轉(zhuǎn)換。
2、描述性數(shù)據(jù)分析/挖掘方法——因子分析
【領(lǐng)會(huì)】
了解因子分析模型設(shè)置,只需要關(guān)注主成分法的計(jì)算步驟
【熟知】
適用于因子分析的變量度量類型。通過(guò)分析結(jié)果,選取合適的因子個(gè)數(shù);
知道最常用的因子旋轉(zhuǎn)的方法。
【應(yīng)用】
在遇到業(yè)務(wù)問(wèn)題時(shí),有能力決定是否使用因子分析,還是使用主成分分析方法就可以了;有能力根據(jù)原始變量在各因子上的權(quán)重明確每個(gè)因子的意義;有能力對(duì)大量變量進(jìn)行維度分析,分維度打分,并比較與專家打分(德?tīng)柗品ǎ┑膮^(qū)別;在聚類前對(duì)數(shù)據(jù)進(jìn)行描述,發(fā)現(xiàn)理想的聚類方式和數(shù)量。
3、描述性數(shù)據(jù)分析/挖掘方法——聚類分析
【領(lǐng)會(huì)】
多種聚類算法的特點(diǎn)
【熟知】
聚類方法的基本邏輯
系統(tǒng)聚類和 K-Means 聚類的基本算法和優(yōu)缺點(diǎn)
系統(tǒng)聚類的計(jì)算步驟,包括兩點(diǎn)距離、兩類合并的計(jì)算方法
系統(tǒng)聚類法中選擇最優(yōu)聚類數(shù)量的方法
K-Means 聚類的基本算法
聚類分析變量標(biāo)準(zhǔn)化的原因和計(jì)算方法
變量需要進(jìn)行主成分分析的原因
變量進(jìn)行函數(shù)轉(zhuǎn)化的原因和計(jì)算方法
【應(yīng)用】
結(jié)合客戶畫(huà)像、客戶細(xì)分、商品聚類、離群值檢驗(yàn)(欺詐、反洗錢)等業(yè)務(wù)運(yùn)用場(chǎng)景,選取合適的聚類方法與步驟
聚類事后分析,根據(jù)聚類后變量分布情況獲取每類的特征
4、描述性數(shù)據(jù)分析/挖掘方法——對(duì)應(yīng)分析
【領(lǐng)會(huì)】
對(duì)應(yīng)分析的算法
【熟知】
適用于對(duì)應(yīng)分析的變量度量類型
對(duì)應(yīng)分析與列聯(lián)表分析、主成分分析的關(guān)系
這種方法優(yōu)缺點(diǎn)及如何與其它模型結(jié)合使用
【應(yīng)用】
對(duì)應(yīng)分析使用的指標(biāo)如何量化及其常見(jiàn)的量化方式
在客戶滿意度分析、市場(chǎng)績(jī)效及產(chǎn)品細(xì)分等場(chǎng)景下的運(yùn)用
雙標(biāo)圖的可視化、解釋與意義擴(kuò)展
5、描述性數(shù)據(jù)分析/挖掘方法——多維尺度分析
【領(lǐng)會(huì)】
多維尺度分析的算法。
【熟知】
適用于多維尺度分析的變量度量類型
該分析方法和主成分分析、因子分析、對(duì)應(yīng)分析的異同點(diǎn),尤其是和因子分析的區(qū)別
【應(yīng)用】
多維尺度分析在客戶產(chǎn)品感知圖等方面的運(yùn)用
6、預(yù)測(cè)性數(shù)據(jù)分析方法——線性回歸與模型診斷及優(yōu)化
【領(lǐng)會(huì)】
線性回歸系數(shù)的計(jì)算公式
【熟知】
明確線性回歸的 6 個(gè)經(jīng)典假設(shè)(線性模型、不存在共線性、殘差期望為 0、同方差、正態(tài)性、隨機(jī)抽樣
明確違反前 5 個(gè)假設(shè)后出現(xiàn)的問(wèn)題
模型是否違反前 5 個(gè)經(jīng)典假設(shè)的檢驗(yàn)方法與模型糾正的方法
變量篩選方法
離群值、指標(biāo)計(jì)算方法
明晰橫截面和時(shí)間序列數(shù)據(jù)在回歸建模上的差異
【應(yīng)用】
結(jié)合業(yè)務(wù)構(gòu)建回歸模型并且解釋回歸系數(shù)
根據(jù)業(yè)務(wù)場(chǎng)景與變量分布情況進(jìn)行函數(shù)轉(zhuǎn)換
解釋變量為分類變量時(shí)的處理方法
區(qū)分預(yù)測(cè)性建模與解釋性建模的關(guān)系
使用結(jié)果進(jìn)行新樣本預(yù)測(cè)
進(jìn)行客戶價(jià)值分析的基本步驟與注意事項(xiàng)
7、預(yù)測(cè)性數(shù)據(jù)分析方法——構(gòu)造對(duì)二分類變量的預(yù)測(cè)模型
【領(lǐng)會(huì)】
卡方檢驗(yàn)計(jì)算公式
二分類邏輯回歸的計(jì)算公式
【熟知】
分類變量是否存在相關(guān)關(guān)系的描述方法和檢驗(yàn)方法,涉及列聯(lián)表分析、卡方檢驗(yàn)
似然比與 Logit 轉(zhuǎn)換
二分類邏輯回歸模型構(gòu)建與變量篩選
模型評(píng)估的方法,涉及混淆矩陣、ROC 曲線
【應(yīng)用】
結(jié)合業(yè)務(wù)構(gòu)建回歸模型并且解釋回歸系數(shù)
根據(jù)業(yè)務(wù)場(chǎng)景與變量分布情況進(jìn)行函數(shù)轉(zhuǎn)換
使用結(jié)果進(jìn)行新樣本預(yù)測(cè)
進(jìn)行客戶流失預(yù)測(cè)、信用評(píng)級(jí)、精準(zhǔn)營(yíng)銷等模型的基本步驟與注意事項(xiàng)
8、時(shí)間序列
【領(lǐng)會(huì)】
明確趨勢(shì)分解法、ARIMA 方法、時(shí)間序列回歸方法的差異和適用場(chǎng)景
明確每種方法的計(jì)算方法
【熟知】
趨勢(shì)分解法,涉及乘法模型、加法模型
ARIMA 方法的具體步驟;時(shí)間序列回歸的方法
【應(yīng)用】
結(jié)合業(yè)務(wù)(業(yè)績(jī)預(yù)測(cè)、預(yù)警),選取合適的分析方法
進(jìn)行業(yè)務(wù)時(shí)間序列預(yù)測(cè)等模型的基本步驟與注意事項(xiàng)
業(yè)務(wù)數(shù)據(jù)分析師
轉(zhuǎn)載:http://szsxbj.com/gkk_detail/282772.html
已開(kāi)課時(shí)間Have start time
相關(guān)認(rèn)證內(nèi)訓(xùn)
- ESG分析師項(xiàng)目
- ISO9001:2015& 劉毅
- 儀器計(jì)量員職業(yè)資格認(rèn)證培訓(xùn)
- 基金從業(yè)資格全國(guó)統(tǒng)一考試考 黃德權(quán)
- 注冊(cè)職業(yè)采購(gòu)經(jīng)理(CPPM
- ISO45001:2018 李安強(qiáng)
- QC080000:2017 劉毅
- ISO TS22163-2 劉毅
- ISO14001:2015 李安強(qiáng)
- BRC2022新版貫標(biāo)培訓(xùn) 劉毅
- AS9100D:2016航 許艷波
- 中級(jí)經(jīng)濟(jì)師考試輔導(dǎo) 黃德權(quán)