任何組織或個(gè)人只要搶先一步掌握大數據, 就會(huì )奠定至關(guān)重要的競爭優(yōu)勢, 就像在小數
據時(shí)代占據先機進(jìn)行數據分析的人能在競爭者中脫穎而出一樣。
因此,數據分析師將會(huì )成為一個(gè)黃金職業(yè)。

步驟1 從識別問(wèn)題開(kāi)始
一位定量分析師所做的工作始于認識一個(gè)問(wèn)題或決策, 然后才開(kāi)始解決問(wèn)題。
如果你不能針對下面的大部分問(wèn)題給出肯定的回答, 那你的項目可能從一開(kāi)始就會(huì )陷入困境:
- 哪些高管和定量分析項目的成功息息相關(guān)?
- 他們是否對存在的問(wèn)題和問(wèn)題的解決方案有一個(gè)大概的了解?
- 他們是否有能力提供必要的資源? 是否有能力推進(jìn)定量分析項目成功所必須的業(yè)務(wù)變革?
- 他們是否都支持在決策制定過(guò)程中使用分析和數據?
- 你所推薦的分析案例和交流方式是否與他們常用的思維與決策方式相一致?
- 你是否計劃向他們提供定期反饋和階段性成果報告?

步驟2 回顧之前的問(wèn)題
一旦問(wèn)題被識別, 就應該對所有與之相關(guān)的之前的發(fā)現進(jìn)行調查。 回顧之前的發(fā)現仍然屬于分析( 構建問(wèn)題) 的*階段中的一個(gè)步驟, 因為調查之前的發(fā)現能幫助分析師和決策者思考他們想解決的問(wèn)題到目前為止是如何被構建的, 以及這個(gè)問(wèn)題可能以何種不同的方式被概念化。
你可以嘗試問(wèn)如下問(wèn)題:
- 你已經(jīng)很好地構建問(wèn)題了嗎?
- 你是否已經(jīng)定義了一個(gè)清晰的問(wèn)題或機會(huì )來(lái)解決企業(yè)里非常重要的問(wèn)題?
- 你是否已經(jīng)考慮了多種選擇方式來(lái)解決問(wèn)題?
- 你是否已經(jīng)識別出這個(gè)問(wèn)題的利益相關(guān)者, 且針對這個(gè)問(wèn)題你已經(jīng)和這些利益相關(guān)者進(jìn)行了廣泛的交流?
- 剛開(kāi)始時(shí), 你對問(wèn)題是否有一個(gè)較廣泛的定義, 到后來(lái)縮小到一個(gè)需要解決、 需要應用數據以及明確可能出現的結果的非常確切的問(wèn)題?

步驟3 簡(jiǎn)化數據模型
" 簡(jiǎn)化" 是要我們必須舍棄所有非必須的和無(wú)關(guān)緊要的細節, 并保留*重要的、 *有效的、 *關(guān)鍵的且會(huì )造成影響的特征。
每當你建立一個(gè)模型時(shí), 都必須是有選擇性的。 你必須識別現實(shí)世界中與這個(gè)模型相關(guān)的因素, 并忽略其他不相關(guān)的因素。 你必須建立一個(gè)簡(jiǎn)化的模型世界, 它能讓你聚焦于當下設法解決的問(wèn)題。
你可以嘗試問(wèn)如下問(wèn)題:
- 我們需要同時(shí)分析多少變量? 分析一個(gè)變量( 單變量模型) 、 兩個(gè)變量( 雙變量模型) 還是三個(gè)或更多變量( 多變量模型) 的概率。
- 我們需要得到描述性或推論性問(wèn)題的答案嗎? 描述統計學(xué)( Descriptive Statistics) 簡(jiǎn)單地描述了你擁有的數據, 均值、 中值和標準差是描述統計學(xué)的典型案例。
- 在感興趣的變量中, 什么樣的測量水平是可行的?

步驟4 收集與測量數據
測量變量的4種方式為:
二元變量: 這種變量只有兩個(gè)值, 并且根據統計分析的目的, 通常*好是把它們身上存在或缺失某種東西的值定義為1或0。 這樣的例子可以是你要么是女性要么是男性( 沒(méi)有女
性特征被記錄為0, 女性則被記錄為1) , 或者你是否是美國公民。
分類(lèi)( 或者稱(chēng)為名義) 變量: 對于這種變量的值, 存在多種可能的分類(lèi), 比如眼睛的顏色、 冰激凌的口味。 因為這些因素很難被轉變成增加或減少會(huì )產(chǎn)生意義差別的數字, 所以針對分類(lèi)數據有一類(lèi)特殊的統計數據。
序變量: 這些變量有一些分配給它們的數字, 并且數字越大就意味著(zhù)相應的變量存在的越多。 然而, 1和2之間的差別可能與5和6之間的差別不盡相同。
數值( 間隔和比率) 變量: 這些變量擁有標準的數值單位,比如以磅或千克計量的重量, 或以英尺或厘米計量的高度。數值越大就意味著(zhù)相應的變量存在的越多。 另外, 數值變量
非常適用于像相關(guān)分析和回歸分析這樣的普通統計方法。

步驟5 數據分析
數據分析需要找到恒定的模式; 換言之, 就是蘊含在數據中的變量之間的關(guān)系。 當你看到模式浮現出來(lái)時(shí), 解釋數字就會(huì )變得更加容易。 當你從變量中提煉出這些模式時(shí), 解決問(wèn)題就會(huì )變得更加容易。
分析的維度有如下3種:
兩個(gè)數值型數據變量: 如果你只是想將兩件能夠進(jìn)行數值測量的事情聯(lián)系起來(lái), 那么你很可能想要使用某種類(lèi)型的相關(guān)分析。 這是你可以執行的*簡(jiǎn)單的統計分析中的一種。
兩個(gè)或幾個(gè)類(lèi)別變量: 如果你正在使用調查數據, 而且你的數據來(lái)自名詞定類(lèi)變量( 比如, 男性/女性, 或者青年/中年/老年) , 那么你將需要使用一系列方法來(lái)進(jìn)行分類(lèi)數據分析。 這種分析類(lèi)型的結果常常用表格的方式呈現。
兩個(gè)以上的數值型數據變量: 將相關(guān)分析擴展應用到擁有數值型變量的兩個(gè)以上的變量上就是回歸分析。 有時(shí)候, 它被稱(chēng)為多元線(xiàn)性回歸分析( 因為你使用了多元變量來(lái)解釋另一
個(gè)變量的價(jià)值) 或者線(xiàn)性回歸分析( 因為變量之間的關(guān)系在整個(gè)變量范圍中保持相似) 。

步驟6 采取行動(dòng)
你可嘗試按照如下的6個(gè)維度提供你數據的分析結果:
- 1. 對這個(gè)商業(yè)問(wèn)題的理解;
- 2. 如何估量它的商業(yè)影響力;
- 3. 哪些數據是可以用的;
- 4. *初的解決方案;
- 5. *終的解決方案;
- 6. 該解決方案的商業(yè)影響力。
基于數據、 分析的分析性思維會(huì )在商業(yè)和社會(huì )中扮演越來(lái)越重要的角色。 我們需要很多慣于使用分析性思維的管理人員和專(zhuān)業(yè)人員,希望你也可以成為數據分析師。