天才教育網(wǎng)合作機構 > 培訓機構 >

                                                                                        全國python學(xué)習中心

                                                                                        歡迎您!
                                                                                        朋友圈

                                                                                        400-850-8622

                                                                                        全國統一學(xué)習專(zhuān)線(xiàn) 9:00-21:00

                                                                                        位置:培訓資訊 > python基礎教程數據分析,【連載2】:python數據分析——python基礎教程掌握

                                                                                        python基礎教程數據分析,【連載2】:python數據分析——python基礎教程掌握

                                                                                        日期:2021-06-13 13:17:46     瀏覽:177    來(lái)源:全國python學(xué)習中心
                                                                                        核心提示:不管你是待業(yè)還是失業(yè),在這個(gè)被互聯(lián)網(wǎng)圍繞的時(shí)代里,選擇python基礎教程數據分析,就多了一項技能,還怕找不到工作?,還怕不好找工作?小編就來(lái)告訴你這個(gè)專(zhuān)業(yè)的優(yōu)勢到底體現在哪里:Python數據分析步驟,Pyth

                                                                                        不管你是待業(yè)還是失業(yè),在這個(gè)被互聯(lián)網(wǎng)圍繞的時(shí)代里,選擇python基礎教程數據分析,就多了一項技能,還怕找不到工作?,還怕不好找工作?小編就來(lái)告訴你這個(gè)專(zhuān)業(yè)的優(yōu)勢到底體現在哪里:Python數據分析步驟,Python數據分析學(xué)習路徑圖(120天Get新技能),【連載2】:python數據分析——python基礎教程掌握,利用Python進(jìn)行數據分析(附詳細案例)??。

                                                                                        1.Python數據分析步驟

                                                                                        不管是用excel還是用Python, 數據分析過(guò)程都遵循一樣的套路。在學(xué)習完P(guān)ython的基礎知識之后,我把用Python進(jìn)行數據分析過(guò)程中涉及的函數都標注了出來(lái)以方便后來(lái)回憶查看。

                                                                                        2.Python數據分析學(xué)習路徑圖(120天Get新技能)

                                                                                        Python是一種面向對象、直譯式計算機程序設計語(yǔ)言,由Guido van Rossum于1989年底發(fā)明。由于他簡(jiǎn)單、易學(xué)、免費開(kāi)源、可移植性、可擴展性等特點(diǎn),Python又被稱(chēng)之為膠水語(yǔ)言。下圖為主要程序語(yǔ)言近年來(lái)的流行趨勢,Python受歡迎程度扶搖直上。 圖片來(lái)源用Python玩轉數據由于Python擁有非常豐富的庫,使其在數據分析領(lǐng)域也有廣泛的應用。由于Python本身有十分廣泛的應用,本期Python數據分析路線(xiàn)圖主要從數據分析從業(yè)人員的角度講述Python數據分析路線(xiàn)圖。整個(gè)路線(xiàn)圖計劃分成16周,120天左右。主要學(xué)習內容包括四大部分:1)Python工作環(huán)境及基礎語(yǔ)法知識了解(包括正則表達式相關(guān)知識學(xué)習);2)數據采集相關(guān)知識(python爬蟲(chóng)相關(guān)知識);3)數據分析學(xué)習;4)數據可視化學(xué)習。PYTHON學(xué)習路徑計劃圖Python 工作環(huán)境及基礎語(yǔ)法知識了解對于Python基礎語(yǔ)法學(xué)習部分,學(xué)習周期大概為4周,需要的相關(guān)資源在網(wǎng)絡(luò )上都能找到免費的資源,而且質(zhì)量都不錯。相關(guān)中文資源如下:1、python工作集成環(huán)境包Python(x,y):下載地址( )如果安裝了上面集成工作包,則下面的包不需要重新安裝了。關(guān)于包的安裝方法在學(xué)習資源圖書(shū)中都有介紹,通常安裝庫采用pip方法,也可以用pip list查詢(xún)系統安裝了哪些庫。3、學(xué)習資源圖書(shū)1)Python基礎教程(第2版)[電子版圖書(shū)自行百度]2)深入淺出Head First python(中文版)[電子版圖書(shū)自行百度]在線(xiàn)教程1)廖雪峰的python教程(

                                                                                        3.【連載2】:python數據分析——python基礎教程掌握

                                                                                        目錄1、為什么要學(xué)習PYTHON2、如何安裝PYTHON3、快速學(xué)會(huì )PYTHON的四個(gè)關(guān)鍵4、什么是模塊5、數據結構6、如何學(xué)編程最有效1、為什么要學(xué)習PYTHON許多大型網(wǎng)站它就是用它來(lái)開(kāi)發(fā)的,例如我們知道的視頻網(wǎng)站又YouTube,還有國內的豆瓣,谷歌雅虎,甚至美國航天局都會(huì )大量的使用Python。由于大數據人工智能的出現,使得數據分析的需求非常的火爆,這也是為什么python現在很流行的主要原因2、如何安裝PYTHON網(wǎng)上教程很多,但是要專(zhuān)職數據分析,基本的就是python3+jupyter notebook+Anaconda,Anaconda的很多數據包已經(jīng)打包好了,基本夠用,如果需要用到新的包,可以用pip方式下載,需要的時(shí)候再說(shuō)。Anaconda:是包管理器和環(huán)境管理器,Jupyter notebook:可以將數據分析的代碼、圖像和文檔全部組合到一個(gè)web文檔中。3、快速學(xué)會(huì )PYTHON的四個(gè)關(guān)鍵數據類(lèi)型、函數、條件判斷、循環(huán)【3.1】數據類(lèi)型【3.1.1】什么是數據我現在看什么數據呢?數據是非常重要的,可以把數據看作是一切程序運行所需的原材料,有的數據呢,他來(lái)自程序本身,有的數據來(lái)自于用戶(hù)的輸入,比如使用程序過(guò)程中的輸入,我們使用編程語(yǔ)言來(lái)操作數據,我們可以把程序看作那是一個(gè)大型的數據加工廠(chǎng)。其實(shí)微信公眾號對于我們來(lái)說(shuō)也是個(gè)程序,如果你在個(gè)人微信公眾號輸入資料這兩個(gè)字,程序理解了你的輸入命令后,他就會(huì )把數據處理結果返回給你。那么程序中的數據是放在哪里的?【3.1.2】用什么存放數據在代碼里,我們用變量存放數據,并用等號為變量賦值,變量概念,基本上和*代數的方程變量它是一樣的,只是在計算機程序中,變量不僅可以是素據,還可以是任意的數據類(lèi)型,比如,我這里定義了一個(gè)人的姓名叫馬云,把它放在這個(gè)變量,這個(gè)變量取了一個(gè)名字,叫string,他是變量的名稱(chēng),右邊的是變量的值,這樣你就可以在代碼的其他地方使用這個(gè)變量,它里面重換了就是,請教馬云這個(gè)人的數據?!?.1.2】什么是變量?所以呢,變量在代碼中就是用一個(gè)變量名來(lái)表示,前半部分名稱(chēng),還要能代表數據的意義,后半部分名稱(chēng)呢,它能代表數據的類(lèi)型,這樣當我們使用著(zhù)的時(shí)候,可以方便的通過(guò)變量名稱(chēng),知道這個(gè)變量里面他是存放了什么數據,而且還能根據這個(gè)變量名稱(chēng)知道這個(gè)變量的類(lèi)型。就像剛才圖片里name表示人的姓名,那么后面的str是最表示變量的數據類(lèi)型,只要你通過(guò)這個(gè)變量名稱(chēng)就知道俺這個(gè)變量里面他們放的是人的姓名。注意:就是數字不能作為變量名稱(chēng)的開(kāi)頭;同時(shí)我們要注意python,它是對大小寫(xiě)敏感的,如果寫(xiě)出了大小寫(xiě)程序就會(huì )報錯。如下圖的nameStr:就是變量名稱(chēng)+數據類(lèi)型【3.1.3】注釋的兩種方法#單行注釋'''多行注釋……………………………………………………….'''【3.1.4】python數據類(lèi)型分類(lèi)分為字符串、數字、容器、布爾、none1、字符串*種字符串是:Python中最常見(jiàn)的數據類(lèi)型,我們可以用單引號或雙引號來(lái)創(chuàng )建字符串,你可以用加號合并字符串,*個(gè)例子我例舉了你覺(jué)得怎樣,合并字符串,合并之后的字符串是馬云有錢(qián)?!咀址?s格式化】nameStr='我叫%s,我爹是%s'%('王思聰','王健林') print(nameStr) 我叫王思聰,我爹是王健林注意點(diǎn):print后面的小引號,你竟然打成了‘,中英文環(huán)境一定要注明另外你原本的變量名是money,后面的變量名變味了moneyStr2,要注意前后的問(wèn)題,否則也會(huì )出現問(wèn)題3.2、數字數值類(lèi)型分為三種:int(整數)、float(浮點(diǎn)數)、complex(復數),它們與數學(xué)中的概念相同,如3.2.1)int(整數)age = 50即年齡為503.2.2)float(浮點(diǎn)數)money = 3.53即錢(qián)為3.53元3.3、容器Python中為了存放不同的數據有4種容器,分別是列表(List)、元組(Tuple)、集合(Sets)、字典()首先說(shuō)下:列表、元組、集合、字典的應用場(chǎng)景列表和元組有很多相似的地方,操作也差不多。不過(guò)列表是可變序列,元組為不可變序列。也就是說(shuō)列表主要用于對象長(cháng)度不可知的情況下,而元組用于對象長(cháng)度已知的情況下,而且元組元素一旦創(chuàng )建變就不可修改。例如我們在打開(kāi)一個(gè)文本時(shí),并不知道里面有多少行文字,所以用列表來(lái)保存。而我們在儲存一個(gè)人的信息(名字,年齡,性別,假定只需要這三種信息,所以對象長(cháng)度為3)的時(shí)候,就可以用元組來(lái)實(shí)現。字典主要應用于需要對元素進(jìn)行標記的對象,這樣在使用的時(shí)候便不必記住元素列表中或者元組中的位置,只需要利用鍵來(lái)進(jìn)行訪(fǎng)問(wèn)對象中相應的值。集合中的元素不可重復的特點(diǎn)使它被拿來(lái)去重。比如我在爬去糗事百科全站的文章鏈接(存放與列表中)的時(shí)候,不可避免的會(huì )遇到重復的鏈接。這是我們只需將列表轉換為集合便能有效的去除重復部分。比如上面的例程。id = {'name': 'kyda', 'age': 19, ‘sex': 'man') print(id['age']) # 結果: # 193.3.1列表(list):列表用 [ ]表示,一看見(jiàn)方括號[ ]就要知道,哦,這是個(gè)列表,可重復哦列表的長(cháng)度,用函數lenappend從列表*增加函數,不去重del函數刪除列表中下標為1的元素,下標是從0開(kāi)始數的查詢(xún)列表name的*個(gè)元素,也就是列表下標為0的元素,記得再次變量name_1首先指定列表name下標為2的元素,賦予新值wc,打印輸出修改后的結果3.3.2元組(tuple):元組使用小括號(),一看見(jiàn)(),就該知道,哦,這是一個(gè)元組,元組和列表的區別是元組的元素是不可更改的。查詢(xún)元組name_1的長(cháng)度查詢(xún)元組name_1中下標為3的元素,打印出來(lái)3.4、集合用花括號{ }表示,它是不能重復有重復元素的容器,一看見(jiàn)花括號{ },哦,這是個(gè)集合上邊的結合,我在元素中定義了重復字符串亞馬遜,當打印輸出時(shí),它自動(dòng)只輸出*的重復值首先定義一個(gè)空的集合,往里面添加集合,使用update函數,打印輸出用discard函數刪除集合daqiye中的阿里元素,需要注意的是要記住不同容器的操作方式,因為每個(gè)容器有不同的性質(zhì),沒(méi)有統一的標準,只能死記硬背,這樣更扎實(shí)一些查找一個(gè)元素在不在集合里,查完之后返回的是布爾值,true返回的意思,你查的對,它在里面呢先使用.discard函數刪除集合里面的阿里元素,再使用,update函數添加新的元素阿里3.4、字典它是存貯映射關(guān)系的容器,如賬號密碼。用花括號表示,需要注意的是要和集合區分來(lái),看里面的元素是否有對應關(guān)系(字典里的映射關(guān)系用 :號表示),如果有 :,那么這就是,反之為集合,key值必須是*的,value可以。字典中左側部分為*的值key,右側可以是重復的3.5、布爾值用True和Falase 表示 ,要嚴格區分大小寫(xiě),主要應用在條件判斷上。3.6、空值None如圖:它是特殊的空值,就相當于占了個(gè)位置,但是它又沒(méi)有值,所以用None表示四、條件判斷 if ...:else:...這里就多了個(gè)elif,就是多了個(gè)條件判斷,注意格式,就是冒號:,別忘了,縮進(jìn)已經(jīng)要對齊,可以用tab鍵進(jìn)行操作,就是縮進(jìn)4個(gè)空格,一定要對其哦邏輯 and 、or、not的用法五、循環(huán),批量處理數據,把容器中的每個(gè)數據都按照規則進(jìn)行重復處理,代碼塊格式:for i in 容器:(轉到下一行,縮進(jìn))要做的事情??梢赃@樣理解,i把所有的 eatlist列表里的數據都循環(huán)過(guò)一遍,簡(jiǎn)單的循環(huán)將字典里的key,value轉換成大寫(xiě)的,這在數據清洗中很重要,批量同一格式,這里用到了items()方法語(yǔ)法:返回值:返回可遍歷的(鍵, 值) 元組數組。countine循環(huán)break循環(huán),就是不再執行這個(gè)循環(huán)了,退出python中break和continue的區別 - 人則魚(yú) - 博客園六、函數,函數就是別人已經(jīng)寫(xiě)好的工具,可以重復使用,就是套路。也可以自己編寫(xiě)函數自定義函數使用剛才定義好的add函數,函數傳遞,一是按照定義的順序如上圖,二是使用參數名稱(chēng)如下圖3.7、模塊,在py模塊。注意輸入地址時(shí)要用到雙\\,因為python導入文件時(shí)將\符號當做Tab鍵輸入導致語(yǔ)法錯誤,加入\\就可以解決以上是解決方式的連接八、數據結構隊列(queue)隊列就像你去餐廳外婆家吃飯排隊,新來(lái)的人在隊列尾部加入,叫做入隊。取完票的人從隊列首部離開(kāi)隊列,叫做出隊官網(wǎng)使用操作文檔:介紹Python的包,了解常用的數據結構5. Data - Python 2.7.18 使用中daque的函數,相當于在隊列后邊加了個(gè)數我們可以看見(jiàn)隊列的001沒(méi)有,道理很簡(jiǎn)單,在隊列頭,使用popleft函數讓頭出去了棧(stack)棧這種數據結構有點(diǎn)像像生活中的木桶。你往棧中加入新的元素,就是入棧,新的元素總是放在木桶的最上面排序字典計數器Counter

                                                                                        4.利用Python進(jìn)行數據分析(附詳細案例)

                                                                                        一、前期準備分析要用到兩個(gè)包:NumPy和Pandas,首先確保jupyter中成功安裝了這兩個(gè)包。#導入numpy包 import numpy as np #導入pandas包 import pandas as pd二、基礎知識2.1 一維數據分析:NumPy2.2 一維數據結構:Pandas2.3 二維數據分析:numpy對應array2.4 二維數據分析:pandas對應數據框DateFrame此處遇到一個(gè)問(wèn)題:讀取Excel文件報錯。解決方法:1 查看Excel文件存放路徑具體操作:點(diǎn)擊文件名,鼠標右鍵,選擇“屬性”,找到下面標紅的兩個(gè)地方。2 將上面標紅的兩處合成文件的路徑,格式為文件夾\文件名,比如F:\ann\Untitled1.ipynb3 *把路徑中全部的斜杠(/)或者反斜杠(\)替換為雙反斜杠(\\)*的路徑為F:\\ann\\Untitled1.ipynb三、Python具體案例分析:藥店銷(xiāo)售數據3.1 提出問(wèn)題分析指標:月均消費次數月均消費金額客單件消費趨勢3.2 理解數據3.3 清洗數據3.3.1 選擇子集3.3.2 列名重命名3.3.3 缺失數據處理(dropna()函數)Python缺失值有3種:None,NA,NaN。(分析數據時(shí),如果遇到什么錯誤,比如float錯誤,就要考慮是否為缺失值,若是,則需要處理掉)。Python內置的None值;pandas中,將缺失值表示 為NA,表示不可用not available;對應數值數據,pandas使用浮點(diǎn)值NaN(Not a Number)表示缺失數據;None和NaN的區別:None是Python的一種數據類(lèi)型(NoneType),NaN是浮點(diǎn)類(lèi)型(float),兩個(gè)都用作空值。3.3.4 數據類(lèi)型轉換3.3.5 數據排序3.3.6 異常值處理3.4 構建模型3.4.1 指標1:月均消費次數=總消費次數/月份數3.4.2 指標2:月均消費金額=總消費金額/月份數3.4.3 指標3:客單價(jià)=總消費金額/總消費次數客單價(jià)(per customer ):商場(chǎng)(超市)每位顧客平均購買(mǎi)商品的金額,即是平均交易金額。3.4.3 消費趨勢End.

                                                                                        就拿大數據說(shuō)話(huà),優(yōu)勢一目了然,從事IT行業(yè),打開(kāi)IT行業(yè)的新大門(mén),找到適合自己的培訓機構,進(jìn)行專(zhuān)業(yè)和系統的學(xué)習。

                                                                                        本文由 全國python學(xué)習中心 整理發(fā)布。更多培訓課程,學(xué)習資訊,課程優(yōu)惠,課程開(kāi)班,學(xué)校地址等學(xué)校信息,可以留下你的聯(lián)系方式,讓課程老師跟你詳細解答:
                                                                                        咨詢(xún)電話(huà):400-850-8622

                                                                                        如果本頁(yè)不是您要找的課程,您也可以百度查找一下:

                                                                                        奇米在线7777在线精品|国产成人精品免费视|精品无码不卡一区二区三区|国内综合精品午夜久久资源|亚洲视频在线观看..