不管你是待業(yè)還是失業(yè),在這個(gè)被互聯(lián)網(wǎng)圍繞的時(shí)代里,選擇如何做python,就多了一項技能,還怕找不到工作?,還怕不好找工作?小編就來(lái)告訴你這個(gè)專(zhuān)業(yè)的優(yōu)勢到底體現在哪里:cmd下載python不好使怎么辦,如何做python 線(xiàn)性回歸案例分析,如何用iPad運行Python代碼?,成功轉行Python工程師,年薪30W+,經(jīng)驗總結都在這!??。
1.cmd下載python不好使怎么辦
貌似你的python安裝有問(wèn)題或路徑設置有問(wèn)題你的python.exe 怎么可能是在D根目錄?另外,可能你的python沒(méi)有完整安裝正常安裝 ,pip不會(huì )有問(wèn)題的建議:重新安裝python重新設置路徑若是win10,建議不要安裝exe應用,而是從應用商店安裝 ,我安裝了3.8
2.如何做python 線(xiàn)性回歸案例分析
用Python實(shí)現線(xiàn)性回歸的小例子數據來(lái)源于網(wǎng)絡(luò )爬蟲(chóng),武漢市商品房?jì)r(jià)格為因變量和幾個(gè)相關(guān)關(guān)鍵詞的百度指數的搜索量為自變量。由于本文的自變量有98個(gè),首先進(jìn)行自變量的選擇,先是通過(guò)相關(guān)系數矩陣篩選掉不相關(guān)的變量,根據Pearson相關(guān)系數矩陣進(jìn)行變量的選取,一般選取相關(guān)系數的值大于0.3的變量進(jìn)行回歸分析,由于本文的變量較多,先進(jìn)行手動(dòng)篩選然后利用相關(guān)系數進(jìn)行選取,本文選取相關(guān)系數大于0.55的變量進(jìn)行回歸分析。經(jīng)過(guò)相關(guān)系數的分析選取8個(gè)變量進(jìn)行下一步的分析,分析的Python代碼如下:# -*- coding: utf-8 -*-#### Required sysreload(sys)sys.('utf-8')import .pyplot as pltimport numpy as npimport pandas as pdimport .api as smdata = pd.read_csv('Hdata.csv')print = np.array(data)######相關(guān)性分析X = dataset[:,1:98]y = dataset[:,0]cor = np.corrcoef(dataset,rowvar=0)[:,0]######輸出相關(guān)矩陣的*列print cor#######篩選后的數據讀取data1 = pd.read_csv('H1data.csv')dataset1 = np.array(data)######篩選后的變量######X1 = dataset1[:,1:8]Y1 = dataset1[:,0]est = sm.OLS(Y1,X1).fit()print est.summary()貼出線(xiàn)性回歸的結果如下:OLS =============================================================Dep. Variable: y R-squared: 0.978Model: OLS Adj. R-squared: 0.974Method: Least Squares F-statistic: 287.5Date: Sat, 08 Apr 2021 Prob (F-statistic): 9.35e-36Time: 15:15:14 Log-: -442.82No. : 53 AIC: 899.6Df Residuals: 46 BIC: 913.4Df Model: 7 Type: nonrobust ============================================================= coef std err t P>|t| [95.0% Conf. Int.]-----------------------------------------------------------------------x1 -0.3691 0.494 -0.747 0.0459 -1.364 0.626x2 0.3249 0.353 0.920 0.0362 -0.386 1.036x3 1.0987 0.837 1.312 0.0196 -0.587 2.784x4 0.7613 0.790 0.964 0.0340 -0.829 2.351x5 -1.5766 1.099 -1.435 0.0158 -3.789 0.636x6 -0.1572 1.077 -0.146 0.0885 -2.325 2.011x7 3.2003 1.603 1.997 0.052 -0.026 6.427=============================================================Omnibus: 0.413 Durbin-Watson: 1.748Prob(Omnibus): 0.814 Jarque-Bera (JB): 0.100Skew: 0.097 Prob(JB): 0.: 3.089 Cond. No. 95.5=============================================================從回歸分析的結果可以看出來(lái),模型的擬合優(yōu)度R-squared=0.978,說(shuō)明模型的擬合效果很好,據其大小對擬合效果的優(yōu)劣性進(jìn)行判定。對模型整體的顯著(zhù)性可以通過(guò)F統計量來(lái)看,結果顯示的F統計量對應的P值顯著(zhù)小于0.05(0.05是顯著(zhù)性水平,也可以選取0.01),說(shuō)明模型整體是顯著(zhù)的,它的顯著(zhù)性說(shuō)明被解釋變量能不能由這些解釋變量進(jìn)行解釋?zhuān)現檢驗是對整體的檢驗,F檢驗的通過(guò)不代表每一個(gè)解釋變量是顯著(zhù)的。對每一個(gè)變量的顯著(zhù)性要看t檢驗統計量的值,t檢驗統計量對應的P值小于0.05(0.01或者0.1也行,具體看情況分析,一般選取0.05)視為是顯著(zhù)的,從結果可以看出,X6和X7的變量的p是大于0.05的,也就是這兩個(gè)變量對被解釋變量的影響是不顯著(zhù)的要剔除。但是如果你只是關(guān)心預測的問(wèn)題那么可以不剔除。但是如果有研究解釋變量對被解釋變量的影響的程度的,要做進(jìn)一步的研究。接下來(lái)看DW的值,DW的值為1.748,說(shuō)明模型不存在自相關(guān)性??碕B檢驗統計量的值,JB檢驗統計量是對正態(tài)性的假設進(jìn)行檢驗的,JB的值對應的p值為0.951顯著(zhù)大于0.05,可以認為模型滿(mǎn)足正態(tài)性的假設的。
3.如何用iPad運行Python代碼?
其實(shí),不只是iPad,手機也可以。痛點(diǎn)我組織過(guò)幾次線(xiàn)下編程工作坊,帶著(zhù)同學(xué)們用Python處理數據科學(xué)問(wèn)題。其中最讓人頭疼的,就是運行環(huán)境的安裝。實(shí)事求是地講,參加工作坊之前,我已經(jīng)做了認真準備。例如集成環(huán)境,選用了對用戶(hù)很友好的Anaconda。代碼在我的Macbook電腦上跑,沒(méi)有問(wèn)題。還拿到學(xué)生的Windows 7上跑,也沒(méi)有問(wèn)題。這才上傳到了Github。在發(fā)布的教程文章里,我也已經(jīng)把安裝軟件包的說(shuō)明寫(xiě)得非常詳細。還針對 Anaconda 這一 Python 運行環(huán)境的安裝和運行,專(zhuān)門(mén)錄制了視頻。但是,工作坊現場(chǎng)遇見(jiàn)的問(wèn)題,依然五花八門(mén)。有的是操作系統。例如你可能用Windows 10。實(shí)話(huà)實(shí)說(shuō),我確實(shí)沒(méi)用過(guò)。拿著(zhù)Surface端詳,連安裝后的Anaconda文件夾都找不到在哪兒。有的是編碼。不同操作系統,有的默認中文編碼是UTF-8,有的是GBK。同樣一段中文文本,我這里顯示一切正常,你那里就是亂碼。有的是套件路徑。來(lái)參加工作坊前,你可能看過(guò)我一些教程,并安裝了 Python 2.7 版本 Anaconda。來(lái)到現場(chǎng),一看需要 Python 3.6 版本,你就又安裝了一份新的。結果執行起來(lái),你根本分不清運行的 Python, pip 命令來(lái)自哪一個(gè)套件,更搞不清楚軟件包究竟安裝到哪里去了。再加上虛擬環(huán)境配置,你就要抓狂了。還有的,甚至是網(wǎng)絡(luò )擁塞問(wèn)題。因為有時(shí)需要現場(chǎng)安裝調用體積龐大的軟件包,幾十臺電腦“預備——齊”一起爭搶有限的Wifi帶寬,后果可想而知。痛定思痛,我決定改變一下現狀。目前的教程只提供基礎源代碼。對于許多新手同學(xué)來(lái)說(shuō),是不夠的。許多同學(xué),就倒在了安裝依賴(lài)軟件包的路上,繼而干脆放棄了。變通的辦法有許多。例如干脆錄制代碼執行視頻給你看。但是正如我在《MOOC教學(xué),什么最重要?》一文中說(shuō)過(guò)的,學(xué)習過(guò)程里,反饋最重要。你需要能運行代碼,并且*時(shí)間獲得結果反饋。在此基礎上,你還得能修改代碼,對比前后執行結果的差別。我得給你提供一個(gè)直接可以運行的環(huán)境。零安裝,自然也就沒(méi)了上述煩惱。這個(gè)事兒可能嗎?我研究了一下,沒(méi)問(wèn)題。只要你的設備上有個(gè)現代化瀏覽器(包括但不限于Google Chrome, Firefox, Safari和Microsoft Edge等)就行。IE 8.0?那個(gè)不行,趕緊升級吧!讀到這里,你應該想明白了。因為只挑瀏覽器,不挑操作系統,所以別說(shuō)你用Windows 10,你就是用iPad,都能運行代碼。嘗試請你打開(kāi)瀏覽器,輸入這個(gè)鏈接( Jupyter Lab。你可以將它理解為 Jupyter Notebook 的增強版,它具備以下特征:代碼單元直接鼠標拖動(dòng);一個(gè)瀏覽器標簽,可打開(kāi)多個(gè)Notebook,而且分別使用不同的Kernel;提供實(shí)時(shí)渲染的Markdown編輯器;完整的文件瀏覽器;CSV數據文件快速瀏覽……圖中左側分欄,是工作目錄下的全部文件。右側打開(kāi)的,是咱們要使用的ipynb文件。為了證明這不是逗你玩兒,請你點(diǎn)擊右側代碼上方工具欄的運行按鈕。點(diǎn)擊一下,就會(huì )運行出當前所在代碼單元的結果。不斷點(diǎn)擊下來(lái),你可以看見(jiàn),結果都被正常渲染。連圖像也能正常顯示。甚至連下面這種需要一定運算量的可視化結果,都沒(méi)問(wèn)題。為了證明這不是變魔術(shù),你可以在新的單元格,寫(xiě)一行輸出語(yǔ)句。就讓Python輸出你的名字吧。假如你叫 Chuck,就這樣寫(xiě):print("Hello, Chuck!") 把它替換成你自己的姓名,看看輸出結果是否正確?其實(shí),又何止是iPad而已?你如果足夠勇(sang) 于(xin) 嘗(bing) 試(kuang),手機其實(shí)也是可以的。就像這樣。流程下面我給你講講,這種效果是怎么做出來(lái)的。我們需要用到一款工具,叫做 mybinder 。它可以幫助我們,把 github 上的某個(gè)代碼倉庫(repo),快速轉換成為一個(gè)可運行的環(huán)境。注意 mybinder 為我們提供了云設施,也就是計算資源和存儲資源。因此即便許許多多的用戶(hù)同時(shí)在線(xiàn)使用同一份代碼轉換出來(lái)的環(huán)境,也不會(huì )互相沖突。我們先來(lái)看看,怎么準備一個(gè)可供 mybinder 順利轉換的代碼倉庫。我為你提供的樣例在這里( Embedding)》。感興趣的同學(xué)可以點(diǎn)擊鏈接,查看原文。在該 GitHub 頁(yè)面展示的文件列表中,你需要注意以下3個(gè)文件:demo..其中demo.ipynb就是你在上一節看到的包含源代碼的Jupyter Notebook文件。你需要首先在本地安裝相關(guān)軟件包,并且運行測試通過(guò)。如果在你本地運行都有錯誤,放到云上去,想必也難以正常運行。.yml文件非常重要,它來(lái)告訴 mybinder ,需要如何為你的代碼運行準備環(huán)境。我們打開(kāi)看看該文件的內容:: - python=3 - pip: - spacy - ipykernel - scipy - numpy - scikit-learn - - pandas - thinc 這個(gè)文件首先告訴 mybinder ,你的 Python 版本。我們采用的是 3.6 版。所以只需要指定 python=3 即可。mybinder 會(huì )自動(dòng)為你下載安裝*的。然后這個(gè)文件說(shuō)明需要使用 pip 工具安裝哪些軟件包。我們需要把所有依賴(lài)的安裝包都羅列出來(lái)。這就是之前,我總在教程里給你說(shuō)明的那些準備步驟。但是這還沒(méi)有完,因為 mybinder 只是為你安裝好了一些軟件依賴(lài)。這里還有兩個(gè)步驟需要處理:為了分析語(yǔ)義,我們需要調用預訓練的Word2vec模型,這需要 mybinder 為我們提前下載好。Jupyter Notebook 打開(kāi)后,應當使用的 kernel 名稱(chēng)為 wangshuyi ,這個(gè) kernel 目前還沒(méi)有在 Jupyter 里面注冊。我們需要 mybinder 代勞。為了完成上述兩個(gè)步驟,你就需要準備*一個(gè)postBuild文件。它的內容如下:python -m spacy download en python -m spacy download en_core_web_lg python -m ipykernel install --user --name=wangshuyi 跟它的名字一樣。它是在 mybinder 依據 .yml 安裝了依賴(lài)組建后,依次執行的命令。如果你的代碼需要其他的命令提供環(huán)境支持,也可以放在這里。至此,你的準備工作就算結束了。魔法表演正式開(kāi)始。請打開(kāi) mybinder 的網(wǎng)址( “GitHub repo or URL” 一欄,填寫(xiě)我們的 github 代碼倉庫鏈接,即: 我們希望一進(jìn)入界面,就自動(dòng)打開(kāi) demo.ipynb ,因此需要在“Path to a notebook file (optional)”一欄填寫(xiě)demo.ipynb 。這時(shí),你會(huì )發(fā)現“Copy the URL below and share your Binder with others:”一欄中,出現了你的代碼運行環(huán)境網(wǎng)址。 點(diǎn)擊右側的“復制”按鈕保存到你的記事本里面。將來(lái)找到你轉換好的運行環(huán)境,就全靠它了。妥善保存地址后,點(diǎn)擊“Launch”按鈕。根據你的依賴(lài)安裝包數量等因素,你需要等待的時(shí)間長(cháng)短不一。但是只有*次構建的時(shí)候,需要花一些時(shí)間。以后每一次調用執行,就都會(huì )非??炝?。構建完畢后, mybinder 會(huì )自動(dòng)為我們開(kāi)啟對應的運行環(huán)境。很有成就感吧!測試一下,能夠正常運行代碼,就證明我們成功了。但是你會(huì )發(fā)現,不對??!老師你剛才用 iPad 展示的,不是高級版的 Jupyter Lab 嗎?怎么又變成了 Jupyter Notebook 了?我也想要高級版!別著(zhù)急??纯茨隳壳暗逆溄拥刂罚?你只需要做個(gè)小小的調整,將其中的:?filepath= 替換為:?urlpath=lab/tree/ 替換后的鏈接為: 把它輸入到瀏覽器,看看出來(lái)的結果:這下沒(méi)問(wèn)題了吧?原理你是不是覺(jué)得,mybinder 很黑科技?其實(shí),也不算。它只是把已有的幾項技術(shù),鏈接了起來(lái)。這大概也算是“積木式創(chuàng )新”的一個(gè)實(shí)例吧。我們看看 mybinder 的說(shuō)明:可以看到,其中最為關(guān)鍵的技術(shù),是用了 docker 。Docker 是個(gè)什么東西呢?簡(jiǎn)單來(lái)說(shuō),Docker 就是為了不同平臺上,都能夠順利執行同一份代碼的保障工具。你有些猶疑,這說(shuō)的不是 Java 嗎?沒(méi)錯,Java 的宣傳口號,就是一次編碼,各處運行。它利用虛擬機,來(lái)保障這種能力。但是,如果你經(jīng)常使用 Java 開(kāi)發(fā)出來(lái)的工具,就應該了解痛點(diǎn)有哪些了。至少,你應該對 Java 程序的運行速度,有一些體會(huì )。上圖中,左側是虛擬機,右側是Docker。Docker 不但效率上要強過(guò) Java 虛擬機,而且它支持的編程語(yǔ)言也不僅僅是一種。至于其他好處,咱們就不展開(kāi)了。否則聽(tīng)起來(lái)像廣告。其實(shí),把 github 代碼倉庫轉換為 docker 鏡像(image)的工作,也不是 mybinder 自己來(lái)做的。它調用的,是另外的一個(gè)工具,叫做 ( 。而你的瀏覽器能夠執行 Python 代碼,是因為 Jupyter Notebook (或者Lab)本來(lái)就是建立在“瀏覽器/服務(wù)器”(Browser / Server, B/S)結構上。如果你已經(jīng)在本地計算機安裝過(guò) Anaconda ,那不妨看看本地執行這個(gè)語(yǔ)句:jupyter lab 會(huì )出現什么?對,它開(kāi)啟了一個(gè)服務(wù)器,然后打開(kāi)你的瀏覽器,跟這個(gè)服務(wù)器通訊。Jupyter 的這種設計,本身就讓它的擴展極為方便。無(wú)論 Jupyter 服務(wù)器是運行在你的本地筆記本上,還是擺在另一個(gè)大洲的機房,對你執行 Python 代碼來(lái)說(shuō),都是沒(méi)有本質(zhì)區別的。另外,如果你以為 mybinder 只能讓你在瀏覽器上跑 Python 代碼,那就太小瞧它了。學(xué)過(guò) R 的同學(xué),請點(diǎn)擊這個(gè)鏈接( mybinder ,把一個(gè) github repo 一鍵轉換成 Jupyter Lab 運行環(huán)境;如何在各種不同操作系統的瀏覽器上,運行該環(huán)境,編寫(xiě)、執行與修改代碼;mybinder 轉換 github repo 的幕后英雄 docker 簡(jiǎn)介。我希望你能想到的,不僅僅是這點(diǎn)兒簡(jiǎn)單的用途。提幾個(gè)問(wèn)題給你,作為思考題:如果代碼執行都在云端完成,教學(xué)實(shí)驗室機房還有沒(méi)有必要預裝一大堆軟件,且不定期更新維護?學(xué)校的編程練習、作業(yè)和考試有沒(méi)有可能通過(guò)這種方式,直接遠程進(jìn)行,并且自動(dòng)化評分?既然應用的技術(shù)都是開(kāi)源的,你有沒(méi)有可能利用這些開(kāi)源工具搞個(gè)創(chuàng )業(yè)項目。例如提供深度學(xué)習環(huán)境,租賃給科研機構與創(chuàng )業(yè)公司?期待你舉一反三,做出有趣又有意義的創(chuàng )新來(lái)。討論在 iPad 上運行 Python 代碼的感覺(jué)怎么樣?你用過(guò)類(lèi)似的產(chǎn)品嗎?你覺(jué)得有了這種技術(shù),在日常工作和學(xué)習中,還可以有哪些有趣的應用場(chǎng)景?歡迎留言,把你的經(jīng)驗和思考分享給大家,我們一起交流討論。如果你對我的文章感興趣,歡迎點(diǎn)贊,并且微信關(guān)注和置頂我的公眾號“玉樹(shù)芝蘭”()。如果本文可能對你身邊的親友有幫助,也歡迎你把本文通過(guò)微博或朋友圈分享給他們。讓他們一起參與到我們的討論中來(lái)。延伸閱讀如何高效入門(mén)數據科學(xué)?
4.成功轉行Python工程師,年薪30W+,經(jīng)驗總結都在這!
這是給轉行做Python的小白的參考,無(wú)論是從零開(kāi)始,或者是轉行的朋友來(lái)說(shuō),這都是值得一看的,也是可以作為一種借鑒吧。而且我決定轉行IT(互聯(lián)網(wǎng))行業(yè),其實(shí)理由也很簡(jiǎn)單,不用動(dòng)體力,大多數動(dòng)的是腦力工作,而且現在的互聯(lián)網(wǎng)趨勢很明顯。再者看到一些網(wǎng)上的招聘平臺,基本上每個(gè)行業(yè)都是需要這塊的,工資也都是很高的。于是我便開(kāi)始了自學(xué)之路,當時(shí)因為計算機基礎不是很好,可以說(shuō)特別的困難了,看了一些網(wǎng)上的教程學(xué)習,可以說(shuō)是拆東墻補西墻的做法,甚至有段時(shí)間居然想放棄了。不過(guò)我加了許多關(guān)于數據分析的群,認識蠻多朋友,他們都建議我學(xué)Python,只有打好這些基礎,才能慢慢循序漸進(jìn)的學(xué)習數據分析的內容,于是我便重拾信心,走上這條道。那段時(shí)間,我基本上是保持4-6小時(shí)的學(xué)習,上班有時(shí)候不忙也會(huì )抽空學(xué)習的,晚上一般就對著(zhù)電腦實(shí)操,不懂的話(huà)就問(wèn)那些大佬們。就這樣我就度過(guò)了幾個(gè)月,不過(guò)我掌握了不少技能了,SQL,Python,R。會(huì )一點(diǎn)簡(jiǎn)單的爬蟲(chóng),懂點(diǎn)Linux。如果比起那些專(zhuān)業(yè)大佬來(lái)說(shuō),我經(jīng)驗少一些,復雜的算法的話(huà),需要花些時(shí)間琢磨。于是懷著(zhù)新世界的夢(mèng)想,我辭職了,一家家的面試,雖然有許多公司需要有經(jīng)驗的,但也是看人來(lái),加上我又是轉行來(lái)的,所以碰壁是免不了的,不過(guò)我沒(méi)有放棄,結果得嘗所愿。我來(lái)到了一家互聯(lián)網(wǎng)公司上班,這里的辦公環(huán)境真的很不錯,薪資也比之前在物流公司高些,即使我是轉行新手都有6.5K的底薪,然后加上加班費,餐補、住宿補貼以及其他福利,整體折算下來(lái)薪酬都還過(guò)得去,而且還是雙休,不得不說(shuō),我自己心里也是小開(kāi)心的??隙ㄓ胁簧偃藛?wèn),零基礎的小白如何學(xué)好Python?我自己也打算分享出來(lái),作為一個(gè)轉行的人來(lái)說(shuō),或者是正想轉行的人一些建議,和學(xué)習方法吧!既然選擇了數據分析的話(huà),就一定要選擇好方向。學(xué)習python語(yǔ)言,并能用它來(lái)爬取數據做數據分析;使用python制作一些腳本工具,以幫助并提升工作效率。Python的應用方向,實(shí)在太廣了。在Python基礎知識學(xué)完之后,如果應用方向不同,要學(xué)習的東西也會(huì )大不同。我不能說(shuō)我要做web開(kāi)發(fā),學(xué)完P(guān)ython基礎知識,跑去學(xué)numpy、pandas等知識;也不能說(shuō)我要用Python做數據分析,學(xué)完P(guān)ython基礎知識,然后就跑去學(xué)django、flask框架。我學(xué)習Python,問(wèn)了一些專(zhuān)業(yè)的人之后,才慢慢了解到Python在數據分析方面,基本涵蓋了“數據獲取→數據處理→數據分析→數據可視化”這個(gè)流程中每個(gè)環(huán)節,都是數據分析的利器。所以想學(xué)好Python選好方向很重要,而大部分新手對Python的方向并不了解,可能對有些分析也是看都看不懂,我的建議是找了解的人有經(jīng)驗的人帶你,如果說(shuō)你交好的朋友中有這部分人是*的,如果沒(méi)有耶不用擔心,去找對應的Python交流群就好,我當初就是進(jìn)入了好幾個(gè)Python交流群,不停的問(wèn)問(wèn)題,包括學(xué)習,包括方向,各種問(wèn)題都問(wèn)。 們*在掌握一些業(yè)界廣泛使用的開(kāi)源框架,比如twisted、peak、django、xml等。通過(guò)熟練使用它們,達到閃電開(kāi)發(fā),大大節省項目寶貴時(shí)間。要學(xué)習Python其實(shí)不難,難的是堅持和相信自己,我的經(jīng)驗是既然已經(jīng)選定Python你就要相信它,相信它能成為你日后進(jìn)階的高效渠道,這樣自己才會(huì )更有信念去學(xué)習,才能在碰到困難的時(shí)候堅持下去。還有就是不要單打獨斗,要找一群有共同方向的人一起學(xué)習,群眾效應的效果是非常強大的,大家一起學(xué)習,一起打卡,會(huì )更有學(xué)習動(dòng)力,也更能堅持下去。
就拿大數據說(shuō)話(huà),優(yōu)勢一目了然,從事IT行業(yè),打開(kāi)IT行業(yè)的新大門(mén),找到適合自己的培訓機構,進(jìn)行專(zhuān)業(yè)和系統的學(xué)習。