在數據分析領域,python是一個繞不開的知識和工具,如果不會用python就很難說自己會數據分析,但是最近很多想要入門數據分析的小白經常問我,Python怎麼入門?Python雖然被稱作是「最簡潔的語言」,但是它終究還是一門程式語言,想要入門還需要掌握一些基礎知識和技巧。
為此,我先列上一個學習計劃,在接下來的一個月里會根據學習計劃,整理、梳理出Python的入門學習知識,對於那些想要學習Python的同學們提供一個參考:
- 初始python基礎
- python的數理統計理論
- sql的學習
- python的語法基礎
- 用python實現數據可視化
- 數據分析實戰
一、初識python基礎
在這一章里,主要是介紹我們為什麼要用python進行數據分析,以及python需要掌握的一些基礎知識,我們能夠用python做什麼?在第一章里,讓大家在感性的認知上首先了解一下這個分析工具,主要涵蓋的內容包括python的下載與環境安裝、數據類型介紹和內置數據結構介紹:
python的下載和安裝環境:難點主要是在環境的安裝上,很多小白往往一腔熱血但是面對環境安裝的時候就泄了氣,因為我會用Anaconda為例進行環境的安裝,同時我建議初學者不要下載具有IDE功能的集成開發環境,比如Eclipse插件等。
數據類型:python的數據類型比較簡單,基本上就可以分為兩大類——數值和字符串。
- 數值:數值是python最基礎的數據類型,也是我們賦值給變量時最常用的形式,主要包括整型、布爾型等。
- 字符串:也就是文本數據,在python中一般用引號來定義,可以通過python進行拼接和重疊,實現文本數據的處理;
- 索引和切片:索引是有序列每個子元素在序列的位置,切片就是對序列的部分截取。
數據結構:python的數據結構可以分為四種,列表、元組、字典、集合。
- 列表:用中括號表示,可以容納任何對象元素,包括字符串,而且每個元素都可以變化;
- 元組:其實就是一個固定的列表,初始化元素的值是絕對不能變化的;
- 字典:可以理解為現實的字典,通過查找拼音(鍵)就能找到這個讀音的所有字(數值);中
- 集合:數學上的概念,每個集合中的元素是無序的,不可重複的對象;
二、python的數理統計理論
數據分析的目的是從數據里找規律,因此想要掌握python必須要學習一些基礎的數理理論,這是成為一個數據分析師必備的能力。對於python來說,其涉及的數理統計學基礎主要由算法、統計學、機率論等,在這一章里我會進行簡單的介紹:
- 矩陣理論-----線性代數
- 導數、偏導、凹凸函數-----微積分
- 正態分布、偏態、峰度-----機率論
- 量化分析、推斷-----統計學
- 描述統計和推斷統計-----數理統計
三、SQL的學習
sql是python的基礎,如果你已經掌握了SQL,那麼這一章你就可以直接跳過,那麼你就要好好學習這部分的內容,因為sql是入門python的關鍵基礎,同時它也是每個數據分析師必備的技能,主要目的是用sql來進行增刪改查等操作,對數據進行篩選。
四、python的語法基礎
這一部分主要是對python的基礎語法進行講解,這一部分是學習python的關鍵,只要能夠熟悉掌握各種語法和語句,基本上就學會了python,當然這一部分只是進行簡單的入門,更加進階的語法暫時不會涉及。
- Python語句的縮進
- Python的多行語句
- Python引號
- Python標識符
- Python關鍵字
- Python變量
- 變量聲明並賦值示例
五、用python實現數據可視化
在這一章里,我會簡單講解一下如何利用python的matplotlib進行數據可視化的操作,python中有著非常優秀的可視化庫,進行可視化製作也是數據分析必備的能力之一,在這一部分中我會使用幾種不同數據圖表來講解基於matplotlib的數據可視化。
- Bar(柱狀圖/條形圖)
- Bar3D(3D 柱狀圖)
- Boxplot(箱形圖)
- EffectScatter(帶有漣漪特效動畫的散點圖)
- Funnel(漏斗圖)
- Gauge(儀錶盤)
- Geo(地理坐標系)
- Graph(關係圖)
- HeatMap(熱力圖)
- Kline(K線圖)
- Line(折線/面積圖)
- Line3D(3D 折線圖)
- Liquid(水球圖)
- Map(地圖)
- Parallel(平行坐標系)
- Pie(餅圖)
- Polar(極坐標系)
- Radar(雷達圖)
- Sankey(桑基圖)
- Scatter(散點圖)
- Scatter3D(3D 散點圖)
- ThemeRiver(主題河流圖)
- WordCloud(詞雲圖)
六、數據分析實戰
到了最後一章,你應該已經基本掌握了python的操作,最後一步就是要進行分析項目的實戰,在這一部分中我會以幾個實際中遇到的數據分析項目為例進行實操,包括爬蟲+分析、業務指標分析等等,為大家拓寬數據分析的思路,早日成為數據分析師!
後言
雖然我的標題是一個月入門python,但是python的掌握需要在大量的實踐中不斷磨合糾錯,才能得到實質性的提高,因為我的學習計劃只是希望帶給完全小白的新手一點思路和指導,讓他們能夠少走一些彎路。
當然,python只是數據分析工作當中的一部分,如果有人想要更加全面地進行數據分析的學習,不妨參考一下我的專欄《十周入門數據分析》,其中也會對python有所涉及: