有的伙伴想學(xué)用Pandas做多層級索引,但不知道從何學(xué)起,難度肯定會有的,還是得掌握方法的! Pandas庫的名字來源于其中3種主要數(shù)據(jù)結(jié)構(gòu)開頭字母的縮寫:Panel,Dataframe,Series。其中Series表示一維數(shù)據(jù),Dataframe表示二維數(shù)據(jù),Panel表示三維數(shù)據(jù)。當(dāng)數(shù)據(jù)高于二維時,一般卻不用 Panel 表示,為什么呢?如果不用 Panel,又該怎么做呢? 實(shí)際上,當(dāng)數(shù)據(jù)高于二維時,我們一般用包含多層級索引的Dataframe進(jìn)行表示,而不是使用Panel。原因是使用多層級索引展示數(shù)據(jù)更加直觀,操作數(shù)據(jù)更加靈活,并且可以表示3維,4維乃至任意維度的數(shù)據(jù)。具體要怎么做呢?下面我們就從多層級索引的創(chuàng)建、取值與操作等內(nèi)容教大家一些方法! 一、多層級索引的創(chuàng)建 1、指定多維列表作為columns 2、使用pd.MultiIndex中的方法顯式生成多層級索引 可以使用pd.MultiIndex中的from_tuples等方法生成多層級索引。 3、使用set_index方法將普通列轉(zhuǎn)成多層級索引 這種方法只能生成多層級行索引。 4、groupby和pivot_table等方法也可以生成帶有多層級索引的結(jié)果 二、多層級索引的取值 多層級索引Series或多層級DataFrame支持方括號直接取值,loc取值,和pd.IndexSlice切片取值等方法。 1、多層級Series的取值 2、多層級DataFrame的取值 三、多層級索引相關(guān)操作 多層級索引相關(guān)操作包括stack和unstack,set_index和reset_index,以及指定level的相關(guān)方法。 1、stack和unstack 2、set_index和reset_index 3、指定level的相關(guān)方法 伙伴們那些地方不清楚的可以留言哦! |
|