當(dāng)前位置:首頁 > 公眾號精選 > AI科技大本營
[導(dǎo)讀]作者|俊欣來源|?關(guān)于數(shù)據(jù)分析與可視化今天小編來分享在pandas當(dāng)中經(jīng)常會被用到的方法,篇幅可能有點(diǎn)長但是提供的都是干貨,讀者朋友們看完之后也可以點(diǎn)贊收藏,相信會對大家有所幫助,大致本文會講述這些內(nèi)容DataFrame初印象讀取表格型數(shù)據(jù)篩選出特定的行用pandas來繪圖在Da...

干貨!整理了50個?Pandas?高頻使用技巧,強(qiáng)烈建議收藏!

作者 | 俊欣

來源 |?關(guān)于數(shù)據(jù)分析與可視化

今天小編來分享在pandas當(dāng)中經(jīng)常會被用到的方法,篇幅可能有點(diǎn)長但是提供的都是干貨,讀者朋友們看完之后也可以點(diǎn)贊收藏,相信會對大家有所幫助,大致本文會講述這些內(nèi)容

  • DataFrame初印象
  • 讀取表格型數(shù)據(jù)
  • 篩選出特定的行
  • pandas來繪圖
  • 在DataFrame中新增行與列
  • DataFrame中的統(tǒng)計分析與計算
  • DataFrame中排序問題
  • 合并多個表格
  • 時序問題的處理
  • 字符串類型數(shù)據(jù)的處理

DataFrame初印象

我們先來通過Python當(dāng)中的字典類型來創(chuàng)建一個DataFrame,import?pandas?as?pd

data?=?{"Country":?["Canada",?"USA",?"UK"],
????????"Population":?[10.52*10**6,?350.1*10**6,?65.2*10**6]
???????}
df?=?pd.DataFrame(data)

df
當(dāng)你通過Python當(dāng)中的字典來創(chuàng)建DataFrame,字典當(dāng)中的keys會被當(dāng)做是列名,而values則是表格當(dāng)中的值??Country???Population
0??Canada???10520000.0
1?????USA??350100000.0
2??????UK???65200000.0
要是我們要獲取當(dāng)中的某一列,我們可以這么來做df["Country"]
output0????Portugal
1?????????USA
2??????France
Name:?Country,?dtype:?object
而當(dāng)我們想要獲取表格當(dāng)中每一列的數(shù)據(jù)格式的時候,可以這么做df.dtypes
outputCountry????????object
Population????float64
dtype:?object

讀取數(shù)據(jù)

Pandas當(dāng)中有特定的模塊可以來讀取數(shù)據(jù),要是讀取的文件是csv格式,我們可以這么來做import?pandas?as?pd
df?=?pd.read_csv("titanic.csv")
我們要是想要查看表格的前面幾行,可以這么做df.head(7)
output???PassengerId??Survived??Pclass??...?????Fare?Cabin??Embarked
0????????????1?????????0???????3??...???7.2500???NaN?????????S
1????????????2?????????1???????1??...??71.2833???C85?????????C
2????????????3?????????1???????3??...???7.9250???NaN?????????S
3????????????4?????????1???????1??...??53.1000??C123?????????S
4????????????5?????????0???????3??...???8.0500???NaN?????????S
5????????????6?????????0???????3??...???8.4583???NaN?????????Q
6????????????7?????????0???????1??...??51.8625???E46?????????S
這里我們只是展示了前面7行的數(shù)據(jù),當(dāng)然我們也可以使用tail()方法來展示末尾的若干行的數(shù)據(jù)df.tail(7)
output?????PassengerId??Survived??Pclass??...????Fare?Cabin??Embarked
884??????????885?????????0???????3??...???7.050???NaN?????????S
885??????????886?????????0???????3??...??29.125???NaN?????????Q
886??????????887?????????0???????2??...??13.000???NaN?????????S
887??????????888?????????1???????1??...??30.000???B42?????????S
888??????????889?????????0???????3??...??23.450???NaN?????????S
889??????????890?????????1???????1??...??30.000??C148?????????C
890??????????891?????????0???????3??...???7.750???NaN?????????Q
要是遇到文件的格式是excel格式,pandas當(dāng)中也有相對應(yīng)的方法df?=?pd.read_excel("titanic.xlsx")
可以通過pandas當(dāng)中的info()方法來獲取對表格數(shù)據(jù)的一個初步的印象df.info()
output'pandas.core.frame.DataFrame'>
RangeIndex:?891?entries,?0?to?890
Data?columns?(total?12?columns):
?#???Column???????Non-Null?Count??Dtype??
---??------???????--------------??-----??
?0???PassengerId??891?non-null????int64??
?1???Survived?????891?non-null????int64??
?2???Pclass???????891?non-null????int64??
?3???Name?????????891?non-null????object?
?4???Sex??????????891?non-null????object?
?5???Age??????????714?non-null????float64
?6???SibSp????????891?non-null????int64??
?7???Parch????????891?non-null????int64??
?8???Ticket???????891?non-null????object?
?9???Fare?????????891?non-null????float64
?10??Cabin????????204?non-null????object?
?11??Embarked?????889?non-null????object?
dtypes:?float64(2),?int64(5),?object(5)
memory?usage:?83.7 ?KB
我們可以從上面的信息中看到例如哪些列可能存在一些空值,每一列的數(shù)據(jù)類型,占用內(nèi)存的情況等等。

篩選出特定條件的行

要是我們想要篩選出年齡在30歲以上的乘客,我們可以這么來操作df[df["Age"]?>?30]
output?????PassengerId??Survived??Pclass??...?????Fare?Cabin??Embarked
1??????????????2?????????1???????1??...??71.2833???C85?????????C
3??????????????4?????????1???????1??...??53.1000??C123?????????S
4??????????????5?????????0???????3??...???8.0500???NaN?????????S
6??????????????7?????????0???????1??...??51.8625???E46?????????S
11????????????12?????????1???????1??...??26.5500??C103?????????S
..???????????...???????...?????...??...??????...???...???????...
873??????????874?????????0???????3??...???9.0000???NaN?????????S
879??????????880?????????1???????1??...??83.1583???C50?????????C
881??????????882?????????0???????3??...???7.8958???NaN?????????S
885??????????886?????????0???????3??...??29.1250???NaN?????????Q
890??????????891?????????0???????3??...???7.7500???NaN?????????Q

[305?rows?x?12?columns]
當(dāng)然我們也可以將若干個條件合起來,一同做篩選,例如survived_under_45?=?df[(df["Survived"]==1)?
本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉