如何對Python數(shù)據(jù)表進(jìn)行檢查
在python中處理的數(shù)據(jù)量通常會比較大,例如千萬級數(shù)據(jù),而且我們不能一目了然地了解整個數(shù)據(jù)表,而且必須通過某種方法獲得關(guān)于數(shù)據(jù)表的關(guān)鍵信息。DataTableCheck的另一個用途是了解數(shù)據(jù)的總體情況,如整個數(shù)據(jù)表的大小、占用的空間、數(shù)據(jù)格式、是否有空值、重復(fù)項和具體的數(shù)據(jù)內(nèi)容。準(zhǔn)備好進(jìn)行后續(xù)清潔和預(yù)處理。
1、數(shù)據(jù)維度(行列)
Excel中可以通過CTRL+向下的光標(biāo)鍵,和CTRL+向右的光標(biāo)鍵來查看行號和列號。Python中使用shape函數(shù)來查看數(shù)據(jù)表的維度,也就是行數(shù)和列數(shù),
2、數(shù)據(jù)表信息
使用info函數(shù)在這里可以看到數(shù)據(jù)表的總體信息,其中包含更多的信息,包括數(shù)據(jù)維度、列名、數(shù)據(jù)格式和占用的空間。
3、查看數(shù)據(jù)格式
Excel中通過選中單元格并查看開始菜單中的數(shù)值類型來判斷數(shù)據(jù)的格式。Python中使用dtypes函數(shù)來返回數(shù)據(jù)格式。
Dtypes是一個查看數(shù)據(jù)格式的函數(shù),可以一次性查看數(shù)據(jù)表中所有數(shù)據(jù)的格式,也可以指定一列來單獨查看。
以上就是Python數(shù)據(jù)表進(jìn)行檢查的方法,希望能對大家有所幫助,更多Python學(xué)習(xí)教程請關(guān)注IT培訓(xùn)機構(gòu):千鋒教育。