91aaa在线国内观看,亚洲AV午夜福利精品一区二区,久久偷拍人视频,久久播这里有免费视播

<strong id="fvuar"></strong>

<sub id="fvuar"><dl id="fvuar"><em id="fvuar"></em></dl></sub>

<small id="zrnin"></small>

<xmp id="zrnin">

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站

千鋒教育

千鋒學(xué)習(xí)站 | 隨時隨地免費學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻

千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時隨地免費學(xué)習(xí)課程

行業(yè)頭條

哈爾濱選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

哈密選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

呼和浩特選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

呼倫貝爾選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

吳忠選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

呂梁選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

吉安選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

合肥選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

臺州選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

廈門選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

400-811-9990 全國咨詢熱線

首頁精品課程

Java

鴻蒙開發(fā)

HTML5

物聯(lián)網(wǎng)

云計算

Python

軟件測試

網(wǎng)絡(luò)安全

大數(shù)據(jù)

Unity

UI/UE設(shè)計

全媒體營銷

影視剪輯

游戲原畫

區(qū)塊鏈

產(chǎn)品經(jīng)理

商業(yè)插畫

PMP認(rèn)證

紅帽RHCE

軟考認(rèn)證

華為認(rèn)證

出國留學(xué)

安全認(rèn)證

更多課程

免費教程
HTML5視頻教程 Java視頻教程 Python視頻教程 UI視頻教程云計算視頻教程軟件測試視頻教程大數(shù)據(jù)視頻教程物聯(lián)網(wǎng)視頻教程 Unity視頻教程網(wǎng)絡(luò)安全視頻教程全媒體視頻教程影視剪輯視頻教程
教研實力
教研院項目庫師資團(tuán)隊項目大賽
校企服務(wù)
企業(yè)內(nèi)訓(xùn) 高校合作學(xué)科共建
就業(yè)服務(wù)
就業(yè)服務(wù) 雙選會上門招聘人才定制促就業(yè)行動
認(rèn)證考試
PMP培訓(xùn) 軟考培訓(xùn) 紅帽RHCE認(rèn)證學(xué)歷提升
千鋒問問行業(yè)資訊技術(shù)干貨熱點話題
零基礎(chǔ)學(xué)IT IT培訓(xùn)機(jī)構(gòu) IT面試題 IT就業(yè)前景
關(guān)于千鋒
千鋒簡介鋒益公益大賽組織品牌活動
聯(lián)系我們

當(dāng)前位置：首頁 > 技術(shù)干貨 > 分析時間序列數(shù)據(jù)的六個圖表

分析時間序列數(shù)據(jù)的六個圖表

來源：千鋒教育

發(fā)布人：syq

時間： 2022-09-15 10:10:40 1663207840

　　本文在 Python 中用箱線圖、傅里葉變換、熵、自相關(guān)和 PCA 分析時間序列數(shù)據(jù)。數(shù)據(jù)可視化是任何數(shù)據(jù)相關(guān)項目中最重要的階段之一。根據(jù)數(shù)據(jù)可視化的對象有：

　　1.數(shù)據(jù)可視化報告結(jié)果。

　　2.數(shù)據(jù)可視化來分析數(shù)據(jù)，換句話說，數(shù)據(jù)科學(xué)家內(nèi)部使用的可視化來提取有關(guān)數(shù)據(jù)的信息，然后實施模型。

　　本文主要關(guān)注后一種，因為它解釋了一些有助于分析時間序列數(shù)據(jù)的方法。

　　什么是時間序列？

　　基本數(shù)值時間序列是有序的、帶時間戳的觀測值(測量值)的集合，其中每個觀測值都是從同一測量過程中獲得的數(shù)值標(biāo)量。

　　什么是時間戳？

　　在我們將“時間”捕獲為數(shù)據(jù)點之前，我們不會深入探討需要精確定義的許多細(xì)節(jié)(準(zhǔn)確性、格式、日歷約定、時區(qū)等等)。我們將時間戳定義為具有所需精度的時間點的表示就足夠了。例如，這可能是根據(jù)某個日歷的日期約定(例如“08-06-2020”)，或者自 1970 年以來以整數(shù)表示的毫秒數(shù)(這實際上是 UNIX 紀(jì)元約定!)

　　Python類庫

　　首先，這些是與 notebook 一起使用的庫。大多數(shù)代碼都圍繞 NumPy 和 Pandas庫，因為數(shù)據(jù)主要以 Pandas Dataframe 表現(xiàn)的 NumPy 數(shù)組。

　　導(dǎo)入文件

　　下載數(shù)據(jù)后，運行以下代碼將其導(dǎo)入。

　　正如所觀察到的，數(shù)據(jù)包含六個傳感器的傳感器數(shù)據(jù)、每個數(shù)據(jù)點的日期時間以及機(jī)器狀態(tài)。這是“BROKEN”、“NORMAL”或“RECOVERING”，但為了簡化可視化，它被分組如下：

　　在任何編程語言中使用日期時間總是具有挑戰(zhàn)性的，Python 也不例外。盡管處理日期時間有多種方法，但這里使用函數(shù) pandas.to_datetime 將 datetime 列(讀取為字符串)轉(zhuǎn)換為時間戳。

　　數(shù)據(jù)預(yù)處理

　　在進(jìn)行可視化之前，分析了本次數(shù)據(jù)的重復(fù)值和缺失值。并且刪除重復(fù)項的函數(shù)：

def drop_duplicates(df: pd.DataFrame(), subset: list = ['DATE_TIME']) -> pd.DataFrame():

df = df.drop_duplicates((subset))

return df

　　填充缺失值的函數(shù)：

def fill_missing_date(df: pd.DataFrame(), column_datetime: str ='DATE_TIME'):

print(f'輸入形狀: {df.shape}')

data_s = df.drop([column_datetime], axis=1)

datetime_s = df[column_datetime].astype(str)

start_date = min(df[column_datetime])

end_date = max(df[column_datetime])

date_s = pd.date_range(start_date, end_date, freq="min").strftime('%Y-%m-%d %H:%M:%S')

data_processed_s = []

for date_val in date_s:

pos = np.where(date_val == datetime_s)[0]

assert len(pos) in [0, 1]

if len(pos) == 0:

data = [date_val] + [0] * data_s.shape[1]

elif len(pos) == 1:

data = [date_val] + data_s.iloc[pos].values.tolist()[0]

data_processed_s.append(data)

df_processed = pd.DataFrame(data_processed_s, columns=[column_datetime] + data_s.columns.values.tolist())

df_processed[column_datetime] = pd.to_datetime(df_processed[column_datetime])

print(f'輸出形狀: {df_processed.shape}')

return df_processed

　　這是預(yù)處理階段的整個管道。此外，數(shù)據(jù)分為輸入數(shù)據(jù)和輸出數(shù)據(jù)。

　　輸入形狀：(10081, 7)

　　輸出形狀：(10081, 2)

　　數(shù)據(jù)可視化

　　現(xiàn)在，準(zhǔn)備開始數(shù)據(jù)可視化。這是傳感器數(shù)據(jù)和異常情況的圖。完整代碼可以在公眾號:機(jī)器學(xué)習(xí)研習(xí)院后臺回復(fù) 時間序列可視化獲取.

7.1

　　均值和標(biāo)準(zhǔn)

　　可以更好地總結(jié)數(shù)據(jù)隨時間變化的行為的最基本圖之一是均值標(biāo)準(zhǔn)圖，我們在其中顯示按時間范圍分組的均值和標(biāo)準(zhǔn)差。這主要有助于分析指定時間范圍內(nèi)的基線和噪聲。

df_data_hour = df_data.groupby(pd.Grouper(key='datetime', axis=0, freq='H')).mean()

df_labels_hour = df_labels.groupby(pd.Grouper(key='datetime', axis=0, freq='H')).sum()

df_rollmean = df_data_hour.resample(rule='D').mean()

df_rollstd = df_data_hour.resample(rule='D').std()

for name in df.columns:

if name not in ['datetime', 'machine_status']:

fig, axs = plt.subplots(1, 1, figsize=(15, 2))

axs.plot(df_data_hour[name], color='blue', label='Original')

axs.plot(df_rollmean[name], color='red', label='Rolling Mean')

plt.plot(df_rollstd[name], color='black', label='Rolling Std' )

axs.set_title(name)

plt.legend()

plt.show()

　　箱形圖

　　另一個有趣的圖表是通過箱線圖顯示的。箱線圖是一種通過四分位數(shù)以圖形方式顯示數(shù)值數(shù)據(jù)的局部性、擴(kuò)散性和偏度組的方法。有兩個主要框表示從第25個百分位數(shù)到第75個百分位數(shù)的數(shù)據(jù)，兩者之間用分布的中位數(shù)隔開。除了盒子之外，還有從盒子延伸出來的晶須，表明上四分位和下四分位之外的變異性。與數(shù)據(jù)集其他部分顯著不同的異常值也被繪制為箱線圖上須之外的單獨點。

　　這一個類似于平均和標(biāo)準(zhǔn)圖，因為它表明數(shù)據(jù)的平穩(wěn)性。但是，它也可以顯示異常值，這有助于從視覺上檢測異常和數(shù)據(jù)之間的任何關(guān)系。

　　傅里葉變換

　　快速傅里葉變換(FFT)是一種計算序列離散傅里葉變換的算法。這種類型的圖很有趣，因為它是處理時間序列時特征提取的主要方法之一。通常的做法不是用時間序列來訓(xùn)練模型，而是應(yīng)用傅里葉變換來提取頻率，然后訓(xùn)練模型。

　　為此，我們必須選擇一個滑動窗口來計算FFT?；瑒哟翱谠綄挘l率數(shù)越高。缺點是您將得到更少的時間戳，從而丟失數(shù)據(jù)的時間分辨率。當(dāng)減小窗口的大小時，我們得到了相反的結(jié)果：更少的頻率但更高的時間分辨率。然后，窗口的大小應(yīng)該取決于任務(wù)。

　　FFT的滑動窗口對于如下圖所示，我選擇了一個包含64個數(shù)據(jù)的時間窗口。因此，頻率從1 - 32hz。

def fft(data, nwindow=64, freq = 32):

ffts = []

for i in range(0, len(data)-nwindow, nwindow//2):

sliced = data[i:i+nwindow]

fft = np.abs(np.fft.rfft(sliced*np.hamming(nwindow))[:freq])

ffts.append(fft.tolist())

ffts = np.array(ffts)

return ffts

def data_plot(date_time, data, labels, ax):

ax.plot(date_time, data)

ax.set_xlim(date2num(np.min(date_time)), date2num(np.max(date_time)))

axs_twinx = ax.twinx()

axs_twinx.plot(date_time, labels, color='red')

ax.set_ylabel('Label')

def fft_plot(ffts, ax):

ax.imshow(np.flipud(np.rot90(ffts)), aspect='auto', cmap=matplotlib.cm.bwr,

norm=LogNorm(vmin=np.min(ffts), vmax=np.max(ffts)))

ax.set_xlabel('Timestamp')

ax.set_ylabel('Freq')

df_fourier = df_data.copy()

for name in df_boxplot.columns:

if name not in ['datetime', 'date']:

fig, axs = plt.subplots(2, 1, figsize=(15, 6))

data = df_fourier[name].to_numpy()

ffts = fft(data, nwindow=64, freq = 32)

data_plot(df_fourier['datetime'], data, df_labels['machine_status'], axs[0])

fft_plot(ffts, axs[1])

axs[0].set_title(name)

plt.show()

12.1

　　熵

　　可視化信息和熵是機(jī)器學(xué)習(xí)中的一個有用工具，因為它們是許多特征選擇、構(gòu)建決策樹和擬合分類模型的基礎(chǔ)。

　　熵的計算如下：

　　歸一化頻率分布

　　最低熵是針對某一隨機(jī)變量計算的，該隨機(jī)變量的單個事件的概率為1.0，即確定性。一個隨機(jī)變量的最大熵是當(dāng)所有事件都是等可能的。

def entropy(data, nwindow=64, freq = 32):

entropy_s = []

for i in range(0, len(data)-nwindow, nwindow//2):

sliced = data[i:i+nwindow]

fft = np.abs(np.fft.rfft(sliced*np.hamming(nwindow))[:nwindow//2])

p = fft / np.sum(fft)

entropy = - np.sum(p * np.log(p))

entropy_s.append(entropy)

entropy_s = np.array(entropy_s)

return entropy_s

def data_plot(date_time, data, labels, ax):

ax.plot(date_time, data)

axs_twinx = ax.twinx()

axs_twinx.plot(date_time, labels, color='red')

ax.set_xlabel('Value')

ax.set_ylabel('Label')

def entropy_plot(data, ax):

ax.plot(data, c='k')

ax.set_xlabel('Timestamp')

ax.set_ylabel('Entropy')

df_entropy = df_data.copy()

for name in df_boxplot.columns:

if name not in ['datetime', 'date']:

fig, axs = plt.subplots(2, 1, figsize=(15, 6))

data = df_entropy[name].to_numpy()

entropy_s = entropy(data, nwindow=64, freq = 32)

data_plot(df_entropy['datetime'], data, df_labels['machine_status'], axs[0])

entropy_plot(entropy_s, axs[1])

axs[0].set_title(name)

plt.show()

　　降維

　　當(dāng)有多個傳感器時，實現(xiàn)一種降維方法來獲得包含大部分信息的1、2或3個主要組件總是很有趣的。

　　對于這個例子，我實現(xiàn)了主成分分析(PCA)。這是計算主要組件并使用它們對數(shù)據(jù)進(jìn)行基礎(chǔ)更改的過程。

　　被解釋方差比率是每一個被選擇的組成部分的方差百分比。

　　對于第一個PCA組件，可以繪制數(shù)據(jù)，并直觀地檢查異常和時間序列之間是否存在關(guān)系。

pca = PCA(n_components=2)

principalComponents = pca.fit_transform(x)

principalDf = pd.DataFrame(data = principalComponents, columns = ['pc1', 'pc2'])

df_pca = df_data.copy()

df_pca['pca1'] = pd.Series(principalDf['pc1'].values, index=df.index)

df_pca['pca2'] = pd.Series(principalDf['pc2'].values, index=df.index)

print(df_pca.shape)

print(df_pca.head())

df_pca_hour = df_pca.groupby(pd.Grouper(key='datetime', axis=0, freq='H')).mean()

df_labels_hour = df_labels.groupby(pd.Grouper(key='datetime', axis=0, freq='H')).sum()

for name in df_pca.columns:

if name in ['pca1', 'pca2']:

fig, axs = plt.subplots(1, 1, figsize=(15, 2))

axs.plot(df_pca_hour[name], color='blue')

axs_twinx = axs.twinx()

axs_twinx.plot(df_labels_hour['machine_status'], color='red')

axs.set_title(name)

plt.show()

　　自相關(guān)

　　最后，特別是對于預(yù)測任務(wù)，繪制數(shù)據(jù)的自相關(guān)性是很有趣的。這個表示給定的時間序列和它自己在連續(xù)時間間隔中的滯后版本之間的相似程度。

　　與自相關(guān)相關(guān)的是增強(qiáng)迪基-富勒統(tǒng)計檢驗，用于檢驗給定的時間序列是否平穩(wěn)。

tags:

聲明：本站稿件版權(quán)均屬千鋒教育所有，未經(jīng)許可不得擅自轉(zhuǎn)載。

10年以上業(yè)內(nèi)強(qiáng)師集結(jié)，手把手帶你蛻變精英

請您保持通訊暢通，專屬學(xué)習(xí)老師24小時內(nèi)將與您1V1溝通

免費領(lǐng)取

今日已有369人領(lǐng)取成功

劉同學(xué) 138****2860 剛剛成功領(lǐng)取

王同學(xué) 131****2015 剛剛成功領(lǐng)取

張同學(xué) 133****4652 剛剛成功領(lǐng)取

李同學(xué) 135****8607 剛剛成功領(lǐng)取

楊同學(xué) 132****5667 剛剛成功領(lǐng)取

岳同學(xué) 134****6652 剛剛成功領(lǐng)取

梁同學(xué) 157****2950 剛剛成功領(lǐng)取

劉同學(xué) 189****1015 剛剛成功領(lǐng)取

張同學(xué) 155****4678 剛剛成功領(lǐng)取

鄒同學(xué) 139****2907 剛剛成功領(lǐng)取

董同學(xué) 138****2867 剛剛成功領(lǐng)取

周同學(xué) 136****3602 剛剛成功領(lǐng)取

上一篇

如何在JavaScript中更好地使用條件判斷

下一篇

如何使用JavaScript快速構(gòu)建一個二維碼生成器

免費打包獲取

相關(guān)推薦HOT

抖店入駐收費多少？開抖店費用是多少？

如果要開通抖音小店，需要先把抖音賬號開通商品櫥窗功能。入駐之后，可以選擇頭條賬號、抖音賬號、火山賬號任一類型注冊或登錄。那開個抖店要多...詳情>>

2023-09-19 07:50:26

想做直播帶貨的貨源哪里來？怎么找貨源？

現(xiàn)如今直播推廣的方式是非常火的，有著非常多的賣家都是利用直播推廣店鋪產(chǎn)品，效果也是非常不錯。但很多賣家想要了解現(xiàn)在直播帶貨的話什么產(chǎn)品...詳情>>

2023-09-19 07:47:16

適合三農(nóng)領(lǐng)域的名字？有何技巧？

現(xiàn)在在抖音上很多博主會選擇直播來賺取更多的流量以及利潤，直播間的東西也有很多讓消費者信任并且喜歡的，而且隨著越來越多人直播，很多農(nóng)產(chǎn)品...詳情>>

2023-09-19 07:06:05

抖店商品發(fā)布違規(guī)怎么申訴？有何規(guī)則？

抖店服務(wù)市場服務(wù)商發(fā)布違禁信息如何處理?情節(jié)嚴(yán)重程度判定原則：違規(guī)嚴(yán)重等級主要通過服務(wù)商違規(guī)次數(shù)、造成后果的嚴(yán)重程度、獲利或?qū)е聯(lián)p失的...詳情>>

2023-09-19 06:59:55

“泛垂直起號”可能是2023年最高效的起號方式

這可能是明年最好用的旗號方式了，今天教大家一個很野，但是可以讓你三天漲1000粉的偏方。去年前年啊，每個人都教你，誰知七號對著自己的產(chǎn)品拍...詳情>>

2023-09-19 06:37:38

快速通道更多>>

課程介紹
點擊獲取大綱
就業(yè)前景
查看就業(yè)薪資
學(xué)習(xí)費用
了解課程價格
優(yōu)惠活動
領(lǐng)取優(yōu)惠券
學(xué)習(xí)資源
領(lǐng)3000G教程
師資團(tuán)隊
了解師資團(tuán)隊
實戰(zhàn)項目
獲取項目源碼
開班地區(qū)
查看來校路線

開班信息

北京校區(qū)

北京校區(qū)
大連校區(qū)
廣州校區(qū)
成都校區(qū)
杭州校區(qū)
長沙校區(qū)
合肥校區(qū)
南京校區(qū)
上海校區(qū)
深圳校區(qū)
武漢校區(qū)
鄭州校區(qū)
西安校區(qū)
青島校區(qū)
重慶校區(qū)
太原校區(qū)
沈陽校區(qū)
南昌校區(qū)
哈爾濱校區(qū)

熱門推薦

抖店平臺商戶被退店還能退貨嗎？如何提高評分？

抖店入駐收費多少？開抖店費用是多少？

想做直播帶貨的貨源哪里來？怎么找貨源？

抖店沒有營業(yè)執(zhí)照怎么辦？類型有哪些？

女孩子拍什么最容易火?拍視頻怎么賺錢的？

怎樣投抖加不花錢，有哪些技巧？

做自媒體怎么找到自己的定位？怎么找到自己的定位？

做自媒體選擇哪個方向？從這幾個方面去考慮

自媒體新手需要怎么做？注意事項介紹

新手做自媒體選擇什么領(lǐng)域好？這幾個領(lǐng)域適合新手

技術(shù)干貨更多>>

如何實現(xiàn)服務(wù)器負(fù)載均衡

2023-12-06

linux有哪些優(yōu)勢和劣勢

2023-12-06

linux需要驅(qū)動嗎

2023-12-06

android與linux的區(qū)別

2023-12-06

如何搭建基于容器的深度學(xué)習(xí)環(huán)境

2023-12-06

職場就業(yè) 更多>>

網(wǎng)絡(luò)安全軟件開發(fā)的就業(yè)前景

2023-12-09

學(xué)會python工程師后的就業(yè)前景

2023-12-09

學(xué)會java工程師后的就業(yè)前景

2023-12-09

云計算技術(shù)就業(yè)前景以及發(fā)展方向怎樣？

2023-08-07

千鋒教育

千鋒學(xué)習(xí)站 | 隨時隨地免費學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

<legend id="yjsfy"><u id="yjsfy"><blockquote id="yjsfy"></blockquote></u></legend>