<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

實現海量數據分析及可視化的簡便方法

DPVg_AI_era ? 作者:工程師飛燕 ? 2018-08-07 14:04 ? 次閱讀

【新智元導讀】近期,Kaggle發布了新的數據分析及可視化工具——Kaggle Kerneler bot,用戶只需上傳數據集,便可用Python為用戶自動獲取相關的深度數據分析結果。本文將帶領讀者體驗一下這款便捷而又高效的工具。

Kaggle Kerneler bot是一個自動生成的kernel,其中包含了演示如何讀取數據以及分析工作的starter代碼。用戶可以進入任意一個已經發布的項目,點擊頂部的“Fork Notebook”來編輯自己的副本。接下來,小編將以最熱門的兩個項目作為例子,帶領讀者了解該如何使用這款便捷的工具。

好的開始是成功的一半!

要開始這個探索性分析(exploratory analysis),首先需要導入一些庫并定義使用matplotlib繪制數據的函數。但要注意的是,并不是所有的數據分析結果圖像都能夠呈現出來,這很大程度上取決于數據本身(Kaggle Kerneler bot只是一個工具,不可能做到Jeff Dean或者Kaggle比賽選手們那么完美的結果)。

In [1]:

frommpl_toolkits.mplot3dimportAxes3Dfromsklearn.decompositionimportPCAfromsklearn.preprocessingimportStandardScalerimportmatplotlib.pyplotasplt#plottingimportnumpyasnp#linearalgebraimportos#accessingdirectorystructureimportpandasaspd#dataprocessing,CSVfileI/O(e.g.pd.read_csv)

在本例中,一共輸入了12個數據集。

In [2]:

print(os.listdir('../input'))print(os.listdir('../input/moeimouto-faces/moeimouto-faces/007_nagato_yuki'))print(os.listdir('../input/moeimouto-faces/moeimouto-faces/046_alice_margatroid'))print(os.listdir('../input/moeimouto-faces/moeimouto-faces/065_sanzenin_nagi'))print(os.listdir('../input/moeimouto-faces/moeimouto-faces/080_koizumi_itsuki'))print(os.listdir('../input/moeimouto-faces/moeimouto-faces/096_golden_darkness'))print(os.listdir('../input/moeimouto-faces/moeimouto-faces/116_pastel_ink'))print(os.listdir('../input/moeimouto-faces/moeimouto-faces/140_seto_san'))print(os.listdir('../input/moeimouto-faces/moeimouto-faces/144_kotegawa_yui'))print(os.listdir('../input/moeimouto-faces/moeimouto-faces/164_shindou_chihiro'))print(os.listdir('../input/moeimouto-faces/moeimouto-faces/165_rollo_lamperouge'))print(os.listdir('../input/moeimouto-faces/moeimouto-faces/199_kusugawa_sasara'))print(os.listdir('../input/moeimouto-faces/moeimouto-faces/997_ana_coppola'))

接下里,用戶在編輯界面中會看到四個已經編好的代碼塊,它們定義了繪制數據的函數。而在發布后的頁面,這些代碼塊會被隱藏,如下圖所示,只需單擊已發布界面中的“code”按鈕就可以顯示隱藏的代碼。

準備就緒!讀取數據!

首先,讓我們先看一下輸入中的第一個數據集:

In [7]:

nRowsRead = 100 # specify ‘None’ if want to read whole file# color.csv may have more rows in reality, but we are only loading/previewing the first 100 rowsdf1 = pd.read_csv(‘。。/input/moeimouto-faces/moeimouto-faces/080_koizumi_itsuki/color.csv’, delimiter=‘,’, nrows = nRowsRead)df1.dataframeName = ‘color.csv’nRow, nCol = df1.shapeprint(f‘There are {nRow} rows and {nCol} columns’)

那么數據長什么樣子呢?

In [8]:

df1.head(5)

Out [8]:

實現海量數據分析及可視化的簡便方法

數據可視化:僅需簡單幾行!

樣本的柱狀圖:

In [9]:

plotHistogram(df1, 10, 5)

二維和三維的PCA圖:

In [10]:

plotPCA(df1, 2) # 2D PCAplotPCA(df1, 3) # 3D PCA

同理,更換數據集文件的路徑,也可以得到其它數據對應的結果。

當然,除了上述幾種可視化的結果外,根據輸入數據以及需求的不同,也可以得到其它數據分析可視化結果,例如:

相關矩陣:

In [11]:

plotCorrelationMatrix(df1, 8)

散射和密度圖:

In [12]:

plotScatterMatrix(df1, 20, 10)

針對數據分析、數據可視化工作,Kaggle kerneler bot應當說是相當的便捷和高效了。那么你是否也想嘗試一下呢?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 可視化
    +關注

    關注

    1

    文章

    1024

    瀏覽量

    20556
  • 數據分析
    +關注

    關注

    2

    文章

    1353

    瀏覽量

    33738

原文標題:Kaggle放大招:簡單幾步實現海量數據分析及可視化

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    從使用效果來看,數據可視化工具離不開數據中臺嗎?

    數據可視化工具具有數據智能分析、數據可視化展現兩大作用,同時
    發表于 05-12 14:14

    為更快讀懂報表,我們將數據可視化

    常用圖表的基礎上,開發數十種高級數據可視化圖表,同時還賦予這些圖表聯動鉆取功能,讓瀏覽者一眼看懂數據的同時還能根據自身分析需求進行自助式數據分析
    發表于 06-05 17:21

    只有報表直觀了,不能算真正的數據可視化

    ——數據中心(數據中臺)。OurwayBI數據可視化軟件的數據中臺能支持億級數據的匹配抽取,即使
    發表于 07-01 17:20

    能做數據治理的數據可視化工具,又快又靈活

    也就無從談起。對這樣的企業用戶而言,數據治理是邁向BI數據智能可視化分析的首要關卡,必須先做數據治理,統一數據分析口徑,厘清
    發表于 07-13 15:34

    現在做企業級數據分析,離不開秒分析數據可視化工具

    找到分析快、深入的數據可視化工具還不夠,做企業級數據分析少不了針對企業用戶實際狀況和需求搭建數據分析模型,但這可是份相當耗時、復雜的工作,稍
    發表于 07-21 15:06

    請問怎么把BI數據可視化報表發給領導看?

    進行解答。怎么把做好的數據可視化報表發給領導?方法:啟用分享功能,生成鏈接或二維碼發送給領導。步驟:1、返回SpeedBI數據分析云首頁,點擊報表右上角“…”,選擇“分享”。在彈出來的
    發表于 09-01 17:26

    一般圖表做不了的分析,BI數據可視化圖表可以

    隨著業務變化,分析場景細分,出現了越來越多的一般圖表做不了的分析,比如分析顧客滿意度,又比如分析展示運動軌跡、多項目進程等。面對這些分析需求
    發表于 01-15 10:22

    不懂技術的業務,該怎么做數據可視化分析?

    數據源,并通過點擊、拖拉拽的操作快速制作數據分析視圖、數據可視化分析報表。BI數據可視化工具通常
    發表于 06-30 13:37

    原始數據量大、質量參差不齊,能立即投入數據可視化分析嗎?

    數據中臺能夠快速地把各個系統的原始數據集中起來,并通過定時清洗整理的方式來快速統一數據分析口徑,打破數據孤島現象,使得BI智能可視化分析系統
    發表于 11-02 10:09

    什么樣的數據分析軟件能讓全員自助可視化分析更絲滑?

    的大數據時代,數據可視化分析的效率、靈活自助性都將極大地影響企業的經營決策。在動則千萬級、過億級的大數據量下,企業更需要一個能夠智能且高效、靈活且自助的BI
    發表于 09-22 10:04

    奧威BI數據可視化軟件|讓業務獨立自主分析

    增加。怎么才能提高分析效率?BI數據可視化軟件的零編程構建分析模型,讓業務獨立自助分析的做法也就應運而生了。零編程構建
    發表于 04-11 10:29

    SpeedBI數據可視化工具:瀏覽器上做分析

    SpeedBI數據分析云是一種在瀏覽器上進行數據可視化分析的工具,它能夠將數據可視化的形式呈現出來,并支持多種
    發表于 08-22 10:55

    財務數據分析?奧威BI數據可視化工具很擅長

    的智能財務指標計算功能,還擁有一套標準、系統的財務數據分析方案,無需測試,下載即可用! 奧威BI工具+智能財務方案:輕松完成智能財務數據可視化分
    發表于 08-29 09:44

    千人千面的數據分析有沒可能?奧威BI數據可視化工具告訴你

    ,實現數字運營管理。 ③按需篩選。用戶可根據具體情況按照組織、時間段、產品品類等條件展開數據篩選分析。 奧威BI數據
    發表于 08-29 14:45

    可視化策略的數據分析

    研究者采用可視化策略(即平行坐標)的數據分析方法,更好地展示了多維材料數據,可以更好地識別不同屬性之間的有用關系。
    的頭像 發表于 04-27 09:22 ?4079次閱讀
    <b class='flag-5'>可視化</b>策略的<b class='flag-5'>數據分析</b>
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>