<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么要可視化圖 大規模圖可視化攻略方案

454398 ? 來源:機器之心 ? 作者:極驗 ? 2020-10-14 16:30 ? 次閱讀

如果你需要可視化一個大規模的圖網絡,而你嘗試了各種各樣的工具,卻只畫了一個小毛球就耗盡了你的 RAM,這時候你要怎么辦?我的工作常常需要可視化大規模圖(上億的節點),嘗試了非常多的工具和方法。但是,我卻沒有發現有人提供實用的攻略,于是,我決定根據自己的經驗寫一篇攻略。

為什么要可視化圖

發現尋找的目標

通常,我們會將節點和邊的集合作為輸入,然后基于數據可以計算出一些統計信息,但是這不足以從結構中獲得想法。好的可視化可以幫助我們清晰的發現圖中的一些簇、 bridges 或者是點云,還有一些其他的模式。

便于解釋

很明顯,數據的可視化用于表示,這是一個展示工作成果的好方法。例如,如果你解決了一個聚類問題,你可以用不同的顏色表示不同的標簽進行可視化,展示它們是如何連接的。

獲得特征

盡管大多數圖可視化工具都是為制作一些圖片而創建的,但它們也很適合作為降維工具。以鄰接矩陣表示的圖是高維空間中的數據。繪制時,我們得到每個頂點的兩個(通常)坐標。這些坐標也可以用作特征。這個空間中頂點之間的緊密性意味著相似性。

大規模圖的問題

我將用大約 10K 節點和邊的大圖來表示。小規模的圖,通過幾分鐘搜索到的工具基本上都可以解決。大規模圖的難點在哪里呢?主要有兩個問題:可讀性和速度。通常,大規模圖的可視化看起來會非?;靵y,因為圖中有太多對象。此外,圖可視化算法的算法復雜度很高:邊或者頂點數目的二階或三階依賴。即使只看一次結果,也要很久才能找到更好的參數。

已有的研究

Helen Gibson, Joe Faith and Paul Vickers: “A survey of two-dimensional graph layout techniques for information visualization”

本文介紹了有哪些圖可視化方法存在,這些方法是如何工作的。文中將各種算法整理成了表,很清晰。我在這篇文章中也有用到了該文中的一些圖表。

Oh-Hyun Kwon, Tarik Crnovrsanin and Kwan-Liu Ma “What Would a Graph Look Like in This Layout? A Machine Learning Approach to Large Graph Visualization”

這篇文章的工程量很大。研究人員嘗試了所有可能的算法,然后可視化出來,手工評估相似度。之后,他們擬合模型來預測圖在 layout 中是什么樣子。我也用了一些這篇文章的圖片。

理論部分

Layout 是一種將坐標映射到每個節點的方法。通常,這是指 2D 平面上的坐標。

什么是好的 Layout

很容易評價一個東西看起來是好還是壞,但是很難制定機器評估好壞的標準。為了得到所謂的“好的” layout,可以使用以下這些指標:

1. Minimum edges intersection(最小邊交)

很容易理解,太多的交叉會讓圖看起來很凌亂。

2. 相鄰的節點彼此靠近

邏輯相連的頂點應該彼此靠近,通過定義,它們代表了圖中存在的主要信息。

3. 社區聚類

如果一些節點之間的連接比與其他節點之間的連接頻率更高,那么它們看起來像密集的云。

4. 最小的重疊邊和節點

這也是很明顯的,如果我們不能確定是一個或者幾個節點,那么該圖可視化的可讀性就很差了。

Layout 的類別

同一個圖在不同 layout 上的呈現。

我考慮著重介紹三種比較重要的 Layout,layout 的分類方法有很多,下面這種分類足以涵蓋所有可能的類型。

力導向和基于能量

降維

基于節點特征

力導向

這一類方法是基于物理系統仿真的。頂點表示為相互排斥的帶電粒子,邊被視為彈性線。這些方法試圖建立這個系統的動力學模型或找到最小能量。這些圖通常會比較好的反應圖的拓撲結構,但是計算非常復雜,需要調節非常多參數。

該方法的重要成員包括 Force Atlas,Fruchterman-Reingold,Kamada Kawaii and OpenOrd。最后一種會使用一些優化方法來減少計算量,比如削減長邊,但是作為副作用,會讓圖更加聚集。

降維

一個圖可以用一個 N x N 的鄰接矩陣來表示,N 代表節點的數量。該矩陣同樣可以看作是 N 維空間中的 N 個對象。這種表示允許我們使用通用的降維方法,比如 PCA、UMAP、tSNE 等等。另一種途徑就是計算節點之間的理論距離,并在低維空間中保持該比例。

基于特征

通常,圖數據都和現實生活中的對象相關聯。因此,頂點和邊會有自己的特征。因此我們可以用這些特征來表示它們。我們可以利用上面講到的降維方法,像處理表數據一樣處理節點的特征,或者直接繪制節點特征對的散點圖。值得一提的是 Hive Plot,因為它和其他的方法都不同。在 Hive Plot 中,節點與多個徑向軸對齊,邊是它們之間的曲線。

大規模圖可視化工具

雖然圖可視化是一個老生常談的問題,但是支持大規模圖可視化的工具仍然捉襟見肘。其中有很多都被它們的開發者遺棄了。并且其中有很多都有自己明顯的缺陷。我只介紹這些工具中值得被提及并且支持大規模圖的,這樣可以幫助大家快速尋找到一個靠譜的工具,并且它還工作的很好。

GraphViz

2011年以前的比特幣交易圖

有些時候,調參非常困難

這是一款 old-school CLI 工具,它有自己的圖定義語言,叫做“dot”。這是一個有幾個 layouts 的包。針對大規模圖,它有 sfdp layout,來自于力導向家族。該工具的優點和缺點一樣:它從命令行運行。它對自動化很有用,但是沒有互動性的調參非常困難。你根本不知道你自己會等多久才能得到最后的結果,也不知道是否是需要停止它,并使用其他的參數重新開始。

graphviz.org

Gephi

Gephi 圖界面

來自 iMDB 的 13K 的電影推薦系統的圖

這是我知道的最好的圖可視化工具。它有 GUI,包含一些 layouts 和很多圖分析工具。還有很多社區貢獻的插件。例如我最喜歡的 layout,“Multigravity Force-Atlas 2” 或者 sigma.js 傳播工具,并且提供交互式的網頁端頁面。在 Gephi 中,可以根據節點和邊的特征設置顏色。

但是 Gephi 仍然被開發者拋棄了。它還有一點老式的 GUI 和一些簡單的特征。

gephi.org

igraph

音樂推薦圖

我需要向這個通用圖分析的工具致敬。其中最令人印象深刻的圖可視化是由 igraph 的一位作者制作的。igraph 的缺點對于 python API 來說是糟糕的文檔,但是源代碼是可讀的并且注釋良好。

igraph.org

LargeViz

最大的比特幣集群,里面有幾千萬個節點(交易和地址)

當你需要繪制一個巨大的圖時,它將是偉大的救世主。LargeViz 是一種降維工具,不僅可以用于圖,還可以用于任意表數據。它從命令行運行,工作速度快,占用較少的內存。

arxiv.org/abs/1602.00370

github.com/lferry007/LargeVis

Graphistry

一周內可能被黑客攻擊的地址以及交易

直觀并且美觀的界面,但是很有限

該工具是這篇攻略中唯一需要付費的。Graphistry 是一種服務,直接輸入數據,并進行所有計算,只需要在客戶端瀏覽器查看漂亮的圖片。Graphistry 出了具有合理的默認參數,良好的配色方案和稍好的交互性之外,其他特性與Gephi 相比并沒有太大的改進。它只提供一個力定向 layout 并且還具有800K個節點或邊的限制。

www.graphistry.com

Graph Embeddings

也有一種方法可以解決瘋狂的尺寸問題。從大約一百萬個頂點開始,只需要合理地查看頂點密度,而不需要繪制邊和特定的頂點。因為沒有人能在這樣的圖上辨認出單個的物體。此外,大多數用于圖可視化的算法將在這樣的大小上工作很多小時,甚至幾天。如果我們稍微改變一下方法,這個問題就可以解決。有很多方法可以得到反映圖頂點特征的固定大小表示。在得到這樣的表示之后,你唯一需要做的就是把維數降到2,以便得到一張圖片。

Node2Vec

Node2Vec + UMAP

這是 word2vec 在圖的改編。圖中使用隨機游動而不是單詞序列。因此,該方法僅使用有關節點鄰域的信息。在大多數情況下,這就足夠了。

snap.stanford.edu/node2vec

github.com/xgfs/node2vec-c

VERSE

VERSE + UMAP

用于通用圖表示的高級算法,是我用起來最好的之一。

tsitsul.in/publications/verse

github.com/xgfs/verse

Graph Convolutions

圖卷積+ 自編碼器 二部圖

有很多方法可以定義圖上的卷積。但事實上,這是頂點鄰居的簡單特征“擴散”。我們還可以將局部拓撲信息放在頂點特征中。
編輯:hfy

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • RAM
    RAM
    +關注

    關注

    7

    文章

    1322

    瀏覽量

    113716
  • Layout
    +關注

    關注

    13

    文章

    395

    瀏覽量

    61178
  • 可視化
    +關注

    關注

    1

    文章

    1024

    瀏覽量

    20556
  • 比特幣
    +關注

    關注

    57

    文章

    7000

    瀏覽量

    139336
收藏 人收藏

    評論

    相關推薦

    何謂單片機編程的可視化?

    何謂單片機編程的可視化?可視化編程就是提供給用戶可視化的器件模塊配置界面使用戶在不用關心具體器件工作原理和設置的情況下直接生成所要配置的器件初始代碼及驅動程序,從而直接進行單片機應用
    發表于 07-08 16:53

    可視化MES系統軟件

    是關鍵部分,可視化管理可幫助企業更直觀的挖掘隱藏的數據并有效管理企業?!爸圃煳锫摗笔荕ES系統軟件更高階段的必然表現形式?!爸圃煳锫摗迸cMES系統軟件的側重:(1)MES側重生產業務管理,制造物聯更關注
    發表于 11-30 19:55

    Tensorflow之Tensorboard的可視化使用

    TF之Tensorboard:Tensorflow之Tensorboard可視化使用之詳細攻略
    發表于 12-27 10:05

    如何把AD中非可視化區域物件移到可視化區域?

    AD中非可視化區域物件怎么移到可視化區域???
    發表于 09-10 05:36

    基于STM的可視化門禁系統

    基于STM的可視化門禁系統
    發表于 03-07 09:49

    基于stm的可視化門禁系統

    基于stm的可視化門禁系統
    發表于 03-11 09:23

    Python數據可視化

    Python數據可視化:網易云音樂歌單
    發表于 07-19 08:30

    TensorFlow TensorBoard可視化數據流

    TensorBoard:接下來,打開瀏覽器并輸入地址 http://localhost:6006/(或運行 TensorBoard 命令后收到的鏈接)。你會看到類似于 1 中的,頂部有很多標簽。Graphs(圖表)選項卡能將運算
    發表于 07-22 21:26

    三維可視化的應用和優勢

    ,為此三維可視化運維系統登場了?! ∪S可視化的應用  宏觀場景可視化:在特定的環境中對隨著時間推移而不斷變化的目標實體進行檢測,可以直觀、靈活、逼真的展示所處區域的情景和環境,可以快速掌握目標區域
    發表于 12-02 11:52

    數據可視化在電力行業的應用前景如何?

    現階段,電力行業通過三維可視化,能使變電站的整體結構、設備分布立體,同時提供空中、漫游、自動巡邏等多種演示方式,滿足多種展示要求,真實地展現環境形象。通過擴大變電站管理規模、管理工具多樣
    發表于 07-06 07:44

    常見的幾種可視化介紹

    說說常見的幾種可視化一、信息可視化信息可視化就是對抽象數據進行直觀視覺呈現的研究,抽象數據既包含數值數據,也包含非數值數據如文本信息、地圖信息等,它們可通過利用圖形圖像處理、人機交互、人工智能的技術
    發表于 07-12 07:49

    plotly可視化繪制嵌入式子的方法

    plotly可視化繪制嵌入式子# 嵌入式子import plotly as pyimport plotly.graph_objs as gopyplt
    發表于 12-14 07:08

    經驗分享|BI數據可視化報表布局——容器

    可視化報表的背景設置成其他顏色或者背景,就會出現容器遮擋了報表背景的情況。這時候就需要在依次點擊右側【容器】、【容器背景】、【背景設置】、顏色/圖片旁的帶顏色的框框,進入調色板小窗口后,將字母A上方
    發表于 03-15 17:10

    keras可視化介紹

    keras可視化可以幫助我們直觀的查看所搭建的模型拓撲結構,以及模型的訓練的過程,方便我們優化模型。 模型可視化又分為模型拓撲結構可視化以及訓練過程可視化。 以上一講的mnist為例,
    發表于 08-18 07:53

    可視化大屏設計模板 | 主題皮膚(報表UI設計)

    下載使用可視化大屏設計模板,減少重復性操作,提高報表制作效率的同時也確保了報表風格一致,凸顯關鍵數據信息。 軟件:奧威BI系統,又稱奧威BI數據可視化工具 所屬功能板塊:主題皮膚上傳下載(數據可視化
    發表于 09-12 10:10
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>