<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

TECS資源池上報網絡流程異常告警的問題處理

某資源池TECS上報網絡流程異常告警，告警單次持續15秒-4分鐘之間。

涉及UDM/PCF網元OMU虛機和ISBG網元的OMP虛機，不間斷出現“網絡流量異?！备婢?。

問題分析如下：

1.告警發生在多個網元環境，涉及不通的主機以及主機集合，以及多個業務TOR，按照問題發生的規律性排除單臺的硬件故障。

2.在線TECS版本和硬件組合已在多個站點使用，未發生相關情況，排除軟件版本和硬件的兼容性問題。

3.結合具體現場情況，上層業務多為測試版本，需要重點定位在上層業務和TECS的配合。

4.按照問題發生的嚴重度，優先選擇告警最頻繁的網元虛擬機做抓包定位分析，同時結合歷史數據做規律性排查。

本次網絡流量異常告警涉及網絡虛機多，但問題原因類似，以下涉及的TECS以排查一個網元虛機為例。

1.通過告警詳情，TECS檢查虛機對應端口性能統計，如下圖所示。

2.從告警詳情中得知虛機NFV-R-xxx-56OMP_L的vhu599f535d-1f端口在接收的21859個包中，丟了380個包，丟包率為1.7%。隨即統計了該虛機端口指標，發現虛機端口流入有丟包，端口流出沒有丟包。

3.TECS網絡流量異常告警產生機制，如圖5所示。

a.虛擬機的每一個虛口，對應DVS虛交換都有兩個隊列緩存，用于DVS和該虛口收發包的處理。一個收隊列（VM--->DVS方向，默認隊列長度1024），一個發隊列（DVS--->VM方向，默認隊列長度1024）。該告警是對應DVS的發隊列，即DVS發送報文給虛擬機的方向（圖中紅線示例部分）。

b.DVS收到物理口進來的報文后，根據相應的轉發規則，將對應的報文向不同的虛擬機的虛口轉發，發送的報文會進入發送隊列。

c.DVS根據隊列的標志位狀態決定是否產生中斷信號，通知虛擬機接收發送隊列的包（隊列標志位狀態由虛擬機內部收包進程維護：當虛擬機內正在處理收包時，置標志位狀態標記DVS為不需要發送中斷信號通知虛擬機處理收包；當虛擬機內沒有處理收包時，置標志位標記DVS為需要立即發送中斷信號通知虛擬機處理收包）。

d.當虛擬機沒能及時取走隊列的數據，DVS發向虛擬機虛口的報文填滿隊列時，則會出現隊列消息積壓，超過了隊列的長度，后續多余的報文就會因為無法入隊列而被丟棄，丟棄的報文數統計在overrun中。

e.DVS每隔5秒檢測一次overrun的統計和本周期內收包總數的比值，如果連續3次檢測，overrun的報文占比達到告警門限（丟包超過千分之一），就會上報告警。

f.計算節點上可以使用統計命令dvs show-dpifstats，采集所有虛擬機虛口和物理網口的收發包歷史統計信息，命令需要通過多次采集后，根據采集的結果，觀察虛口是否存在tx_overrun的統計增加。如果存在虛口在采集的周期內增加現象，說明虛擬機處理DVS發送隊列的報文不及時（或者處理能力不足），無法及時消費隊列的報文導致報文overrun。 g.DVS處理能力如下，本次問題的核心不是DVS的處理能力，而是在于業務虛擬機的處理能力。

25G網卡帶寬分配比例為0.24（DVS最大處理能力為12Gbps）。

10G網卡帶寬分配比例為0.35（DVS最大處理能力為 7Gbps）。

4.由于網絡流量異常告警不止一個種類的虛機，統計了4個月非凌晨操作時間的“網絡流量異?！钡臍v史告警，結果如下圖所示。

5.采集觀察每一類虛機指標發現，丟包均為DVS 發送報文給虛擬機的方向。且同類型虛機都是入向到端口有丟包，可以判定是上層網元虛機原因，需要上層業務虛機側協助排查。

6.UDM/PCF網元OMU虛機：

a.現場停止OMU虛機的端到端信令跟蹤任務后，告警不再出現。

b.現網OMU創建大量端到端信令跟蹤任務，未及時進行清理，會出現該現象，原因為：現場OMU 有N個SC。

c.當前信令跟蹤任務同步機制為：每條信令跟蹤任務數據約4K記錄，需要全表同步，即每次信令跟蹤任務激活，都會把所有信令跟蹤任務數據全量同步至前臺。

d.此外，MP向SC同步數據時，要乘以SC個數，即每次要同步N*4K*300的數據。大包需要進行分包，造成一次往前臺同步的數據量很大，造成虛機流量過大，出現告警。

e.TIPI是立刻重傳，只要接收方發現接收的消息不連續，會給發送消息方請求重傳，請求方接收到重傳請求，會立刻重傳。

7.ISBG網元的OMP虛機：

針對資源池DVS進行抓包分析，發現存在瞬間大量包集中收發情況，5秒內瞬時沖高收發27000個包，之后立即恢復正常，如下圖所示。

a.收發包峰值時刻深入分析確定，峰值收發包均由網元性能統計采集數據產生。

b.以日志采集為例，該時刻約產生27000個包，其中“SCSCF 用戶數按模塊統計”性能統計任務瞬間產生12596個包；“內存庫占用按模塊統計”性能統計任務瞬間產生13617個包。

c.兩個性能統計任務瞬間合計產生26213個包（12596+13617=26213），說明資源池產生流量峰值與“SCSCF 用戶數按模塊統計”、“內存庫占用按模塊統計”兩個性能統計任務有關聯。

8.S-CSCF用戶數按模塊統計，如下圖所示。

9.內存庫占用按模塊統計，如下圖所示。

10.查看“SCSCF 用戶數按模塊統計”、“內存庫占用按模塊統計”性能統計任務發現：

a.兩性能統計任務勾選全量模塊對象，實際應用中只需勾選真實激活的SMP模塊即可（CDB、OMP以及未激活SMP模塊無需勾選），按真實應用只需勾選47個SMP測量對象。

b.其余勾選的測量對象（CDB、OMP以及未激活SMP模塊）為無效對象，導致處理性能統計上報的網卡上流量突增，流量突增時會影響底層資源池產生瞬時流量告警。

c.性能統計與外部信令交互區分通道執行，此性能統計流量瞬時突增不會波及VoLTE業務流程，對業務無影響。

d.此性能統計流量突增產生少量丟包情況。由于性能統計數據上報有重傳機制保障，不會影響性能統計數據整粒度采集，所以對性能統計數據呈現無影響。此外，由于流量沖高是瞬時行為，因此對網元自身CPU影響不大。

11.“SCSCF 用戶數按模塊統計”、“內存庫占用按模塊統計”兩個統計任務勾選了大量的無效性能統計測量對象，導致性能統計數據采集異常，單個網卡流量短暫沖高，偶發性造成短時間少量丟包，導致底層資源池產生端口流量異常告警，但不會影響網元業務及性能統計。

1.通過如下方式暫時規避該問題：

a.UDM / PCF：現場測試階段，盡量控制信令跟蹤任務在30個以下，完成測試后刪除測試號碼的跟蹤任務。

b.ISBG：“SCSCF 用戶數按模塊統計”、“內存庫占用按模塊統計”兩個統計任務去除測量對象勾選。

2.網絡流量異常告警是監控上層網元運行正常的重要告警之一，例如當上層網元虛機有下電或者重啟都會產生網絡流量異常告警，可通過告警信息判斷涉及網元、對應虛機及端口。

3.本次網絡流量異常告警主要是因為上層網元有抓包或信令跟蹤導致，告警本身無業務影響。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

PCF

PCF

+關注

關注
0

文章
30

瀏覽量
20807
DVS

DVS

+關注

關注
0

文章
18

瀏覽量
9558
虛擬機

虛擬機

+關注

關注
1

文章
866

瀏覽量
27516
ToR

ToR

+關注

關注
0

文章
8

瀏覽量
10367
NFV

NFV

+關注

關注
3

文章
117

瀏覽量
33589

原文標題：TECS資源池上報網絡流程異常告警的問題處理

文章出處：【微信號：ztedoc，微信公眾號：中興文檔】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

如何處理STM32的HAL庫函數返回異常問題？

（1）官方提供的例程里面，例如返回的結果不是 HAL_OK 的結果，一般直接跳轉到錯誤處理的函數里面了。這樣寫的目的是給開發者根據實際情況自己寫異常處理代碼。（2）比較現實是，在項目中，如果

發表于 04-17 06:39

維諦嵌入式開關電源常見告警處理方法

維諦嵌入式開關電源常見告警處理方法

的頭像

發表于 04-09 17:15 ?397次閱讀

維諦嵌入式開關電源常見<b class='flag-5'>告警</b><b class='flag-5'>處理</b>方法

Service層的異常處理

一般初學者學習編碼和[錯誤處理]時，先知道[編程語言]有一種處理錯誤的形式或約定（如Java就拋異常），然后就開始用這些工具。但卻忽視這問題本質：「處理錯誤是為了寫正確程序」。

的頭像

發表于 01-08 11:29 ?286次閱讀

AWTK 串口屏開發(3) - 告警信息

告警信息是一個常用的功能。在AWTK開源串口屏中，內置告警信息模型，只需設計用戶界面即可實現告警信息的顯示和管理。1.功能告警信息是一個常用的功能，MCU在設備

的頭像

發表于 12-23 08:24 ?213次閱讀

AWTK 串口屏開發(3) - <b class='flag-5'>告警</b>信息

直流屏系統的操作、查詢及異常處理方法

直流屏系統的操作、查詢及異常處理方法

的頭像

發表于 12-15 10:29 ?458次閱讀

直流屏系統的操作、查詢及<b class='flag-5'>異常</b><b class='flag-5'>處理</b>方法

變壓器油位異常的原因和處理方法是什么？

變壓器油位異常的原因和處理方法是什么？變壓器油位異常是指變壓器內部絕緣油的液位偏離正常范圍，常見的異常情況有油位過高或過低。油位異常可能會

的頭像

發表于 11-23 15:34 ?2251次閱讀

FIQ為例說明其中斷處理流程

，也可能是其它的，但是肯定關于此時CPU狀態的。）然后跳轉到異常向量表入口處執行中斷處理流程。 2-執行中斷處理流程 fiq_aarch

的頭像

發表于 11-07 17:48 ?655次閱讀

基于ARM微處理器的機載語音告警系統設計

電子發燒友網站提供《基于ARM微處理器的機載語音告警系統設計.pdf》資料免費下載

發表于 10-18 10:34 ?0次下載

基于ARM微<b class='flag-5'>處理</b>器的機載語音<b class='flag-5'>告警</b>系統設計

如何有效的處理空指針異常

地遇到這個問題。那么我們應該如何有效且優雅的處理空指針異常呢? 下面了不起將詳細的介紹這個處理方案。 1、什么是空指針異常？空指針異常在

的頭像

發表于 09-30 10:25 ?1094次閱讀

異常處理和錯誤碼管理

前言在業務邏輯中，通常使用兩種方式處理異常：返回錯誤碼：優點是性能更好，但是不宜維護。拋出異常：可以使得代碼更清晰，可讀性更好，更符合面向對象。選擇哪種需要根據場景而定，不管如何選擇，只要

的頭像

發表于 09-25 14:51 ?400次閱讀

<b class='flag-5'>異常</b><b class='flag-5'>處理</b>和錯誤碼管理

資源池虛擬機時鐘跳變異常的問題處理

某資源池在運行過程中一臺虛擬機出現業務異常，通過查看日志和異常記錄，判斷為虛擬機發生時鐘跳變問題，如下圖所示。

的頭像

發表于 09-20 11:08 ?669次閱讀

<b class='flag-5'>資源</b>池虛擬機時鐘跳變<b class='flag-5'>異常</b>的問題<b class='flag-5'>處理</b>

資源池后端存儲服務狀態異常的問題處理

故障現象某資源池在巡檢過程中檢查服務狀態，其中云盤后端的服務狀態為down，如下圖所示，影響虛擬機云盤的生命周期管理操作。

的頭像

發表于 09-20 11:06 ?414次閱讀

<b class='flag-5'>資源</b>池后端存儲服務狀態<b class='flag-5'>異常</b>的問題<b class='flag-5'>處理</b>

arm處理器的異常模式包括哪些

arm處理器的異常模式包括哪些 ARM處理器的異常模式是其操作系統和應用程序中最重要的方面之一。異常就是

發表于 09-05 16:22 ?2395次閱讀

ARMv8-M異常處理手冊

ARMv8-M異常模型描述了處理器如何響應異常與每個異常關聯的屬性，例如其優先級和異常返回行為。通常有一個

發表于 08-02 06:09

【產品應用】IoT云平臺中告警觸發規則的應用

物聯網中告警觸發該怎么做？如何實現物聯設備智能化預警？本文將介紹如何通過ZWS云平臺完成告警觸發需求。 ?? 應用場景場景1：物聯網終端采集設備會在運行時，定時上報數據，特定的數據或狀態可能

發表于 07-25 11:40 ?349次閱讀

中興文檔
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 中興FTTR常用業務配置指導
Hot 服務器RAID陣列開啟cache緩存的解決方案

New 算力究竟是個啥？
New 借力NGI工具實現VoNR語音質差問題“接化發”（上）

精選推薦
更多

文章

資料

帖子

采用144核，能效提升66%！英特爾至強6處理器震撼上市，加速數據中心升級

章鷹觀察
14小時前

765 閱讀

如何移植FFmpeg

ElfBoard
2天前

559 閱讀

基于Arm Cortex-CM85內核的RA8D1作為控制器通過MIPI DSI實現LVGL顯示

瑞薩MCU小百科
2天前

778 閱讀

便攜式直流接地故障查找儀如何使用——每日了解電力知識

武漢摩恩
2天前

804 閱讀

重磅！英特爾發布intel3制程至強6能效核處理器，賦能數據中心能效升級

章鷹觀察
2天前

813 閱讀

高亮度LED驅動電路集錦

嗶嗶嗶-
505 KB

免費

3220下載

電子報2011第六期

aiy8ss
9.30 MB

免費

0下載

創新的新能源汽車無線充電解決方案

Duke
109KB

10積分

34下載

6.6kW OBC的CLLC級參考設計套件SEC-6K6W-CLLC-GEVK數據手冊

4.80 MB

免費

5下載

RZ/T2M, RZ/T2L, RZ/N2L電機解決方案套件數據手冊

37.17 MB

免費

5下載

I.MX6ULL-飛凌 ElfBoard ELF1板卡 - 如何在Ubuntu中編譯OpenCV庫(X86架構）

jf_25331175
3天前

715 閱讀

鴻蒙原生應用元服務開發-設備管理USB服務開發場景與接口

李洋水蛟龍
3天前

301 閱讀

嵌入式學習-飛凌ElfBoard ELF 1板卡 - 如何在Ubuntu中編譯OpenCV庫

jf_25331175
3天前

899 閱讀

【留言有禮】佳節至，分享“粽”要記憶，傳遞溫馨祝福，贏取精美禮品！

ElecFans小喇叭
4天前

979 閱讀

無刷電機用的單電阻采樣的FOC，拿天線貼著電機線或者貼近采樣芯片，電機就會停轉

剛剛回國弄
4天前

1483 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看