<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

FRNet：上下文感知的特征強化模塊

論文標題：Enhancing CTR Predic tion with Context-Aware Feature Representation Learning

收錄會議：

SIGIR 2022

論文鏈接：

https://arxiv.org/abs/2204.08758

簡介與主要貢獻

目前大多數提升點擊率預估效果的模型主要是通過建模特征交互，但是如何設計有效的特征交互結構需要設計人員對數據特點以及結構設計等方面有很強的要求。目前的以建模特征交互為主的模型可以總結為三層范式：embedding layer， feature interaction layer，以及 prediction layer。大多數論文改進集中在 Featrue interaction layer。

然而大部分的模型都存在一個問題：對于一個相同的特征，他們僅僅學到了一個固定的特征表示，而沒有考慮到這個特征在不同實例中不同上下文環境下的重要性。例如實例 1：{female, white, computer, workday} 和實例 2：{female, red, lipstick, workday} 中，特征 “female” 在這兩個實例中的重要性（對最后的預測結果的影響或者與其他特征的關系）是不同的，因此在輸入特征交互層之前我們就可以調整特征 “female” 的重要性或者是表示。

現有的工作已經注意到了這個問題，例如 IFM、DIFM 等，但是他們僅僅在不同的實例中為相同特征賦予不同的權重（vector-level weights），導致不同實例中的相同特征的表示存在嚴格的線性關系，而這顯然是不太合理的。

另一方面，本文希望一個理想的特征細化模塊應該識別重要的跨實例上下文信息，并學習不同上下文下顯著不同的表示。

給出了一個例子：{female, red, lipstick, workday} and {female, red, lipstick, weekend}，在這兩個實例匯總，如果使用self-attention（在 CTR 中很常用的模塊，來識別特征之間的關系），那么因為 “female”和“red”以及“lipstick”的關系比“workday”或者“weekend”的更加緊密，所以在兩個實例中，都會賦予“red”和“lipstick”更大的注意力權重，而對“workday”或者“weekend”的權重都很小。但是用戶的行為會隨著“workday”到“weekend”的變化而變化。

因此本文提出了一個模型無關的模塊 Feature Refinement Network（FRNet）來學習上下文相關的特征表示，能夠使得相同的特征在不同的實例中根據與共現特征的關系以及完整的上下文信息進行調整。主要貢獻如下：

本文提出了一個名為 FRNet 的新模塊，它是第一個通過將原始和互補的特征表示與比特級權值相結合來學習上下文感知特征表示的工作。

FRNet 可以被認為是許多 CTR 預測方法的基本組成部分，可以插入在 embedding layer 之后，提高 CTR 預測方法的性能。

FRNet 表現出了極強集兼容性和有效性。

FRNet模塊

FRNet模型主要包含兩個模塊：

Information Extraction Unit (IEU)：IEU 主要是來捕獲上下文相關的信息（Self-Attention unit）以及特征之間的關系信息（Contextual Information Extractor）來共同學習上下文相關的信息。再 Integration unit 進行融合。

Complementary Selection Gate (CSGate)：CSGate 可以自適應融合原始的和互補的特征表示，這種融合是在 bit-level 級別上的。

2.1 IEU

通過對以往模型的總結，FRNet 主要通過學習特征間的關系（vector-level）以及上下文相關的信息（bit-level）的信息來學習最后的 context-aware representation。首先在在 IEU 中使用以下兩個模塊：

Self-Attention unit：self-attention 善于學習特征之間的關聯信息。FRNet 中使用了一個基本的 Self-attention 結構。

Contextual Information Extractor：在 motivation 部分提到過，self-attention 雖然擅長學習特征之間的關系，但是無法學習整體的上下文信息。所以特地使用了一個簡單的 DNN 模塊來提取不同實例的上下文信息。一個之間的理由是 DNN 可以關注到所有的特征信息（bit-level 信息）。

以上兩個單元分別學習了特征之間的關系，對輸入信息進行壓縮，保存了特征的上下文信息。接下來通過一個 Integration unit 對這兩部分信息進行融合：

可以看到每個實例只有一個上下文信息維度為 d，而經過 self-attention 之后的關系信息維度是 f*d。所以融合之后相當于賦予了每個特征上下文信息，而這部分信息僅僅 self-attention 是無法獲取的。

2.2 CSGate

從圖 2 中可以看到，本文使用了兩個 IEU 模型，其中模塊學習了一組 complementary feature representaion ，學習了一組權重矩陣 ?；?、以及原始的特征表示，FRNet 通過一個選擇門獲得了最后的 context-aware feature representation：

公式主要分為兩部分：

Selected features：首先最后的結果并沒有完全舍棄原有的特征表示 E，但是也沒有像 ResNet 那樣將原始表示 E 直接保留，而是通過權重矩陣進行自適應的選擇。

Complementary features：另一方面，如果僅僅使用原有的特征也會導致模型的表達能力受限?，F有的一些方法也僅僅通過分配一個權重的方法來對特征進行調整。同時僅僅分配權重沒有考慮哪些 unselected information。在計算權重的時候使用可 sigmoid 方式，如果只使用選擇的一部分信息，會導致最后的信息

“不完整”（這里有點借鑒 GRU 以及 LSTM 的設計思路）。因為我們從互補矩陣上選擇互補的信息。

實驗分析

實驗數據集：

3.1 整體分析

主要將 FRNet 應用到 FM 模型中說明 FRNet 的效果。這一部分說明了 FRNet 的效果和效率。

3.2 兼容性分析

將 FRNet 應用到其他模型中查看效果。和其他模塊進行對比。

3.3 超參數分析

對 IEU 模塊中的兩個超參數進行了分析：

DNN 的層數

Self-attention 的 attention size

3.4 消融分析

通過消融實驗來說明 FRNet 中的設計都是有效的：

Learning context-aware feature representations是有效的。這里面所有的變式都對原始的特征進行改進，從而獲得了更好的效果（和#1對比）

Cross-feature relationships and contextual information 是必要的。#2中學習了特征之間的關系，超過了 #1。#13 和 #3 學習了 contextual information，分別超過了 #4 和 #2。

Assigning weights to original features 是合理的。#5 移除了權重信息，發現 #10 和 #11 超過了 #5。同時 #6 和 #7 超過了 #1 也說明了相同的結論。

Learning bit-level weights is more effective than learning vector-level。（#7, #9, #11, #13）超過了對應的（#6, #8, #10, #12），前者學習位級別的權重，而后者學習向量級別的權重。

Complementary Features 也是很關鍵的. 添加了輔助特征之后 #10，#11 分別超過了 #6 和 #7。而且 #12 和 #13 分別超過了 #10 和 #11，說明給輔助特征分配權重也是必要的。

3.5 特征表示可視化分析

本文的 context-aware feature representation 總結起來就是一句話：相同的特征在不同的實例下應該有不同的表示，而且不同實例下的表示不應該有嚴格的線性關系。為了說明這一點，本文通過可視化的方式進行了說明。圖中都是同一個特征的原始表示和 1000 個不同實例中經過 FRNet（或者其他模塊）之后的表示。

EGate 無法學習不同的表示；DIFM 學到的表示存在嚴格的線性關系。而 FRNet 學到的表示同時解決了這些問題。

#6 也是學習向量級別的權重，但是和 DIFM 比可以看到，使用 IEU 學到的權重可以使得特征空間更加分明。#6 中沒有添加輔助特征，所以可以看到還是存在線性關系的，而 FRNet-vec 中添加了輔助特征，消除了線性關系。

FRNet 是學習 bit-level 的權重，而 FRNet-vec 是學習向量級別的權重，從分區的形狀可以看到 FRNet 的非線性特征更加顯著，即更加集中。

3.6 IEU可視化分析

前面說到 Self-attention 中存在的問題：在大部分特征都相同的情況下，無法區分某些不重要的特征表示。在這個實驗中，選擇了兩個特征（只有一個特征是不同的，其他特征都相同），在經過 self-attention 之后，獲得的表示都是相同的。但是在經過 CIE（DNN）壓縮之后，可以看到僅僅因為這一個特征的不同，最后獲得的表示是權重不同的，而這就是 self-attention 無法學習的上下文信息。最后 IEU 將上下文信息融合到 self-attention 中獲得了圖 8（c）的效果：兩個實例中的每一組對應特征都有顯著的差別。

3.7 bit-level權重分析

匯總分析了權重矩陣在 100K 個實例中分布情況。通過均值可以看出來 57.8% 的概率選擇原始特征表示，而 42.2% 的概率選擇互補特征。

審核編輯：李倩

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

模型

模型

+關注

關注
1

文章
2796

瀏覽量
47971
CTR

CTR

+關注

關注
0

文章
34

瀏覽量
14010
dnn

dnn

+關注

關注
0

文章
56

瀏覽量
8975

原文標題：FRNet：上下文感知的特征強化模塊

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

鴻蒙Ability Kit（程序框架服務）【應用上下文Context】

[Context]是應用中對象的上下文，其提供了應用的一些基礎信息，例如resourceManager（資源管理）、applicationInfo（當前應用信息）、dir（應用文件路徑）、area

的頭像

發表于 06-06 09:22 ?129次閱讀

鴻蒙Ability Kit（程序框架服務）【應用<b class='flag-5'>上下文</b>Context】

編寫一個任務調度程序，在上下文切換后遇到了一些問題求解

大家好，我正在編寫一個任務調度程序，在上下文切換后遇到了一些問題。為下一個任務恢復上下文后： __builtin_tricore_mtcr_by_name(\"pcxi\"

發表于 05-22 07:50

鴻蒙開發接口Ability框架：【ServiceExtensionContext】

ServiceExtensionContext模塊是ServiceExtension的上下文環境，繼承自ExtensionContext。

的頭像

發表于 05-20 16:26 ?484次閱讀

鴻蒙開發接口Ability框架：【ServiceExtensionContext】

TC397收到EVAL_6EDL7141_TRAP_1SH 3上下文管理EVAL_6EDL7141_TRAP_1SH錯誤怎么解決？

我收到EVAL_6EDL7141_TRAP_1SH 3 類（TIN4-Free 上下文列表下溢）上下文管理EVAL_6EDL7141_TRAP_1SH錯誤。請告訴我解決這個問題的辦法。

發表于 03-06 08:00

請問risc-v中斷還需要軟件保存上下文和恢復嗎？

risc-v中斷還需要軟件保存上下文和恢復嗎？

發表于 02-26 07:40

ISR的上下文保存和恢復是如何完成的？

函數：ifxCPU_enableInterrupts ()；如果我讓更高優先級的 ISR 中斷優先級較低的 ISR，那么 ISR 的上下文保存和恢復是如何完成的？

發表于 01-22 06:28

FreeRTOS系列技術文章：上下文切換

嵌入式實時操作系統（RTOS）中的上下文切換是指保存和恢復任務的狀態，以使調度程序能夠切換到另一個任務，從而促進多任務處理。

的頭像

發表于 11-21 15:48 ?586次閱讀

全新近似注意力機制HyperAttention：對長上下文友好、LLM推理提速50%

本文介紹了一項近似注意力機制新研究，耶魯大學、谷歌研究院等機構提出了 HyperAttention，使 ChatGLM2 在 32k 上下文長度上的推理時間快了 50%。 Transformer

的頭像

發表于 11-20 09:15 ?364次閱讀

全新近似注意力機制HyperAttention：對長<b class='flag-5'>上下文</b>友好、LLM推理提速50%

為什么transformer性能這么好？Transformer的上下文學習能力是哪來的？

為什么 transformer 性能這么好？它給眾多大語言模型帶來的上下文學習 (In-Context Learning) 能力是從何而來？在人工智能領域里，transformer 已成為深度學習

的頭像

發表于 09-25 12:05 ?895次閱讀

為什么transformer性能這么好？Transformer的<b class='flag-5'>上下文</b>學習能力是哪來的？

Linux技術：什么是cpu上下文切換

過多的上下文切換會消耗 CPU 的時間來保存和恢復寄存器、程序計數器、內核棧和虛擬內存等數據，從而導致系統性能顯著下降。既然上下文切換對系統性能的影響如此之大，那么我們如何檢查它呢？好了，你可以使用 vmstat 工具來查詢你系統的上

發表于 09-01 09:31 ?267次閱讀

HarmonyOS/OpenHarmony(Stage模型）卡片開發應用上下文Context概述

概述 Context是應用中對象的上下文，其提供了應用的一些基礎信息，例如resourceManager（資源管理）、applicationInfo（當前應用信息）、dir（應用開發路徑）、area

發表于 08-24 16:30

首篇！Point-In-Context：探索用于3D點云理解的上下文學習

隨著基于廣泛數據訓練的大模型興起，上下文學習（In-Context Learning）已成為一種新的學習范式，在自然語言處理（NLP）和計算機視覺（CV）任務中表現出了巨大的潛力。

發表于 07-13 14:41 ?504次閱讀

谷歌新作SPAE：GPT等大語言模型可以通過上下文學習解決視覺任務

這篇論文揭示了 PaLM 或 GPT 在通過上下文學習解決視覺任務方面的能力，并提出了新方法 SPAE（Semantic Pyramid AutoEncoder）。這種新方法使得 LLM 能夠執行圖像生成任務，而無需進行任何參數更新。這也是使用上下文學習使得 LLM 生成

發表于 07-09 15:35 ?998次閱讀

我們能否擴展現有的預訓練 LLM 的上下文窗口

? ? 在大家不斷升級迭代自家大模型的時候，LLM（大語言模型）對上下文窗口的處理能力，也成為一個重要評估指標。 ? 比如 OpenAI 的 gpt-3.5-turbo 提供 16k token

發表于 06-30 11:09 ?443次閱讀

下載量超300w的ChatGLM-6B再升級：8-32k上下文，推理提速42%

基于 FlashAttention 技術，項目團隊將基座模型的上下文長度（Context Length）由 ChatGLM-6B 的 2K 擴展到了 32K，并在對話階段使用 8K 的上下文長度訓練

發表于 06-29 16:15 ?1096次閱讀

深度學習自然語言處理
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 一個給NLP領域帶來革新的預訓練語言大模型Bert
Hot 推薦一些翻譯英文文獻比較準確的軟件

New 什么是RAG，RAG學習和實踐經驗
New MOE與MOT：提升LLM效能的關鍵策略比較

精選推薦
更多

文章

資料

帖子

EMC大揭秘 PCB設計必備指南

凡億PCB
1天前

567 閱讀

華為PCBA檢查規范設計總結

凡億PCB
1天前

656 閱讀

第一批人機戀的“AI前任”已經死了

腦極體
1天前

723 閱讀

手把手教你在orcad中設置CIS元器件數據庫，提高工作效率

硬件花園
1天前

916 閱讀

鴻蒙ArkTS聲明式開發：跨平臺支持列表【組件內容填充方式】

jf_46214456
1天前

523 閱讀

計算機網絡信息安全技術研究

吳藩
384

10積分

71下載

AD8229,pdf datasheet (Instrumentation Amplifier)

LL-LING寧
322 KB

10積分

70下載

電壓基準對總諧波失真的影響_英版

平靜港灣
1.96 MB

1積分

0下載

基于EVAL-AD7367SDZ模擬到數字轉換的參考設計

馬占云
1.13MB

5積分

21下載

Sequel Pro MacOS MySQL/MariaDB數據庫管理工具

石飛鵬
8.86 MB

2積分

1下載

無線鼠標主板，可以自己照著做嗎？

angel725
1天前

226 閱讀

【Vision Board創客營連載體驗】基于Vision Board的垃圾分類

大菠蘿Alpha
1天前

91 閱讀

【Vision Board創客營連載體驗】使用 Vision Board 做一個 UVC Camera

ouxiaolong
2天前

93 閱讀

【Vision Board創客營連載體驗】TinyMaix進行手寫數字識別

ouxiaolong
2天前

427 閱讀

【Vision Board創客營連載體驗】RA8D1-Vision Board使用7寸屏設置為RGB666大端模式模式成功顯示攝像頭圖案

donatello1996
3天前

400 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看