<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

自然語言入門之ESIM

ESIM是ACL2017的一篇論文，在當時成為各個NLP比賽的殺器，直到現在仍是入門自然語言推理值得一讀的文章。

本文根據ESIM原文以及pytorch代碼實現對ESIM模型進行總結，有些地方的敘述保持了與代碼一致而和原文不一致，比如在embedding處與原文就不完全一致，原論文只使用了我下面所寫的initial embedding，不過在代碼性能上應該是不會比原文的更差的，因為代碼過長，僅放一些偽代碼幫助理解。計算過程公式稍多，但無非是LSTM和Attention，理解起來并不太困難。

介紹 Introduction

自然語言推斷 NLI

NLI任務主要是關于給定前提premise和假設hypothesis，要求判斷p和h的關系，二者的關系有三種：1.不相干 neural，2.沖突 contradiction，即p和h有矛盾，3.蘊含 entailment，即能從p推斷出h或兩者表達的是一個意思。

?為什么要研究自然語言推理呢？簡單來講，機器學習的整個系統可以分為兩塊，輸入，輸出。輸入要求我們能夠輸入一個機器能理解的東西，并且能夠很好的表現出數據的特點，輸出就是根據需要，生成我們需要的結果。也可以說整個機器學習可以分為Input Representation和Output Generation。因此，如何全面的表示輸入就變得非常重要了。而自然語言推理是一個分類任務，使用準確率就可以客觀有效的評價模型的好壞；這樣我們就可以專注于語義理解和語義表示。并且如果這部分做得好的話，例如可以生成很好的句子表示的向量，那么我們就可以將這部分成果輕易遷移到其他任務中，例如對話，問答等。這一切都說明了研究自然語言推理是一個非常重要而且非常有意義的事情。

?

下面從Stanford Natural Language Inference (SNLI) corpus數據集里舉幾個例子：

A woman with a green headscarf , blue shirt and a very big grin(咧嘴笑).

The woman is very happy .

上面兩個句子就是 「entailment(蘊含)」 ，因為女人在笑著，所以說她happy是可以推斷出來的。

A woman with a green headscarf , blue shirt and a very big grin .

The woman is young .

「neutral」

沖突矛盾(contradiction)的例子

A woman with a green headscarf , blue shirt and a very big grin.

The woman has been shot .

「contradiction」

她中槍了怎么可能還咧嘴笑呢？

模型架構 Models

輸入編碼 Input Encoding

輸入兩個句子，從one-hot經過embedding層，有兩個embedding層，分別是initial embedding( 「ie」 ) 和 pretrained embedding( 「pe」 )，都使用預訓練好的詞向量初始化，詞向量維度為，不同的是 ie 的詞表規模是訓練集語料的單詞個數，pe 的詞表規模就是預訓練文件所包含的單詞數，且 pe 參數被凍結，ie中沒被包含在預訓練文件的OOV單詞使用高斯分布隨機生成，且所有embedding的方差都被normalize到1，得到和，每個單詞的表示是一個的向量，由其在 ie 和 pe 中對應的詞向量 concat 得到，為預訓練詞向量維度，

src_words, src_extwords_embed, src_lens, src_masks,
tgt_words, tgt_extwords_embed, tgt_lens, tgt_masks = tinputs
src_dyn_embed = self.word_embed(src_words)
tgt_dyn_embed = self.word_embed(tgt_words)
src_embed = torch.cat([src_dyn_embed, src_extwords_embed], dim=-1)
tgt_embed = torch.cat([tgt_dyn_embed, tgt_extwords_embed], dim=-1)

之后使用雙向LSTM分別對a和b進行encoding，得到兩個句子的隱層狀態表示，論文中隱層向量的維度等于預訓練詞向量的維度，因為是bidirectional = True，所以。

src_hiddens = self.lstm_enc(src_embed, src_lens)
tgt_hiddens = self.lstm_enc(tgt_embed, tgt_lens)

局部推理 Locality of inference

就是使用attention建立p和h之間的聯系，即進行對齊操作，a和b中兩個單詞的注意力權重由向量內積得到。

Local inference collected over sequences(不知道咋翻譯)

接著利用得到的注意力權重，對b進行加權求和，即從b中選取與相關的部分來得到表示，對b同理

similarity_matrix = premise_batch.bmm(hypothesis_batch.transpose(2, 1).contiguous())

# hyp_mask shape = [batch_size, tgt_len]
prem_hyp_attn = masked_softmax(similarity_matrix, hypothesis_mask)
# prem_mask shape = [batch_size, src_len]
hyp_prem_attn = masked_softmax(similarity_matrix.transpose(1, 2).contiguous(), premise_mask)

# Weighted sums of the hypotheses for the the premises attention,
# [batch_size, src_len, hidden_size]
src_hiddens_att = weighted_sum(hypothesis_batch,
                               prem_hyp_attn,
                               premise_mask)
# [batch_size, tgt_len, hidden_size]
tgt_hiddens_att = weighted_sum(premise_batch,
                               hyp_prem_attn,
                               hypothesis_mask)

局部推理信息增強 Enhancement of local inference information

現在a的每個單詞有兩個vector表示，分別是和，b亦然，再對兩個vector分別做element-wise的減法與乘法，并把它們 concat 到一起，得到維度為原來四倍長的vector，

src_diff_hiddens = src_hiddens - src_hiddens_att
src_prod_hiddens = src_hiddens * src_hiddens_att
# [batch_size, src_len, 2 * lstm_hiddens * 4] 乘2是雙向
src_summary_hiddens = torch.cat([src_hiddens, src_hiddens_att, src_diff_hiddens, 
                src_prod_hiddens], dim=-1)

tgt_diff_hiddens = tgt_hiddens - tgt_hiddens_att
tgt_prod_hiddens = tgt_hiddens * tgt_hiddens_att
tgt_summary_hiddens = torch.cat([tgt_hiddens, tgt_hiddens_att, tgt_diff_hiddens, 
                                tgt_prod_hiddens], dim=-1)

推理合成 Inference Composition

繼續使用LSTM提取特征，得到兩個句子因果關系表示。因為 concat 操作會使得參數量數倍增長，為了防止參數過多導致的過擬合，把和經過一個激活函數為ReLU的全連接層，將維度從投影到，這樣之后再經過一個BiLSTM層，得到

src_hiddens_proj = self.mlp(src_summary_hiddens)
tgt_hiddens_proj = self.mlp(tgt_summary_hiddens)
# [batch_size, src_len, 2 * lstm_hiddens]
src_final_hiddens = self.lstm_dec(src_hiddens_proj, src_lens)
tgt_final_hiddens = self.lstm_dec(tgt_hiddens_proj, tgt_lens)

池化層 Pooling

將組成整句話的sequence vectors分別通過 average pooling 和 max pooling(element-wise)，變成單獨的一個vector，并將它們再次 concat 起來，得到能完整表示p和h以及兩者之間關系的final向量v

最后將他們送入分類層，分類層包括兩個全連接層，中間是tanh激活函數，輸出維度為標簽種類個數。

hiddens = torch.cat([src_hidden_avg, src_hidden_max, tgt_hidden_avg, tgt_hidden_max], dim=1)
# [batch_size, tag_size]
outputs = self.proj(hiddens)

實驗 Experiments

數據集 Data

數據集使用的是Stanford Natural Language Inference (SNLI) corpus，每條數據是三個句子，分別代表premise, hypothesis和tag

訓練參數設置 Training

使用Adam優化函數，lr=0.0004，batch_size=32，所有LSTM的隱層狀態維度皆為300，dropout也被在各個層中使用且p=0.5，預訓練詞向量使用的是glove.840B.300d，在SNLI數據集上達到了88%的acc。

實驗結果

HIM是使用Tree-LSTM引入了句法信息的方法，較為復雜不再贅述，有興趣的同學可以去閱讀原文。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

eSIM

eSIM

+關注

關注
2

文章
228

瀏覽量
26429
自然語言

自然語言

+關注

關注
1

文章
271

瀏覽量
13221
nlp

nlp

+關注

關注
1

文章
464

瀏覽量
21865
pytorch

pytorch

+關注

關注
2

文章
766

瀏覽量
12873

評論

相關推薦

python自然語言

最近，python自然語言是越來越火了，那么什么是自然語言。自然語言（Natural Language ）廣納了眾多技術，對自然或人類語言進

發表于 05-02 13:50

自然語言處理怎么最快入門？

的基礎都是自然語言處理的范疇之內。二、自然語言處理怎么學？自然語言處理的實際入門步驟來說，假如單單從應用來說，我覺得還是直接先從簡單的應用搞起更好一點，上來就是理論的話可能對一些人還是

發表于 11-28 10:02

hanlp漢語自然語言處理入門基礎知識介紹

`自然語言處理定義：自然語言處理是一門計算機科學、人工智能以及語言學的交叉學科。雖然語言只是人工智能的一部分（人工智能還包括計算機視覺等），但它是非常獨特的一部分。這個星球上有許多生物

發表于 01-02 14:43

【推薦體驗】騰訊云自然語言處理

`相信大家對NLP自然語言處理的技術都不陌生，它是計算機科學領域和AI領域中的一個分支，它與計算機和人類之間使用自然語言進行交互密切相關，而NLP的最終目標是使計算機能夠像人類一樣理解語言。目前

發表于 10-09 15:28

自然語言處理的分詞方法

自然語言處理——75 自動分詞基本算法

發表于 03-19 11:46

關于自然語言處理之54 語言模型(自適應)

自然語言處理——54 語言模型(自適應)

發表于 04-09 08:20

自然語言處理的語言模型

自然語言處理——53 語言模型（數據平滑）

發表于 04-16 11:11

自然語言處理的詞性標注方法

自然語言處理——78 詞性標注方法

發表于 04-21 11:38

求自然語言處理筆記

自然語言處理筆記9-哈工大關毅

發表于 06-04 16:34

自然語言處理——總結、習題

自然語言處理——79 總結、習題

發表于 06-19 11:22

自然語言處理之66參數學習

自然語言處理——66參數學習

發表于 07-16 09:43

什么是自然語言處理？

會識別出我們正確說的話。我們使用免費服務將在線遇到的外語短語翻譯成英語，有時它們可以為我們提供準確的翻譯。盡管自然語言處理取得了長足的進步，但仍有很大的改進空間。[理...

發表于 07-23 10:22

什么是自然語言處理

什么是自然語言處理？自然語言處理任務有哪些？自然語言處理的方法是什么？

發表于 09-08 06:51

自然語言處理怎么最快入門_自然語言處理知識了解

自然語言處理就是實現人機間自然語言通信，實現自然語言理解和自然語言生成是十分困難的，造成困難的根本原因是自然語言文本和對話的各個層次上廣泛存

發表于 12-28 17:10 ?5168次閱讀

自然語言處理的概念和應用自然語言處理屬于人工智能嗎

　　自然語言處理(Natural Language Processing)是一種人工智能技術，它是研究自然語言與計算機之間的交互和通信的一門學科。自然語言處理旨在研究機器如何理解人類語言

發表于 08-23 17:31 ?917次閱讀

精選推薦
更多

文章

資料

帖子

【核芯觀察】IMU慣性傳感器上下游產業梳理（三）

Hobby觀察
14小時前

481 閱讀

PO系列機床測頭助力零部件自動化生產

中圖儀器
1天前

114 閱讀

ArkUI-X開發指南：【SDK配置和構建說明】

jf_46214456
1天前

555 閱讀

鴻蒙OS開發：典型頁面場景【一次開發，多端部署】實戰（音樂專輯頁2）

jf_46214456
1天前

540 閱讀

鴻蒙開發ArkUI-X基礎知識：【ArkUI代碼工程及構建介紹】

jf_46214456
1天前

540 閱讀

色環電阻識別程序下載

哼小曲
75 KB

免費

827下載

寶典級資料-《ADI系統方案精選》

fxx123456
11882KB

8積分

0下載

RFID射頻識別模塊的電路原理圖

劉清川
0.11 MB

2積分

72下載

HertzBeat高性能監控告警系統

李偉
23.01 MB

免費

1下載

hbybyyang-gitee-vscode-plugin VS Code Gitee擴展

李林
0.86 MB

免費

1下載

瑞米派Ubuntu系統移植指南-米爾RemiPi

blingbling111
2天前

416 閱讀

2個不共地的控制器控制4個燈遇到的問題

rgb2251
2天前

802 閱讀

在全志H616核桃派開發板GPIO基礎實驗之UART串口通訊

corkia
2天前

451 閱讀

在全志H616核桃派開發板GPIO基礎實驗之有源蜂鳴器

corkia
2天前

444 閱讀

AD8421單電源設計

jf_81610172
2天前

1118 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看