<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

Transformers.js 2.13、2.14 發布，新增8個新的架構

Transformers.js 作者 Joshua Lochner 在 GitHub 宣傳 Transformers.js v2.13 和 v2.14 發布。具體更新如下（文中提到的鏈接，可通過閱讀原文獲?。?br /> 8 個新的架構!這個版本支持了很多新的多模態架構，能夠支持的架構總數達到了 80 個!1.支持超過 1000 種語言的多語種文本轉語音的 VITS！(#466)

import { pipeline } from '@xenova/transformers';


// Create English text-to-speech pipeline
const synthesizer = await pipeline('text-to-speech', 'Xenova/mms-tts-eng');


// Generate speech
const output = await synthesizer('I love transformers');
// {
//   audio: Float32Array(26112) [...],
//   sampling_rate: 16000
// }

請參閱此處了解可用模型的列表。首先，我們在 Hugging Face Hub 上轉換了約 1140 個模型中的 12 個。如果其中沒有你想要的，可以使用我們的轉換腳本自行轉換。

2. CLIPSeg 用于零樣本圖像分割。(#478)

import { AutoTokenizer, AutoProcessor, CLIPSegForImageSegmentation, RawImage } from '@xenova/transformers';


// Load tokenizer, processor, and model
const tokenizer = await AutoTokenizer.from_pretrained('Xenova/clipseg-rd64-refined');
const processor = await AutoProcessor.from_pretrained('Xenova/clipseg-rd64-refined');
const model = await CLIPSegForImageSegmentation.from_pretrained('Xenova/clipseg-rd64-refined');


// Run tokenization
const texts = ['a glass', 'something to fill', 'wood', 'a jar'];
const text_inputs = tokenizer(texts, { padding: true, truncation: true });


// Read image and run processor
const image = await RawImage.read('https://github.com/timojl/clipseg/blob/master/example_image.jpg?raw=true');
const image_inputs = await processor(image);


// Run model with both text and pixel inputs
const { logits } = await model({ ...text_inputs, ...image_inputs });
// logits: Tensor {
//   dims: [4, 352, 352],
//   type: 'float32',
//   data: Float32Array(495616)[ ... ],
//   size: 495616
// }

您可以按如下方式可視化預測結果：

const preds = logits
  .unsqueeze_(1)
  .sigmoid_()
  .mul_(255)
  .round_()
  .to('uint8');


for (let i = 0; i < preds.dims[0]; ++i) {
  const img = RawImage.fromTensor(preds[i]);
  img.save(`prediction_${i}.png`);
}

Original	`"a glass"`	`"something to fill"`	`"wood"`	`"a jar"`

請查看此處以獲取可用模型列表。

3. SegFormer 用于語義分割和圖像分類。（＃480）

import { pipeline } from '@xenova/transformers';


// Create an image segmentation pipeline
const segmenter = await pipeline('image-segmentation', 'Xenova/segformer_b2_clothes');


// Segment an image
const url = 'https://huggingface.co/datasets/Xenova/transformers.js-docs/resolve/main/young-man-standing-and-leaning-on-car.jpg';
const output = await segmenter(url);

4. Table Transformer 用于從非結構化文檔中提取表格。（＃477）

import { pipeline } from '@xenova/transformers';


// Create an object detection pipeline
const detector = await pipeline('object-detection', 'Xenova/table-transformer-detection', { quantized: false });


// Detect tables in an image
const img = 'https://huggingface.co/datasets/Xenova/transformers.js-docs/resolve/main/invoice-with-table.png';
const output = await detector(img);
// [{ score: 0.9967531561851501, label: 'table', box: { xmin: 52, ymin: 322, xmax: 546, ymax: 525 } }]

5. DiT用于文檔圖像分類。（＃474）

import { pipeline } from '@xenova/transformers';


// Create an image classification pipeline
const classifier = await pipeline('image-classification', 'Xenova/dit-base-finetuned-rvlcdip');


// Classify an image 
const url = 'https://huggingface.co/datasets/Xenova/transformers.js-docs/resolve/main/coca_cola_advertisement.png';
const output = await classifier(url);
// [{ label: 'advertisement', score: 0.9035086035728455 }]

6. SigLIP用于零樣本圖像分類。（＃473）

import { pipeline } from '@xenova/transformers';


// Create a zero-shot image classification pipeline
const classifier = await pipeline('zero-shot-image-classification', 'Xenova/siglip-base-patch16-224');


// Classify images according to provided labels
const url = 'http://images.cocodataset.org/val2017/000000039769.jpg';
const output = await classifier(url, ['2 cats', '2 dogs'], {
    hypothesis_template: 'a photo of {}',
});
// [
//   { score: 0.16770583391189575, label: '2 cats' },
//   { score: 0.000022096000975579955, label: '2 dogs' }
// ]

7. RoFormer 用于蒙版語言建模、序列分類、標記分類和問題回答。(#464)

import { pipeline } from '@xenova/transformers';


// Create a masked language modelling pipeline
const pipe = await pipeline('fill-mask', 'Xenova/antiberta2');


// Predict missing token
const output = await pipe('? Q V Q ... C A [MASK] D ... T V S S');

8.分段任意模型 (SAM)

分段任意模型（SAM）可以在給定輸入圖像和輸入點的情況下，用于生成場景中對象的分割蒙版。請查看此處以獲取完整的預轉換模型列表。對該模型的支持已在#510中添加。

例子+源碼:https://huggingface.co/spaces/Xenova/segment-anything-web

示例：使用 Xenova/slimsam-77-uniform 執行掩模生成。

import { SamModel, AutoProcessor, RawImage } from '@xenova/transformers';


const model = await SamModel.from_pretrained('Xenova/slimsam-77-uniform');
const processor = await AutoProcessor.from_pretrained('Xenova/slimsam-77-uniform');


const img_url = 'https://huggingface.co/datasets/Xenova/transformers.js-docs/resolve/main/corgi.jpg';
const raw_image = await RawImage.read(img_url);
const input_points = [[[340, 250]]] // 2D localization of a window


const inputs = await processor(raw_image, input_points);
const outputs = await model(inputs);


const masks = await processor.post_process_masks(outputs.pred_masks, inputs.original_sizes, inputs.reshaped_input_sizes);
console.log(masks);
// [
//   Tensor {
//     dims: [ 1, 3, 410, 614 ],
//     type: 'bool',
//     data: Uint8Array(755220) [ ... ],
//     size: 755220
//   }
// ]
const scores = outputs.iou_scores;
console.log(scores);
// Tensor {
//   dims: [ 1, 1, 3 ],
//   type: 'float32',
//   data: Float32Array(3) [
//     0.8350210189819336,
//     0.9786665439605713,
//     0.8379436731338501
//   ],
//   size: 3
// }

這樣可以將這三個預測蒙板可視化：

const image = RawImage.fromTensor(masks[0][0].mul(255));
image.save('mask.png');

Input image	Visualized output

接下來，選擇 IoU 分數最高的通道，在本例中是第二個（綠色）通道。將其與原始圖像相交，我們得到了該主題的孤立版本：

Selected Mask	Intersected

其他改進

修復了@Lian1230在#461中提交的關于Next.js Dockerfile的HOSTNAME 問題。
在#467中，在 README 中添加了空模板的鏈接。
在 #503 中添加對使用 ConvNextFeatureExtractor 處理非方形圖像的支持
通過 #507 對遠程 URL 中的修訂進行編碼
@Lian1230 在 #461 中進行了他們的首次貢獻。

改進#485中的pipeline函數的類型。感謝@wesbos提出的建議！

意味著當您將鼠標懸停在類名稱上時，您將獲得示例代碼來幫助您。

此版本是 #485 的后續版本，具有額外的以智能感知為中心的改進（請參閱 PR）。

添加對跨編碼器模型的支持（+修復令牌類型 ID）（#501）

示例：使用 Xenova/ms-marco-TinyBERT-L-2-v2 進行信息檢索。

import { AutoTokenizer, AutoModelForSequenceClassification } from '@xenova/transformers';


const model = await AutoModelForSequenceClassification.from_pretrained('Xenova/ms-marco-TinyBERT-L-2-v2');
const tokenizer = await AutoTokenizer.from_pretrained('Xenova/ms-marco-TinyBERT-L-2-v2');


const features = tokenizer(
    ['How many people live in Berlin?', 'How many people live in Berlin?'],
    {
        text_pair: [
            'Berlin has a population of 3,520,031 registered inhabitants in an area of 891.82 square kilometers.',
            'New York City is famous for the Metropolitan Museum of Art.',
        ],
        padding: true,
        truncation: true,
    }
)


const { logits } = await model(features)
console.log(logits.data);
// quantized:   [ 7.210887908935547, -11.559350967407227 ]
// unquantized: [ 7.235750675201416, -11.562294006347656 ]

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

源碼

源碼

+關注

關注
8

文章
579

瀏覽量
28647
模型

模型

+關注

關注
1

文章
2754

瀏覽量
47821
架構

架構

+關注

關注
1

文章
489

瀏覽量
25248

原文標題：Transformers.js 2.13、2.14 發布，新增 8 個新的架構

文章出處：【微信號：vision263com，微信公眾號：新機器視覺】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

使用基于Transformers的API在CPU上實現LLM高效推理

英特爾 Extension for Transformers是英特爾推出的一個創新工具包，可基于英特爾架構平臺，尤其是第四代英特爾至強可擴展處理器（代號 SapphireRapids，SPR）顯著加速基于Transformers

發表于 01-22 11:11 ?1975次閱讀

Hanlp1.7版本的新增功能一覽

`Hanlp1.7版本在去年下半年的時候就隨大快的DKH1.6版本同時發布了，截至目前1.7大版本也更新到了1.7.1了。本篇分別就1.7.0和1.7.1中新增的功能做一個簡單的匯總介紹。HanLP

發表于 03-22 09:56

用戶管理-動態調用VI（新增用戶插件）

介紹一種基于動態調用VI的用戶登錄管理的方法，結合之前介紹的源代碼發布，將新增的用戶信息（一個獨立的VI）以源代碼發布的形式（去除程序面板）放入指定User List文件夾下，即使生成

發表于 04-26 22:40

DevEco Studio 2.2 Beta2新版本發布，SDK API6正式Release

ReleaseHarmonyOS SDK API6升級為Release版本，版本號為2.2.0.3，配套的編譯構建插件為2.4.5.5。新版本較前一版本在接口內容上無新增和變更。但對于JS API，部分在API6

發表于 09-15 17:28

OpenHarmony 3.0 LTS 新增特性功能

內容：標準系統新增特性功能用戶程序框架支持服務能力(ServiceAbility，DataAbility)和線程模型。支持文件安全訪問，即文件轉成URI和解析URI打開文件的能力。支持設備管理PIN碼

發表于 09-30 08:24

94個JS/eTS開源組件首發上新，肯定有你要用的一款！

2021年的華為開發者大會（HDC2021）上，我們發布了新一代的聲明式UI框架——方舟開發框架（ArkUI）。 ArkUI框架引入了基于TS擴展的聲明式開發范式。自此，越來越多的開發者加入到JS

發表于 05-09 14:51

HarmonyOS 3.0 Beta版本說明

與OpenHarmony SDK配套使用。配套JS/eTS SDK、Native SDK，推薦使用JS/eTS進行應用開發。OpenHarmony SDK新增API Version 8

發表于 07-07 14:16

面向開發者的HarmonyOS 3.0 Beta發布

與OpenHarmony SDK配套使用?！?配套JS/eTS SDK、Native SDK，推薦使用JS/eTS進行應用開發?！?OpenHarmony SDK新增API Version 8

發表于 07-08 11:14

OpenHarmony 3.2 Beta2 版本發布：支持電源管理重啟恢復機制等

worker傳遞I58034 【增強特性】使用libuv統一JS Looper機制I57ZZH 【新增特性】提供創建不同Hap包上下文能力NA包管理新增默認應用管理能力，支持眾測應用、獲取包指紋信息等

發表于 08-02 10:31

DevEco Studio 3.1 Beta1版本發布——新增六大關鍵特性，開發更高效

、開發、編譯、調試等功能。2023年2月16日發布的DevEco Studio 3.1 Beta1版本，在Canary1版本基礎上，新增以下關鍵特性：-> 新增支持Windows 11

發表于 02-24 11:22

GPU-Z 2.26.0正式發布新增對部分假冒顯卡核心的支持

TechPowerUp剛剛發布了最新版的GPU-Z 2.26.0，除了支持部分新硬件，還修復了大量Bug，并新增了對部分假冒顯卡核心的支持，再也不怕被JS坑了。

發表于 10-09 15:26 ?632次閱讀

微雪電子樹莓派2.13寸柔性屏介紹

2.13寸柔性墨水屏 212×104分辨率黑白 e-paper 電子紙功耗低、視角寬、斷電仍可清晰顯示基于樹莓派設計也可以接Raspberry/Jetson Nano/Arduino/STM32等型號 2.13inch e-Paper HAT (D)

發表于 11-25 11:02 ?1056次閱讀

微雪電子2.13寸電子紙裸屏簡介

2.13寸電子墨水屏電子紙屏 250122分辨率黑白支持局部刷新功耗低、視角寬、斷電仍可清晰顯示可接入Raspberry/Jetson Nano/Arduino/Nucleo等主控板

發表于 01-09 10:42 ?1748次閱讀

漢朔2.13寸電子水墨屏的電子標簽把玩

漢朔2.13寸電子水墨屏的電子標簽把玩

發表于 11-30 13:51 ?16次下載

Transformers的功能概述

近年來，我們聽說了很多關于Transformers的事情，并且在過去的幾年里，它們已經在NLP領域取得了巨大成功。Transformers是一種使用注意力機制(Attention)顯著改進深度學習

發表于 01-23 10:15 ?285次閱讀

新機器視覺
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 國內外傳感器知名制造商 Top 100
Hot 世界上第一臺工業機器人的前世今生

New 如何將每個框架插入到SLAM框架中
New PyTorch中激活函數的全面概覽

精選推薦
更多

文章

資料

帖子

鴻蒙ArkUI-X跨語言調用說明：【平臺橋接開發指南（Android）BridgePlugin】

jf_46214456
10小時前

266 閱讀

聊聊幾種常見的單片機通信方式

深圳市浮思特科技有限公司
12小時前

258 閱讀

在IAR中生成庫文件并被應用工程調用的參考流程（下）

瑞薩MCU小百科
10小時前

253 閱讀

在IAR中生成庫文件并被應用工程調用的參考流程（上）

瑞薩MCU小百科
10小時前

213 閱讀

微軟Copilot + PC發布！高通驍龍X系列獨家支持Copilot+，加速AI PC時代到來

章鷹觀察
14小時前

569 閱讀

中國聯通3G專題材料

159520
3.6 MB

免費

710下載

示波器使用教程

378743652
281 KB

免費

0下載

DOM Treemap查看DOM節點的擴展

好名字
3.06 MB

免費

0下載

Dogecoin數字貨幣

李星童
7.65 MB

免費

1下載

Toou 2D基于Qt Quick打造的2D框架

王利祥
0.61 MB

免費

2下載

去除DC-DC開關節點噪聲的緩沖電路如何設計？

笑過就走
1天前

231 閱讀

TLE9879_BLDC電機啟動需要用手撥一下才能轉動，怎么解決？

laisvl
1天前

212 閱讀

波器測出奇怪波形

jf_87640081
2天前

330 閱讀

鴻蒙原生應用元服務開發WEB-使用Devtools工具調試前端頁面

李洋水蛟龍
2天前

213 閱讀

5G智能物聯網課程之Aidlux下人工智能開發（SC171開發套件V2）

蓉兒蓉兒蓉
13天前

761 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看