當(dāng)前位置：首頁 > 科技 > 軟件

快手主導(dǎo)研究成果 SAMP 入選人工智能頂會 EMNLP2023

來源：責(zé)編：時(shí)間：2023-12-15 17:15:55 283觀看

導(dǎo)讀隨著深度學(xué)習(xí)模型在自然語言處理等領(lǐng)域的廣泛應(yīng)用，模型推理速度和性能成為關(guān)鍵問題。近日，由快手主導(dǎo)的研究成果《SAMP：基于自適應(yīng)混合精度的訓(xùn)練后量化模型推理庫》成功入選該領(lǐng)域頂級會議 EMNLP 2023，并于新加

隨著深度學(xué)習(xí)模型在自然語言處理等領(lǐng)域的廣泛應(yīng)用，模型推理速度和性能成為關(guān)鍵問題。近日，由快手主導(dǎo)的研究成果《SAMP：基于自適應(yīng)混合精度的訓(xùn)練后量化模型推理庫》成功入選該領(lǐng)域頂級會議 EMNLP 2023，并于新加坡現(xiàn)場展示和分享。

該研究提出了一種名為 SAMP 的推理加速工具，通過自適應(yīng)混合精度技術(shù)，在保持模型性能的同時(shí)，顯著提高推理速度。其中包含自適應(yīng)混合精度編碼器和一系列先進(jìn)的融合策略。自適應(yīng)混合精度編碼器可以在大量的通用矩陣乘法（GEMM）運(yùn)算和 Transformer 層中找到最佳浮點(diǎn)定點(diǎn)混合精度組合方式，使模型推理的性能最貼近用戶需求（計(jì)算精度或推理效率）。最終，混合精度計(jì)算取得了比全定點(diǎn)計(jì)算更好的計(jì)算精度。融合策略對 embedding 算子和量化相關(guān)計(jì)算操作進(jìn)行融合改進(jìn)，使得 CUDA 內(nèi)核調(diào)用減少一半。同時(shí)，SAMP 是由 C++ 編程語言實(shí)現(xiàn)的端到端工具包，具有出色的推理速度，也降低了訓(xùn)練后量化推理的工業(yè)應(yīng)用門檻。

表 1：SAMP 與同類系統(tǒng)相比的創(chuàng)新點(diǎn)

SAMP 具有以下幾項(xiàng)主要亮點(diǎn)：

1.自適應(yīng)。SAMP 在訓(xùn)練后量化推理方法中平衡計(jì)算精度和延遲性能。用戶可以針對不同的任務(wù)選擇合適精度和推理延遲的混合精度配置。SAMP 還可通過自適應(yīng)分配方法推薦給用戶最佳的量化組合模式。

2.推理效率。在較寬的精度范圍（浮點(diǎn)到定點(diǎn)）中，SAMP 顯示出比其他推理工具包更好的推理加速。在中文語言理解測評基準(zhǔn)（CLUE）分類任務(wù)數(shù)據(jù)集中，與 FasterTransformer 相比，SAMP 實(shí)現(xiàn)了高達(dá) 1.05-1.15 倍的加速。

3.靈活性。SAMP 涵蓋眾多下游任務(wù)，如分類、序列標(biāo)記、文本匹配等。Target 模塊是可擴(kuò)展的并且可以靈活定制。它對用戶友好且對平臺依賴性較低。SAMP 支持 C++ 和 Python API，僅需要 CUDA 11.0 或更高版本即可。另外，SAMP 也提供了許多模型轉(zhuǎn)換工具，支持不同格式模型之間相互轉(zhuǎn)換。

圖 1：該論文在 EMNLP2023 現(xiàn)場展示和分享

主要研究者來自快手的田榮表示，能在模型推理這樣的場景下取得佳績是整個(gè)團(tuán)隊(duì)共同努力的結(jié)果，SAMP 的貢獻(xiàn)主要在三個(gè)方面，首先是解決了現(xiàn)有后量化（PTQ）推理工具在工業(yè)應(yīng)用中精度損失大的問題；第二是推動了后量化（PTQ）技術(shù)在 NLP 多個(gè)下游任務(wù)中大規(guī)模使用；同時(shí)，該推理庫還有輕量、靈活，對用戶友好的特點(diǎn)并支持用戶自定義任務(wù)目標(biāo)。

據(jù)悉，EMNLP（Empirical Methods in Natural Language Processing）是自然語言處理和人工智能領(lǐng)域的頂級國際會議之一，聚焦于自然語言處理技術(shù)在各個(gè)應(yīng)用場景的學(xué)術(shù)研究，尤其重視自然語言處理的實(shí)證研究。該會議曾推動了預(yù)訓(xùn)練語言模型、文本挖掘、對話系統(tǒng)、機(jī)器翻譯等自然語言處理領(lǐng)域的核心創(chuàng)新，在學(xué)術(shù)和工業(yè)界都有巨大的影響力，此次入選也意味著快手在該領(lǐng)域的研究成果獲得了國際學(xué)者的認(rèn)可。

本文鏈接：http://www.www897cc.com/showinfo-26-46378-0.html快手主導(dǎo)研究成果 SAMP 入選人工智能頂會 EMNLP2023

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：高效備考利器三星 Galaxy Tab S9 FE 助你取得期末佳績

下一篇：何小鵬、林杰入駐快手成首批汽車“星推官”

標(biāo)簽：

熱門焦點(diǎn)

一加Ace2 Pro真機(jī)揭曉鈦空灰配色質(zhì)感拉滿

終于，在經(jīng)過了幾波預(yù)熱之后，一加Ace2 Pro的外觀真機(jī)圖在網(wǎng)上出現(xiàn)了。還是博主數(shù)碼閑聊站曝光的，這次的外觀設(shè)計(jì)還是延續(xù)了一加11的方案，只是細(xì)節(jié)上有了調(diào)整，例如新加入了鈦空灰
紅魔電競平板評測：大屏幕硬實(shí)力

前言：三年的疫情因?yàn)橐暇W(wǎng)課的原因激活了平板市場，如今網(wǎng)課的時(shí)代已經(jīng)過去，大家的生活都恢復(fù)到了正軌，這也就意味著，真正考驗(yàn)平板電腦生存的環(huán)境來了。也就是面對著這種殘酷的
Python異步IO編程的進(jìn)程/線程通信實(shí)現(xiàn)

這篇文章再講3種方式，同時(shí)講4中進(jìn)程間通信的方式一、 Python 中線程間通信的實(shí)現(xiàn)方式共享變量共享變量是多個(gè)線程可以共同訪問的變量。在Python中，可以使用threading模塊中的L
微軟邀請 Microsoft 365 商業(yè)用戶，測試視頻編輯器 Clipchamp

8 月 1 日消息，微軟近日宣布即將面向 Microsoft 365 商業(yè)用戶，開放 Clipchamp 應(yīng)用，邀請用戶通過該應(yīng)用來編輯視頻。微軟于 2021 年收購 Clipchamp，隨后開始逐步整合到 Microsof
雅柏威士忌多款單品價(jià)格大跌，泥煤頂流也不香了？

來源 | 烈酒商業(yè)觀察編 | 肖海林今年以來，威士忌市場開始出現(xiàn)了降溫跡象，越來越多不斷暴漲的網(wǎng)紅威士忌也開始悄然回歸市場理性。近日，LVMH集團(tuán)旗下蘇格蘭威士忌品牌雅柏（Ardbeg
慕巖炮轟抖音，百合網(wǎng)今何在？

來源：價(jià)值研究所作者：Hernanderz“難道就因?yàn)樽约旱囊粋€(gè)產(chǎn)品牛逼了，從客服到總裁，都不愿意正視自己產(chǎn)品和運(yùn)營上的問題，選擇逃避了嗎？”這一番話，出自百合網(wǎng)聯(lián)合創(chuàng)
支持aptX Lossless無損傳輸 iQOO TWS 1賽道版發(fā)布限時(shí)優(yōu)惠價(jià)369元

2023年7月4日，“無損音質(zhì)，聲動人心”iQOO TWS 1正式發(fā)布，支持aptX Lossless無損傳輸，限時(shí)優(yōu)惠價(jià)369元。iQOO TWS 1耳機(jī)率先支持端到端aptX Lossless無
與兆芯合作聯(lián)想推出全新旗艦版筆記本電腦開天N7系列

聯(lián)想與兆芯合作推出全新聯(lián)想旗艦版筆記本電腦開天 N7系列。這個(gè)系列采用兆芯KX-6640MA處理器平臺，KX-6640MA 處理器是采用了陸家嘴架構(gòu)，16nm 工藝，4 核 4 線
蘋果MacBook Pro 2021測試：仍不支持平滑滾動

據(jù)10月30日9to5 Mac 消息報(bào)道，蘋果新的 14 英寸和 16 英寸 MacBook Pro 2021 上市后獲得了不錯(cuò)的評價(jià)，亮點(diǎn)包括行業(yè)領(lǐng)先的性能，令人印象深刻的電池續(xù)航，精美豐

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

快手主導(dǎo)研究成果 SAMP 入選人工智能頂會 EMNLP2023

一加Ace2 Pro真機(jī)揭曉鈦空灰配色質(zhì)感拉滿

紅魔電競平板評測：大屏幕硬實(shí)力

Python異步IO編程的進(jìn)程/線程通信實(shí)現(xiàn)

微軟邀請 Microsoft 365 商業(yè)用戶，測試視頻編輯器 Clipchamp

雅柏威士忌多款單品價(jià)格大跌，泥煤頂流也不香了？

慕巖炮轟抖音，百合網(wǎng)今何在？

支持aptX Lossless無損傳輸 iQOO TWS 1賽道版發(fā)布限時(shí)優(yōu)惠價(jià)369元

與兆芯合作聯(lián)想推出全新旗艦版筆記本電腦開天N7系列

蘋果MacBook Pro 2021測試：仍不支持平滑滾動

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊