日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 軟件

快手主導研究成果 SAMP 入選人工智能頂會 EMNLP2023

來源: 責編: 時間:2023-12-15 17:15:55 251觀看
導讀 隨著深度學習模型在自然語言處理等領域的廣泛應用,模型推理速度和性能成為關鍵問題。近日,由快手主導的研究成果《SAMP:基于自適應混合精度的訓練后量化模型推理庫》成功入選該領域頂級會議 EMNLP 2023,并于新加

隨著深度學習模型在自然語言處理等領域的廣泛應用,模型推理速度和性能成為關鍵問題。近日,由快手主導的研究成果《SAMP:基于自適應混合精度的訓練后量化模型推理庫》成功入選該領域頂級會議 EMNLP 2023,并于新加坡現場展示和分享。f2Y28資訊網——每日最新資訊28at.com

該研究提出了一種名為 SAMP 的推理加速工具,通過自適應混合精度技術,在保持模型性能的同時,顯著提高推理速度。其中包含自適應混合精度編碼器和一系列先進的融合策略。自適應混合精度編碼器可以在大量的通用矩陣乘法(GEMM)運算和 Transformer 層中找到最佳浮點定點混合精度組合方式,使模型推理的性能最貼近用戶需求(計算精度或推理效率)。最終,混合精度計算取得了比全定點計算更好的計算精度。融合策略對 embedding 算子和量化相關計算操作進行融合改進,使得 CUDA 內核調用減少一半。同時,SAMP 是由 C++ 編程語言實現的端到端工具包,具有出色的推理速度,也降低了訓練后量化推理的工業應用門檻。f2Y28資訊網——每日最新資訊28at.com

f2Y28資訊網——每日最新資訊28at.com

表 1:SAMP 與同類系統相比的創新點f2Y28資訊網——每日最新資訊28at.com

SAMP 具有以下幾項主要亮點:f2Y28資訊網——每日最新資訊28at.com

1.自適應。SAMP 在訓練后量化推理方法中平衡計算精度和延遲性能。用戶可以針對不同的任務選擇合適精度和推理延遲的混合精度配置。SAMP 還可通過自適應分配方法推薦給用戶最佳的量化組合模式。f2Y28資訊網——每日最新資訊28at.com

2.推理效率。在較寬的精度范圍(浮點到定點)中,SAMP 顯示出比其他推理工具包更好的推理加速。在中文語言理解測評基準(CLUE)分類任務數據集中,與 FasterTransformer 相比,SAMP 實現了高達 1.05-1.15 倍的加速。f2Y28資訊網——每日最新資訊28at.com

3.靈活性。SAMP 涵蓋眾多下游任務,如分類、序列標記、文本匹配等。Target 模塊是可擴展的并且可以靈活定制。它對用戶友好且對平臺依賴性較低。SAMP 支持 C++ 和 Python API,僅需要 CUDA 11.0 或更高版本即可。另外,SAMP 也提供了許多模型轉換工具,支持不同格式模型之間相互轉換。f2Y28資訊網——每日最新資訊28at.com

f2Y28資訊網——每日最新資訊28at.com

圖 1:該論文在 EMNLP2023 現場展示和分享f2Y28資訊網——每日最新資訊28at.com

主要研究者來自快手的田榮表示,能在模型推理這樣的場景下取得佳績是整個團隊共同努力的結果,SAMP 的貢獻主要在三個方面,首先是解決了現有后量化(PTQ)推理工具在工業應用中精度損失大的問題;第二是推動了后量化(PTQ)技術在 NLP 多個下游任務中大規模使用;同時,該推理庫還有輕量、靈活,對用戶友好的特點并支持用戶自定義任務目標。f2Y28資訊網——每日最新資訊28at.com

據悉,EMNLP(Empirical Methods in Natural Language Processing)是自然語言處理和人工智能領域的頂級國際會議之一,聚焦于自然語言處理技術在各個應用場景的學術研究,尤其重視自然語言處理的實證研究。該會議曾推動了預訓練語言模型、文本挖掘、對話系統、機器翻譯等自然語言處理領域的核心創新,在學術和工業界都有巨大的影響力,此次入選也意味著快手在該領域的研究成果獲得了國際學者的認可。f2Y28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-26-46378-0.html快手主導研究成果 SAMP 入選人工智能頂會 EMNLP2023

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 高效備考利器 三星 Galaxy Tab S9 FE 助你取得期末佳績

下一篇: 何小鵬、林杰入駐快手 成首批汽車“星推官”

標簽:
  • 熱門焦點
  • K60 Pro官方停產 第三方瞬間漲價

    雖然沒有官方宣布,但Redmi的一些高管也已經透露了,Redmi K60 Pro已經停產且不會補貨,這一切都是為了即將到來的K60 Ultra鋪路,屬于廠家的正常操作。但有意思的是該機在停產之后
  • Mate60手機殼曝光 致敬自己的經典設計

    8月3日消息,今天下午博主數碼閑聊站帶來了華為Mate60的第三方手機殼圖,可以讓我們在真機發布之前看看這款華為全新旗艦的大致輪廓。從曝光的圖片看,Mate 60背后攝像頭面積依然
  • Flowable工作流引擎的科普與實踐

    一.引言當我們在日常工作和業務中需要進行各種審批流程時,可能會面臨一系列技術和業務上的挑戰。手動處理這些審批流程可能會導致開發成本的增加以及業務復雜度的上升。在這
  • JavaScript學習 -AES加密算法

    引言在當今數字化時代,前端應用程序扮演著重要角色,用戶的敏感數據經常在前端進行加密和解密操作。然而,這樣的操作在網絡傳輸和存儲中可能會受到惡意攻擊的威脅。為了確保數據
  • 一個注解實現接口冪等,這樣才優雅!

    場景碼猿慢病云管理系統中其實高并發的場景不是很多,沒有必要每個接口都去考慮并發高的場景,比如添加住院患者的這個接口,具體的業務代碼就不貼了,業務偽代碼如下:圖片上述代碼有
  • Temu起訴SHEIN,跨境電商戰事升級

    來源 | 伯虎財經(bohuFN)作者 | 陳平安日前據外媒報道,拼多多旗下跨境電商平臺Temu正對競爭對手SHEIN提起新訴訟,訴狀稱Shein“利用市場支配力量強迫服裝廠商與之簽訂獨家
  • 阿里瓴羊One推出背后,零售企業迎數字化新解

    作者:劉曠近年來隨著數字經濟的高速發展,各式各樣的SaaS應用服務更是層出不窮,但本質上SaaS大多局限于單一業務流層面,對用戶核心關切的增長問題等則沒有提供更好的解法。在Saa
  • 華為和江淮汽車合作開發百萬元問界MPV?雙方回應來了

    8月1日消息,郭明錤今天在社交平臺發文稱,華為正在和江淮汽車合作,開發售價在100萬元的問界MPV,預計在2024年第2季度量產,銷量目標為上市首年交付5萬輛。
  • 利用職權私自解除被封帳號 Meta開除20多名員工

    11月18日消息,據外媒援引知情人士表示,過去一年時間內,Facebook母公司Meta解雇或處罰了20多名員工以及合同工,指控這些人通過內部系統以不當方式重置用戶帳號,其
Top 主站蜘蛛池模板: 怀仁县| 永川市| 乃东县| 昌乐县| 甘南县| 磐安县| 安塞县| 永善县| 石棉县| 东丰县| 昭平县| 夏津县| 彰化市| 岳池县| 平定县| 水富县| 治多县| 固镇县| 陆丰市| 景洪市| 闻喜县| 安阳县| 乐安县| 乌拉特中旗| 仪征市| 沾益县| 巴林右旗| 册亨县| 锡林郭勒盟| 金寨县| 罗山县| 育儿| 巴林右旗| 永德县| 肇东市| 安塞县| 宁武县| 云安县| 锡林浩特市| 阿瓦提县| 泌阳县|