當(dāng)前位置：首頁 > 科技 > 軟件

PyTorch 訓(xùn)練，除了會訓(xùn)練還要了解這些

來源：責(zé)編：時間：2024-09-10 09:48:10 145觀看

導(dǎo)讀讓我們討論一下在訓(xùn)練過程中幫助你進(jìn)行實驗的技術(shù)。我將提供一些理論、代碼片段和完整的流程示例。主要要點包括：數(shù)據(jù)集分割指標(biāo)可重復(fù)性配置、日志記錄和可視化分割數(shù)據(jù)集我喜歡有訓(xùn)練集、驗證集和測試集的分割。這里

讓我們討論一下在訓(xùn)練過程中幫助你進(jìn)行實驗的技術(shù)。我將提供一些理論、代碼片段和完整的流程示例。主要要點包括：

數(shù)據(jù)集分割
指標(biāo)
可重復(fù)性
配置、日志記錄和可視化

分割數(shù)據(jù)集

我喜歡有訓(xùn)練集、驗證集和測試集的分割。這里沒什么好說的；你可以使用隨機(jī)分割，或者如果你有一個不平衡的數(shù)據(jù)集（就像在實際情況中經(jīng)常發(fā)生的那樣）——分層分割。

對于測試集，嘗試手動挑選一個“黃金數(shù)據(jù)集”，包含你希望模型擅長的所有示例。測試集應(yīng)該在實驗之間保持不變。它應(yīng)該只在你完成模型訓(xùn)練后使用。這將在部署到生產(chǎn)環(huán)境之前給你客觀的指標(biāo)。別忘了，你的數(shù)據(jù)集應(yīng)該盡可能接近生產(chǎn)環(huán)境，這樣才有代表性。

指標(biāo)

為你的任務(wù)選擇正確的指標(biāo)至關(guān)重要。我最喜歡的錯誤使用指標(biāo)的例子是 Kaggle 的“深空系外行星狩獵”數(shù)據(jù)集，在那里你可以找到很多筆記本，人們在大約有 5000 個負(fù)樣本和 50 個正樣本的嚴(yán)重不平衡的數(shù)據(jù)集上使用準(zhǔn)確率。當(dāng)然，他們得到了 99% 的準(zhǔn)確率，并且總是預(yù)測負(fù)樣本。那樣的話，他們永遠(yuǎn)也找不到系外行星，所以讓我們明智地選擇指標(biāo)。

深入討論指標(biāo)超出了本文的范圍，但我將簡要提及一些可靠的選項：

F1 分?jǐn)?shù)
精確度和召回率
mAP（檢測任務(wù)）
IoU（分割任務(wù)）
準(zhǔn)確率（對于平衡的數(shù)據(jù)集）
ROC-AUC

真實圖像分類問題的分?jǐn)?shù)示例：

+--------+----------+--------+-----------+--------+| split  | accuracy |   f1   | precision | recall |+--------+----------+--------+-----------+--------+| val    | 0.9915   | 0.9897 | 0.9895    | 0.99   || test   | 0.9926   | 0.9921 | 0.9927    | 0.9915 |+--------+----------+--------+-----------+--------+

為你的任務(wù)選擇幾個指標(biāo)：

def get_metrics(gt_labels: List[int], preds: List[int]) -> Dict[str, float]:    num_classes = len(set(gt_labels))    if num_classes == 2:        average = "binary"    else:        average = "macro"    metrics = {}    metrics["accuracy"] = accuracy_score(gt_labels, preds)    metrics["f1"] = f1_score(gt_labels, preds, average=average)    metrics["precision"] = precision_score(gt_labels, preds, average=average)    metrics["recall"] = recall_score(gt_labels, preds, average=average)    return metrics

此外，繪制精確度-閾值和召回率-閾值曲線，以更好地選擇置信度閾值。

http://www.www897cc.com/showinfo-26-112733-0.htmlPyTorch 訓(xùn)練，除了會訓(xùn)練還要了解這些

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： Asp.Net Core實戰(zhàn)-JWT詳解

下一篇： Python 輸入輸出知識點及用法講解

標(biāo)簽：

熱門焦點

6月安卓手機(jī)性價比榜：Note 12 Turbo斷層式碾壓

6月份有一個618，雖然這是京東周年慶的日子，但別的電商也都不約而同的跟進(jìn)了，反正促銷沒壞處，廠商和用戶都能滿意。618期間一些產(chǎn)品也出現(xiàn)了歷史低價，那么各個價位段的產(chǎn)品性價比
帥氣純真少年！日本最帥初中生選美冠軍出爐

日本第一帥哥初一生選美大賽冠軍現(xiàn)已正式出爐，冠軍是來自千葉縣的宗田悠良。日本一直熱衷于各種選美大賽，從“最美JK”起到“最美女星&r
三言兩語說透設(shè)計模式的藝術(shù)-單例模式

寫在前面單例模式是一種常用的軟件設(shè)計模式，它所創(chuàng)建的對象只有一個實例，且該實例易于被外界訪問。單例對象由于只有一個實例，所以它可以方便地被系統(tǒng)中的其他對象共享，從而減少
JavaScript學(xué)習(xí) -AES加密算法

引言在當(dāng)今數(shù)字化時代，前端應(yīng)用程序扮演著重要角色，用戶的敏感數(shù)據(jù)經(jīng)常在前端進(jìn)行加密和解密操作。然而，這樣的操作在網(wǎng)絡(luò)傳輸和存儲中可能會受到惡意攻擊的威脅。為了確保數(shù)據(jù)
梁柱接棒兩年，騰訊音樂闖出新路子

文丨田靜出品丨牛刀財經(jīng)（niudaocaijing）7月5日，企鵝FM發(fā)布官方公告稱由于業(yè)務(wù)調(diào)整，將于9月6日正式停止運營，這意味著騰訊音樂長音頻業(yè)務(wù)走向消亡。騰訊在長音頻領(lǐng)域還在摸索。為
“又被陳思誠騙了”

作者｜張思齊出品｜眾面（ID：ZhongMian_ZM）如今的國產(chǎn)懸疑電影，成了陳思誠的天下。最近大爆電影《消失的她》票房突破30億斷層奪魁暑期檔，陳思誠再度風(fēng)頭無兩。你可以說陳思誠的
iQOO Neo8 Pro評測：旗艦雙芯加持最強(qiáng)性能游戲旗艦

【Techweb評測】去年10月，iQOO推出了一款Neo7手機(jī)，該機(jī)搭載了聯(lián)發(fā)科天璣9000+，配備獨顯芯片Pro+，帶來了同價位段最佳的游戲體驗，一經(jīng)上市便受到了諸多用
iQOO Neo8 Pro搶先上架：首發(fā)天璣9200+ 安卓性能之王

經(jīng)過了一段時間的密集爆料，昨日iQOO官方如期對外宣布：將于5月23日推出全新的iQOO Neo8系列新品，官方稱這是一款擁有旗艦級性能調(diào)校的作品。隨著發(fā)布時
onebot M24巧系列一體機(jī)采用輕薄機(jī)身設(shè)計，現(xiàn)已在各平臺開售

onebot M24 巧系列一體機(jī)目前已在線上線下各平臺同步開售。onebot M24 巧系列采用一體化輕薄機(jī)身設(shè)計，最薄處為 10.15mm，擁有寶石紅、午夜藍(lán)、石墨綠、雅致

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

PyTorch 訓(xùn)練，除了會訓(xùn)練還要了解這些

分割數(shù)據(jù)集

指標(biāo)

6月安卓手機(jī)性價比榜：Note 12 Turbo斷層式碾壓

帥氣純真少年！日本最帥初中生選美冠軍出爐

三言兩語說透設(shè)計模式的藝術(shù)-單例模式

JavaScript學(xué)習(xí) -AES加密算法

梁柱接棒兩年，騰訊音樂闖出新路子

“又被陳思誠騙了”

iQOO Neo8 Pro評測：旗艦雙芯加持最強(qiáng)性能游戲旗艦

iQOO Neo8 Pro搶先上架：首發(fā)天璣9200+ 安卓性能之王

onebot M24巧系列一體機(jī)采用輕薄機(jī)身設(shè)計，現(xiàn)已在各平臺開售

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊