日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 知識百科

終于有人把監督學習講明白了

來源: 責編: 時間:2023-08-07 16:29:52 234觀看
導讀 01 什么是監督學習要進行監督學習,我們需要從一組樣本數據開始,每個樣本都帶有計算機可以學習的標簽。例如:如你所見,樣本可以是很多不同的東西:數據、文本、聲音、視頻等。此外

 01 什么是監督學習8uV28資訊網——每日最新資訊28at.com

要進行監督學習,我們需要從一組樣本數據開始,每個樣本都帶有計算機可以學習的標簽。例如:8uV28資訊網——每日最新資訊28at.com

8uV28資訊網——每日最新資訊28at.com

如你所見,樣本可以是很多不同的東西:數據、文本、聲音、視頻等。此外,標簽可以是數值,也可以是類型。數值標簽只是一個數值,就像溫度–檸檬水轉換器一樣。類型標簽表示預先定義的集合中的某個類別,例如在犬種檢測器的例子中。8uV28資訊網——每日最新資訊28at.com

使用一些想象力,你可以想出很多其他例子來預測一些事物,根據數值或者類型的標簽來預測其他事物。8uV28資訊網——每日最新資訊28at.com

我們假設已經收集了一些標記過的樣本。現在可以進行監督學習的兩個階段:8uV28資訊網——每日最新資訊28at.com

階段1:訓練階段8uV28資訊網——每日最新資訊28at.com

我們將帶有標簽的樣本提供給一個用于發現模式的算法。例如,該算法可能會注意到,所有的肺炎掃描圖片都具有某些共同的特征(可能是某些不透明的區域),而這些特征在非肺炎掃描圖片中是沒有的。這個階段稱為訓練階段,因為算法會一遍又一遍地觀看樣本數據,并學習識別這些模式。8uV28資訊網——每日最新資訊28at.com

階段2:預測階段8uV28資訊網——每日最新資訊28at.com

現在算法已經知道了肺炎的樣子,于是切換到預測階段。我們可以在這個階段收獲訓練工作的成果。向訓練過的算法展示未被標注的X光掃描圖片,算法會告訴我們它是否具有肺炎特征。8uV28資訊網——每日最新資訊28at.com

這里還有關于監督學習的另一個例子——一種可以識別動物類型的系統。每個輸入數據是一張關于某種動物的圖片,每個樣本的標簽是圖片中動物的物種。在訓練階段,我們向算法展示帶標簽的圖像。在預測階段,我們向算法展示一張未被標注的不帶標簽的圖像,要求算法對該圖像的標簽進行猜測。8uV28資訊網——每日最新資訊28at.com

8uV28資訊網——每日最新資訊28at.com

前面已經說過,計算機程序可以在機器學習的過程中“算出”數據。監督學習就是這種過程的一個例子。在傳統的編程過程中,可以編寫一個程序讓計算機由輸入算出輸出;在監督學習中,只要給出程序輸入和輸出的樣本數據,計算機就能自己學會如何從一個輸入算出一個輸出。8uV28資訊網——每日最新資訊28at.com

既然你已經閱讀了關于監督學習的一種高屋建瓴的解釋,那么可能會有比初學時更多的問題。我們說過,監督學習程序在樣本數據中“注意共同的特征”,并“發現模式”—但它是如何做到的呢?讓我們從一個抽象的層次開始,看看這個魔法是如何實現的。8uV28資訊網——每日最新資訊28at.com

02 魔法背后的數學原理8uV28資訊網——每日最新資訊28at.com

監督學習系統使用函數擬合這一數學概念來理解樣本數據與其標簽之間的關系。下面我們結合具體實例來介紹這個數學概念的基本原理。8uV28資訊網——每日最新資訊28at.com

想象一下,你家屋頂上有一塊太陽能板。你就像是一個監督學習系統一樣,學習太陽能板如何產生能量,并預測在未來某個時間段內產生能量的大小。8uV28資訊網——每日最新資訊28at.com

預測太陽能板的能量輸出需要時間、天氣等變量。時間應該是一個重要變量,所以你決定專注于時間這個變量。對于真正的監督學習過程,你應該從收集每天不同時段太陽能板所產生能量大小的樣本數據開始。經過幾周時間的隨機取樣之后,你得到了如下數據列表:8uV28資訊網——每日最新資訊28at.com

8uV28資訊網——每日最新資訊28at.com

上表中的每一行都是包含輸入變量(時間)與標簽(產生的能量值)的樣本數據,就像那個識別動物的系統一樣,動物圖片是輸入,動物名稱是標簽。8uV28資訊網——每日最新資訊28at.com

如果你將這些樣本數據繪成一幅圖表,那么就能很形象地看到時間與太陽能板產能值之間的關系:8uV28資訊網——每日最新資訊28at.com

8uV28資訊網——每日最新資訊28at.com

我們一看就知道,太陽能板不會在夜間產生能量,并且能量值在中午的時間達到了頂峰。如下圖所示,雖然監督學習系統沒有人腦那樣機敏,但是它能夠將樣本數據近似擬合成某個函數,由此實現對數據的理解。8uV28資訊網——每日最新資訊28at.com

8uV28資訊網——每日最新資訊28at.com

尋找與樣本數據比較接近的擬合函數并不是一件容易的事情。但是,隨后的預測階段就要簡單得多。系統會忘記所有的樣本信息,并使用找到的擬合函數來預測太陽能板在未來某個時間所產生的能量,例如在正午時產生的能量如下圖所示:8uV28資訊網——每日最新資訊28at.com

8uV28資訊網——每日最新資訊28at.com

這就是我所說的監督學習通過函數擬合的方式實現算法功能。監督學習系統接收的實際樣本數據通常是混亂且不完整的。在數據訓練階段,我們通常需要構造一個比較簡單的函數來近似擬合比較復雜的實際數據。在預測階段,則使用所構造的擬合函數實現對未知數據的預測。8uV28資訊網——每日最新資訊28at.com

作為一名程序員,你已經習慣于考慮很多有可能出錯的情形。因此,你可能已經在考慮將樣本數據的處理復雜化的方法。例如,太陽能電池板的能量輸出除了與時間有關之外,還會受到其他因素的影響,比如云層或月份的影響。8uV28資訊網——每日最新資訊28at.com

如果收集了所有這些變量的數據,那么我們將會得到一個多維的點云,將無法使用一個簡單的圖表對這些點云數據進行可視化表示。同樣,對于太陽能電池板,我們需要預測的是數值標簽。你可能想知道如何將這種數值標簽轉換成非數值標簽(如動物的名稱),即類別標簽。8uV28資訊網——每日最新資訊28at.com

你現在只需要知道一點:不管你在上面疊加了多少復雜的東西,監督學習的基本思想就和我們剛才所描述的一樣——找一堆樣本數據,再找到一個可以近似擬合這些樣本數據的函數。8uV28資訊網——每日最新資訊28at.com

現代監督學習系統非常擅長這種擬合工作。事實上,這種擬合功能可以強大到足以擬合出極其復雜的函數關系——例如X光掃描圖片和診斷結論之間的關系。當然,用于擬合這些對應關系的函數對于我們人類而言會是非常復雜的。然而,對于計算機系統而言則是小菜一碟。8uV28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-119-2149-0.html終于有人把監督學習講明白了

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 電子狗慘遭丟棄,戴上VR頭顯找到老友!Meta打出元宇宙感情牌

下一篇: 基于PaddleOCR實現AI發票識別的Asp.net Core應用

標簽:
  • 熱門焦點
  • 2023年Q2用戶偏好榜:12+256G版本成新主流

    3月份的性能榜、性價比榜和好評榜之后,就要輪到2023年的第二季度偏好榜了,上半年的新機潮已經過去,最明顯的肯定就是大內存和存儲的機型了,另外部分中端機也取消了屏幕塑料支架
  • 5月安卓手機好評榜:魅族20 Pro奪冠

    性能榜和性價比榜之后,我們來看最后的安卓手機好評榜,數據來源安兔兔評測,收集時間2023年5月1日至5月31日,僅限國內市場。第一名:魅族20 Pro好評率:97.50%不得不感慨魅族老品牌還
  • 跑分安卓第一!Redmi K60至尊版8月發布!盧偉冰:目標年度性能之王

    8月5日消息,Redmi K60至尊版將于8月發布,在此前舉行的戰略發布會上,官方該機將搭載搭載天璣9200+處理器,安兔兔V10跑分超177萬分,是目前安卓陣營最高的分數
  • K6:面向開發人員的現代負載測試工具

    K6 是一個開源負載測試工具,可以輕松編寫、運行和分析性能測試。它建立在 Go 和 JavaScript 之上,它被設計為功能強大、可擴展且易于使用。k6 可用于測試各種應用程序,包括 Web
  • 摸魚心法第一章——和配置文件說拜拜

    為了能摸魚我們團隊做了容器化,但是帶來的問題是服務配置文件很麻煩,然后大家在群里進行了“親切友好”的溝通圖片圖片圖片圖片對比就對比,簡單對比下獨立配置中心和k8s作為配
  • 年輕人的“職場羞恥感”,無處不在

    作者:馮曉亭 陶 淘 李 欣 張 琳 馬舒葉來源:燃次元“人在職場,應該選擇什么樣的著裝?”近日,在網絡上,一個與著裝相關的帖子引發關注,在該帖子里,一位在高級寫字樓亞洲金
  • 小米MIX Fold 3配置細節曝光:搭載領先版驍龍8 Gen2+罕見5倍長焦

    這段時間以來,包括三星、一加、榮耀等等有不少品牌旗下的最新折疊屏旗艦都得到了不少爆料,而小米新一代折疊屏旗艦——小米MIX Fold 3此前也屢屢被傳
  • SN570 NVMe SSD固態硬盤 價格與性能兼具

    SN570 NVMe SSD固態硬盤是西部數據發布的最新一代WD Blue系列的固態硬盤,不僅閃存技術更為精進,性能也得到了進一步的躍升。WD Blue SN570 NVMe SSD的包裝外
  • 北京:科技教育體驗基地開始登記

      北京“科技館之城”科技教育體驗基地登記和認證工作日前啟動。首批北京科技教育體驗基地擬于2023年全國科普日期間掛牌,后續還將開展常態化登記。  北京科技教育體驗基
Top 主站蜘蛛池模板: 吴旗县| 花莲市| 利辛县| 张北县| 南岸区| 平定县| 铜山县| 牡丹江市| 灌云县| 大同县| 晋宁县| 龙泉市| 阿瓦提县| 咸阳市| 绥滨县| 兴义市| 霍山县| 治县。| 花莲市| 阿克苏市| 平顺县| 全州县| 岐山县| 桂林市| 翁牛特旗| 浪卡子县| 吉水县| 信丰县| 滕州市| 铅山县| 菏泽市| 舞阳县| 井冈山市| 同江市| 定西市| 富顺县| 岳普湖县| 偃师市| 天水市| 剑川县| 孟州市|