作者丨Alexei Bochkarev
譯者 | 晶顏
審校 | 重樓
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
在當(dāng)今瞬息萬變的技術(shù)世界中,機(jī)器學(xué)習(xí)(ML)后端工程師驚覺自身正處于進(jìn)步的最前沿,被迫不斷適應(yīng)和加速創(chuàng)新。在競(jìng)爭(zhēng)激烈的技術(shù)市場(chǎng)中,產(chǎn)品質(zhì)量是成功的核心,尋找產(chǎn)品改進(jìn)的新方法是ML后端工程師的責(zé)任。在本文中,我們將介紹幫助您成為優(yōu)秀ML后端工程師的五種策略。
在ML后端工程師能夠創(chuàng)新復(fù)雜的應(yīng)用程序之前,他們必須首先了解機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)。理論基礎(chǔ)、經(jīng)典算法和已確立的最佳實(shí)踐不僅僅是學(xué)術(shù)練習(xí);它們還是后續(xù)每一層知識(shí)和專業(yè)技能的基礎(chǔ)。
案例研究:改進(jìn)電子商務(wù)聚合器的查詢分類算法
確定用戶查詢或搜索短語背后意圖的過程稱為查詢分類(Query Classification)。這對(duì)電子商務(wù)聚合器來說至關(guān)重要,這些聚合器會(huì)將來自不同零售商的產(chǎn)品整合到一個(gè)平臺(tái)上。例如,客戶在銷售書籍、電子產(chǎn)品和服裝的電子商務(wù)聚合器中輸入查詢“Harry”,該聚合器可以指向“Harry Potter”(書籍或電影)和“Harry Styles商品”(服裝)等結(jié)果。在這種情況下,精確的查詢分類對(duì)于確保用戶找到他們所需的產(chǎn)品至關(guān)重要,這可以帶來更高的轉(zhuǎn)化率和用戶滿意度。
雖然基于規(guī)則的分類系統(tǒng)可能難以處理這樣的查詢,但經(jīng)過大量數(shù)據(jù)訓(xùn)練的ML模型可以對(duì)用戶正在尋找的內(nèi)容做出有根據(jù)的猜測(cè)。如果您不了解基本的算法和方法,如基于規(guī)則的分類、決策樹、樸素貝葉斯分類器(Nave Bayes Classifier)、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等,那么您成功的機(jī)會(huì)幾乎是渺茫的。
掌握ML基礎(chǔ)知識(shí)的關(guān)鍵要點(diǎn)和技巧
通過定期回顧和加強(qiáng)機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí),您可以鞏固自己的知識(shí),更好地了解趨勢(shì),并在競(jìng)爭(zhēng)中保持領(lǐng)先地位。以下是一些建議:
Dogfooding表面看是“吃自己的狗糧”,現(xiàn)在也被譯為“內(nèi)部測(cè)試”,指的是作為最終用戶使用您自己的產(chǎn)品,以深入了解其優(yōu)點(diǎn)、缺點(diǎn)和需要改進(jìn)的地方。這個(gè)概念的基本思想簡(jiǎn)單而深刻:通過親自體驗(yàn)自己的產(chǎn)品,您將能獲得寶貴的見解,這些見解可以幫助您識(shí)別問題、痛點(diǎn)和創(chuàng)新機(jī)會(huì),否則這些問題可能會(huì)被忽視。
案例研究:幫助一家土耳其搜索引擎提高搜索質(zhì)量
例如,一家土耳其公司在決定從頭開始構(gòu)建一個(gè)新的搜索引擎時(shí),盡管擁有一支稱職的QA團(tuán)隊(duì),并利用了BERT和Neural Networks等先進(jìn)算法,但他們?nèi)匀缓芸赡軙?huì)面臨搜索結(jié)果相關(guān)性和準(zhǔn)確性方面的偏差。“內(nèi)部測(cè)試策略”(Dogfooding Strategy)——所有公司員工開始專門使用自己的搜索引擎來滿足在線搜索需求——可能會(huì)有所幫助。它將有助于定義和解決查詢分類、詞嵌入、UI實(shí)現(xiàn)和廣告放置等方面的缺陷。“內(nèi)部測(cè)試”方法將為技術(shù)團(tuán)隊(duì)提供必要的數(shù)據(jù),以實(shí)現(xiàn)更適合土耳其語言和用戶行為細(xì)微差別的算法。
Dogfooding的最佳實(shí)踐:
在產(chǎn)品開發(fā)過程中,如果沒有定量分析,有時(shí)很難確定需要改進(jìn)的特定領(lǐng)域。它使企業(yè)能夠準(zhǔn)確地識(shí)別差距,并通過可測(cè)量的數(shù)字?jǐn)?shù)據(jù)剖析產(chǎn)品性能,將用戶行為、反饋和產(chǎn)品指標(biāo)轉(zhuǎn)化為有形的數(shù)字,從而執(zhí)行有針對(duì)性的改進(jìn)。
案例研究:提高地圖搜索服務(wù)的排名質(zhì)量
以一個(gè)全球流行的地圖搜索服務(wù)為例,它不斷收到關(guān)于搜索結(jié)果排名質(zhì)量的投訴,用戶聲稱特定的地標(biāo)應(yīng)該得到更多的可見性。該公司可以通過定量分析來檢查用戶搜索模式、點(diǎn)擊率、用戶粘性持續(xù)時(shí)間和重新查詢頻率,從而獲得有價(jià)值的數(shù)據(jù)。獲悉這些數(shù)據(jù)可以幫助定義為什么著名的地標(biāo)經(jīng)常被忽視,并改進(jìn)排名算法,以改進(jìn)關(guān)鍵的“以用戶為中心”的指標(biāo)。
快速分析產(chǎn)品質(zhì)量并得出可操作性見解的技術(shù):
ML模型開發(fā)周期是一個(gè)迭代過程,包括構(gòu)思、訓(xùn)練、測(cè)試和部署。這個(gè)循環(huán)的每一個(gè)循環(huán)都旨在建立一個(gè)更精細(xì)、更準(zhǔn)確、更有效的模型。在日益激烈的市場(chǎng)競(jìng)爭(zhēng)中,縮短周期是絕對(duì)必要的,快速迭代也是必要的。
案例研究:減少自動(dòng)駕駛汽車項(xiàng)目的模型推理時(shí)間
在自動(dòng)駕駛汽車行業(yè)中,駕駛模型的推理時(shí)間至關(guān)重要,因?yàn)檩^長(zhǎng)的推理時(shí)間可能導(dǎo)致道路上的反應(yīng)延遲。通過整合一些真正有效的策略來簡(jiǎn)化開發(fā)周期,可以讓自動(dòng)駕駛汽車更快地實(shí)時(shí)反應(yīng),同時(shí)也允許團(tuán)隊(duì)更頻繁地迭代和改進(jìn)模型,從而進(jìn)一步提高性能。
加快開發(fā)周期的策略包括:
示范性原型(Demonstrative Prototype)是一個(gè)非常有用的工具,可以增加創(chuàng)造成功最終產(chǎn)品的機(jī)會(huì)。它將抽象概念與具體的產(chǎn)品實(shí)現(xiàn)聯(lián)系起來。
示范性原型在產(chǎn)品開發(fā)中所扮演的角色包括:
在本文中,我們研究了如何在這個(gè)蓬勃發(fā)展的行業(yè)中成為優(yōu)秀機(jī)器學(xué)習(xí)(ML)后端工程師。他們專注于持續(xù)學(xué)習(xí)機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí),使用Dogfooding方法和定量分析,加速開發(fā)周期的技術(shù),以及構(gòu)建示范性原型。
如果您選擇ML后端工程師的職業(yè)路徑,那么將這些策略應(yīng)用于您的日常工作可以幫助您提高績(jī)效,將自身水平達(dá)到新的高度,并推動(dòng)整個(gè)技術(shù)領(lǐng)域向前發(fā)展!
參考鏈接:https://hackernoon.com/five-strategies-to-become-top-ml-backend-engineer
本文鏈接:http://www.www897cc.com/showinfo-26-15733-0.html頂級(jí)ML后端工程師“進(jìn)化”指南
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com