7月31日消息,據(jù)最新研究顯示,大型語(yǔ)言模型(LLM)的費(fèi)用受到使用語(yǔ)言的顯著影響,可能加劇英語(yǔ)和其他語(yǔ)言使用者之間的人工智能鴻溝。該研究發(fā)現(xiàn),由于計(jì)費(fèi)方式的不同,英語(yǔ)輸入和輸出的費(fèi)用相較于其他語(yǔ)言要低得多,其中簡(jiǎn)體中文費(fèi)用約為英語(yǔ)的兩倍,西班牙語(yǔ)為英語(yǔ)的1.5倍,而緬甸撣語(yǔ)則高達(dá)英語(yǔ)的15倍。
根據(jù)牛津大學(xué)開(kāi)展的調(diào)查,讓大型語(yǔ)言模型處理一句緬甸語(yǔ)句子需要198個(gè)詞元,而同樣的句子用英語(yǔ)書(shū)寫(xiě)只需17個(gè)詞元。詞元代表了通過(guò)API訪問(wèn)大型語(yǔ)言模型所需的計(jì)算力成本,這也意味著使用緬甸語(yǔ)句子的服務(wù)成本比英語(yǔ)高出了11倍。
詞元化模型將用戶(hù)輸入轉(zhuǎn)換為計(jì)算成本的方式,這導(dǎo)致了不同語(yǔ)言使用和訓(xùn)練模型的費(fèi)用差異。例如,中文等語(yǔ)言因其復(fù)雜的結(jié)構(gòu)(無(wú)論是從語(yǔ)法還是字符數(shù)量上),需要更高的詞元化率。例如,在英語(yǔ)中,表達(dá)"你的愛(ài)意"這四個(gè)字符的詞元只需兩個(gè),而在中文中則需要八個(gè)詞元。
這種費(fèi)用差異可能帶來(lái)一系列問(wèn)題,比如限制其他語(yǔ)言用戶(hù)訪問(wèn)大型語(yǔ)言模型的機(jī)會(huì),或者使得使用其他語(yǔ)言的人們?cè)陂_(kāi)發(fā)和創(chuàng)新人工智能應(yīng)用時(shí)承受更高的經(jīng)濟(jì)壓力。這也可能加劇英語(yǔ)和非英語(yǔ)使用者之間的技術(shù)鴻溝,因?yàn)橛⒄Z(yǔ)使用者更容易使用和訪問(wèn)這些語(yǔ)言模型。
據(jù)ITBEAR科技資訊了解,解決這一問(wèn)題的途徑之一是推動(dòng)普惠且包容的人工智能技術(shù)發(fā)展,包括降低其他語(yǔ)言使用者使用大型語(yǔ)言模型的費(fèi)用,并更公平地對(duì)待不同語(yǔ)言的用戶(hù)。這需要技術(shù)公司、研究機(jī)構(gòu)和政府通力合作,確保人工智能技術(shù)的普及和發(fā)展能夠惠及全球各地的人們,而不僅局限于英語(yǔ)使用者。
本文鏈接:http://www.www897cc.com/showinfo-45-916-0.html語(yǔ)言差異導(dǎo)致人工智能費(fèi)用差異:中文使用者面臨挑戰(zhàn)
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com