日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

AI數據源頭揭秘:巨頭壟斷加劇,西方文化主導下的模型偏見何時休?

來源: 責編: 時間:2025-01-30 18:47:03 93觀看
導讀在人工智能領域,LLM和Agent技術日新月異,取得了高度成熟的進展。然而,相比之下,數據收集方面的規范化進程卻明顯滯后。一個引人深思的問題擺在了人們面前:AI訓練所需的海量數據究竟源自何處?為了解答這一問題,一個名為數據溯

在人工智能領域,LLM和Agent技術日新月異,取得了高度成熟的進展。然而,相比之下,數據收集方面的規范化進程卻明顯滯后。一個引人深思的問題擺在了人們面前:AI訓練所需的海量數據究竟源自何處?為了解答這一問題,一個名為數據溯源計劃(DPI)的國際性研究團隊應運而生。CXK28資訊網——每日最新資訊28at.com

Longpre強調,對于基座模型的能力而言,互聯網的規模和數據的異構性至關重要。對規模的需求也促進了合成數據的大量使用。除了語言模型外,近年來多模態生成式AI(GenAI)也迅速崛起,如圖像和視頻生成模型。這些模型同樣需要盡可能多的數據,而視頻模型的語音和圖像數據集中,超過70%的數據都來自YouTube。這一現象對擁有YouTube平臺的谷歌及其母公司Alphabet極為有利,因為文本數據分布在整個互聯網上,由許多不同的網站和平臺控制,但視頻數據的權力卻如此集中地掌握在一家公司手中。CXK28資訊網——每日最新資訊28at.com

AI Now Institute聯合執行董事Sarah Myers West對此表示擔憂,她認為谷歌在開發自己的人工智能模型(如Gemini)方面具有巨大優勢,這引發了人們對其如何向競爭對手提供數據的疑問。更深層次的問題是,如果我們所交互的大多數AI數據集都反映了以利潤為導向的科技巨頭的意圖和設計,那么這些大公司可能會以符合自己利益的方式重塑我們世界的基礎設施。CXK28資訊網——每日最新資訊28at.com

數據集之間的集成和沿襲缺乏一致性,這使得開發人員很難做出正確的數據選擇,也無法保證模型訓練過程中沒有使用過受版權保護的數據。最近,OpenAI、Google等公司與出版商、Reddit等主要論壇以及網絡社交媒體平臺達成了獨家數據共享協議,這進一步加劇了數據壟斷的趨勢。這一趨勢有利于AI領域的最大玩家,他們有足夠的財力進行數據交易,但卻犧牲了學術界研究人員、非營利組織和小公司的利益。CXK28資訊網——每日最新資訊28at.com

更令人擔憂的是,用于訓練AI模型的數據嚴重偏向西方世界。DPI團隊分析的數據集中,超過90%來自歐洲和北美,而非洲的數據占比不到4%。Hugging Face首席倫理學家Giada Pistilli指出,英語在訓練數據中占據主導地位的原因之一是互聯網中90%以上的內容仍然是英語;另一個原因是便利性:將其他語言的數據集放在一起并考慮其他文化需要進行更多的數據工作以及開發人員的有意識意圖。這導致多模態模型的輸出往往以西方文化為焦點,例如當提示AI模型生成婚禮的景象和聲音時,可能只能得到西式婚禮相關的內容。CXK28資訊網——每日最新資訊28at.com

數據集代表了人類社會中的偏見,而經過這些數據訓練的模型又加劇了這些偏見。這可能導致AI模型推動一種以美國為中心的世界觀,同時不經意間抹去其他語言和文化。為了解決這個問題,DPI團隊呼吁加強數據收集方面的規范化進程,提高數據透明度和多樣性,以確保AI技術的公平性和可持續性發展。CXK28資訊網——每日最新資訊28at.com

舉報 0收藏 0打賞 0評論 0
 
 
更多>同類資訊
點擊查看更多 +
全站最新
2025年春節檔電影市場火爆,總票房已超30億!
2025年春節檔電影市場火爆,總票房已超30億!
春節假期自駕,這些食物可能讓你“被酒駕”?
春節假期自駕,這些食物可能讓你“被酒駕”?
特斯拉2024財報揭曉:全年交付破178萬輛,營收增勢放緩股價波動大
特斯拉2024財報揭曉:全年交付破178萬輛,營收增勢放緩股價波動大
雷克薩斯LS系列將變革?七座混動SUV或成新領航者
雷克薩斯LS系列將變革?七座混動SUV或成新領航者
通用汽車2024財報:營收攀升9%,凈利潤卻大幅下滑40%?
通用汽車2024財報:營收攀升9%,凈利潤卻大幅下滑40%?
通用汽車2024財報亮點:營收增9%凈利跌40%,中國市場盈利轉正
通用汽車2024財報亮點:營收增9%凈利跌40%,中國市場盈利轉正
熱門內容
  • DeepSeek兩日連崩,官方回應:技術服務穩定性受多重因素挑戰
  • 三星Galaxy S25系列真機曝光,明日發布會將有何驚喜?
  • DeepSeek故障再現,用戶對話受阻,官方尚未回應
  • 梁文峰:從對沖基金經理到DeepSeek創始人,如何改寫AI版圖?
  • DeepSeek走紅全球,高薪招聘實習生,日薪最高可達千元!
  • DeepSeek凌晨發布Janus-Pro,多模態大模型性能超越OpenAI DALL-E 3
  • DeepSeek深夜發布Janus-Pro,性能超越OpenAI DALL-E 3引關注
  • 支付寶集五福新升級,2025年1月20日活動盛大啟幕!
  • 三星Galaxy S25系列評測:AI大升級,Ultra版全面領跑
  • 掃地機器人進化新形態,追覓機械手引領家庭服務智能革命
  • 2025杰出雇主榜單發布:企業如何應對市場挑戰,人才戰略是關鍵
  • CES 2025:Aria機器人亮相,高度擬人可換臉,專為陪伴而生
  • 三星S25系列發布會前瞻:手機迭代溫和,OneUI 7與AI硬件成亮點?
  • DeepSeek團隊揭秘:清北應屆生領銜,年輕力量如何撐起AI大模型新篇章?
  • 英偉達CES發布Project Digits:3000美元迷你AI超算實拍亮相
本欄最新
扎克伯格:Meta押注開源,AI助手今年望破10億用戶大關
扎克伯格:Meta押注開源,AI助手今年望破10億用戶大關
微軟AI投資大增云營收卻放緩,股價盤后大幅波動引關注
微軟AI投資大增云營收卻放緩,股價盤后大幅波動引關注
DeepSeek背后商業網絡揭秘:梁文鋒關聯15家企業,商標申請競爭激烈
DeepSeek背后商業網絡揭秘:梁文鋒關聯15家企業,商標申請競爭激烈
消息稱軟銀擬 250 億美元入股 OpenAI,成 ChatGPT制造商最大金主
消息稱軟銀擬 250 億美元入股 OpenAI,成 ChatGPT制造商最大金主
DeepSeek服務頻現異常,遭海外大規模攻擊引發關注!
DeepSeek服務頻現異常,遭海外大規模攻擊引發關注!
微軟Q2財報亮眼,智能云及Azure增長未達預期股價下挫
微軟Q2財報亮眼,智能云及Azure增長未達預期股價下挫

本文鏈接:http://www.www897cc.com/showinfo-45-10319-0.htmlAI數據源頭揭秘:巨頭壟斷加劇,西方文化主導下的模型偏見何時休?

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: DeepSeek能否引領國產AI新篇章,還是僅為市場一瞬光芒?

下一篇: Meta財報電話會:AI助手成未來亮點,廣告收入持續增長

標簽:
  • 熱門焦點

最新推薦

猜你喜歡

熱門推薦

相關資訊

Top 主站蜘蛛池模板: 台山市| 界首市| 友谊县| 上杭县| 板桥市| 成都市| 石台县| 婺源县| 丰城市| 常熟市| 辽中县| 铜梁县| 台南县| 莱州市| 南江县| 宜兰市| 江孜县| 丰宁| 高邮市| 双城市| 花莲县| 兴文县| 六盘水市| 姚安县| 东源县| 凤阳县| 榆社县| 额敏县| 五家渠市| 铜梁县| 无极县| 崇信县| 张家界市| 上杭县| 神木县| 淳安县| 米易县| 荔波县| 定州市| 邳州市| 府谷县|