快科技11月15日消息,AI 大模型創業公司“零一萬物”正式公開回應了其Yi大模型涉嫌抄襲LLaMA事件,稱做法確實不妥,將會按照外界建議修改爭議張量(Tensor)名。
零一萬物由創新工場董事長兼CEO李開復于今年創辦,并在本月初宣布推出Yi-34B和Yi-6B兩個開源大模型,號稱對學術研究完全開放,同步開放免費商用申請。
然而在不久前,開發者ehartford在Yi-34B的Hugging Face開源主頁上表示,稱該模型使用了Meta LLaMA的架構,只對兩個張量名稱進行了修改,分別為input_layernorm和post_attention_layernorm。
同時ehartford還表示,其希望該公司在模型被大量使用之前考慮重命名張量以符合LLaMA架構,并將這一更改應用到官方模型中。
零一萬物開源團隊總監Richard Lin昨天承認,修改Llama張量名的做法不妥,將會按照外界建議把“修改后的張量名稱從Yi改回LLaMA”。
Richard Lin表示,出現這一問題主要是由于開發人員疏忽導致,開發人員為了滿足測試要求,在代碼中進行了幾次重命名,但是后面忘記將張量名稱修改回LLaMA了。
不過另一名開發者JosephusCheung則表示,既然官方已經宣布修改Yi大模型張量名稱,那么Yi便是LLaMA的衍生作品,因為其推理部分和模型定義都是“LLaMA”的一部分。
目前Richard Lin暫未對此進行回復。
本文鏈接:http://www.www897cc.com/showinfo-17-25937-0.html李開復旗下“零一萬物”回應大模型被指抄襲:做法確實不妥 將修改爭議張量名
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com