6 月 23 日消息,AI 初創(chuàng)公司Yupp日前正式推出一項“人工評測系統(tǒng)”,邀請用戶給 ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama等業(yè)界超過 500 款A(yù)I大語言模型進行打分,Yupp將根據(jù)用戶的反饋數(shù)據(jù),構(gòu)建出一套名為Yupp AI VIBE(Vibe Intelligence Benchmark)的排行榜,用以直觀展示不同模型水平。
據(jù)悉,Yupp由 X 平臺前員工Pankaj Gupta與Gilad Mishne共同創(chuàng)立,旨在讓用戶低成本使用各大 AI 模型的同時,讓用戶為模型打分,繼而生成一系列模型使用數(shù)據(jù)及排行榜,以幫助 AI 公司改進其模型。
獲悉,平臺新注冊用戶默認(rèn)擁有 5000 積分,用戶平臺上輸入問題后,平臺將隨機或根據(jù)提示內(nèi)容選取兩個不同的 AI 模型進行作答,并展示雙方回答的優(yōu)劣對比選項,供用戶輸入反饋評判“哪款模型給出的回答最好”,用戶完成反饋后,平臺會隨機給予用戶一定數(shù)量的積分,相應(yīng)積分可用于繼續(xù)調(diào)用 AI 模型。
同時,平臺也支持用戶自行指定模型進行比對。每個問題最多可接入 6 個模型進行回復(fù),但若用戶反復(fù)提問卻不提供反饋結(jié)果,平臺將限制 / 禁止用戶繼續(xù)使用相應(yīng)服務(wù)。
本文鏈接:http://www.www897cc.com/showinfo-45-14100-0.htmlYupp 平臺上線:邀用戶低成本使用業(yè)界各大 AI 模型,收集評測反饋構(gòu)建排行榜
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com