6 月 23 日消息,AI 初創公司Yupp日前正式推出一項“人工評測系統”,邀請用戶給 ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama等業界超過 500 款AI大語言模型進行打分,Yupp將根據用戶的反饋數據,構建出一套名為Yupp AI VIBE(Vibe Intelligence Benchmark)的排行榜,用以直觀展示不同模型水平。
據悉,Yupp由 X 平臺前員工Pankaj Gupta與Gilad Mishne共同創立,旨在讓用戶低成本使用各大 AI 模型的同時,讓用戶為模型打分,繼而生成一系列模型使用數據及排行榜,以幫助 AI 公司改進其模型。
獲悉,平臺新注冊用戶默認擁有 5000 積分,用戶平臺上輸入問題后,平臺將隨機或根據提示內容選取兩個不同的 AI 模型進行作答,并展示雙方回答的優劣對比選項,供用戶輸入反饋評判“哪款模型給出的回答最好”,用戶完成反饋后,平臺會隨機給予用戶一定數量的積分,相應積分可用于繼續調用 AI 模型。
同時,平臺也支持用戶自行指定模型進行比對。每個問題最多可接入 6 個模型進行回復,但若用戶反復提問卻不提供反饋結果,平臺將限制 / 禁止用戶繼續使用相應服務。
本文鏈接:http://www.www897cc.com/showinfo-45-14100-0.htmlYupp 平臺上線:邀用戶低成本使用業界各大 AI 模型,收集評測反饋構建排行榜
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com