久久久不卡网国产精品一区_国产乱淫av一区二区三区_黄页网站大全一区二区_亚洲美女自拍视频

上海發(fā)布“書生·浦語”大模型:評測表現(xiàn)優(yōu)秀

2023-06-07 14:55:20


(相關(guān)資料圖)

“書生·浦語”聯(lián)合團隊選取了20余項評測對其進行檢驗,其中包含全球最具影響力的四個綜合性考試評測集,對“書生·浦語”、清華大學(xué)的GLM-130B、Meta的LLaMA-65B、OpenAI的ChatGPT和GPT-4進行了全面測試。

6月7日,上海人工智能實驗室(上海AI實驗室)、商湯科技聯(lián)合香港中文大學(xué)、復(fù)旦大學(xué)及上海交通大學(xué)發(fā)布千億級參數(shù)大語言模型“書生·浦語”(InternLM),具有1040億參數(shù),在多項中文考試中取得超越ChatGPT的成績,在數(shù)學(xué)考試中成績明顯領(lǐng)先于谷歌、Meta的大模型。

“書生·浦語”聯(lián)合團隊選取了20余項評測對其進行檢驗,其中包含全球最具影響力的四個綜合性考試評測集:由伯克利加州大學(xué)等高校構(gòu)建的多任務(wù)考試評測集MMLU;微軟研究院推出的學(xué)科考試評測集AGIEval(含中國高考、司法考試及美國SAT、LSAT、GRE 和 GMAT等),AGIEval的19個評測大項中有9個大項是中國高考,通常也列為一個重要的評測子集AGIEval(GK);由上海交通大學(xué)、清華大學(xué)和愛丁堡大學(xué)合作構(gòu)建的面向中文語言模型的綜合性考試評測集C-Eval;以及由復(fù)旦大學(xué)研究團隊構(gòu)建的高考題目評測集Gaokao。

實驗室聯(lián)合團隊對“書生·浦語”、清華大學(xué)的GLM-130B、Meta的LLaMA-65B、OpenAI的ChatGPT和GPT-4進行了全面測試,針對上述四個評測集的成績對比如下(滿分100分)。

標(biāo)簽:

關(guān)閉
新聞速遞
主站蜘蛛池模板: 日韩精品成人一区二区在线观看| 国产精品久久久久久久久免费看| 7777在线视频| 久久久成人av| 91免费精品视频| 欧美日本韩国国产| 国产精品欧美日韩久久| 国产精品10p综合二区| 91精品视频免费| 日韩中文视频免费在线观看| 国产日韩精品电影| 日韩一级特黄毛片| 久久久久久久少妇| 亚洲视频导航| 97久久精品国产| 国产一区二区色| 久久久久久国产精品美女| 日日噜噜噜噜夜夜爽亚洲精品| 97精品视频在线| 国产精品大片wwwwww| 国产精品女视频| 精品视频第一区| 久久国产精品一区二区三区 | 久久99中文字幕| 视频一区二区三区免费观看| 国产av不卡一区二区| 国产精品一区av| 久久九九国产精品怡红院 | 欧美日韩一道本| 人人做人人澡人人爽欧美| 亚洲欧美日韩精品在线| 国产精品自拍视频| 国产亚洲精品自在久久| 久久久免费在线观看| 日韩国产精品一区二区三区| 中文字幕欧美日韩一区二区三区 | 欧美精品一区在线| 欧美日韩亚洲在线| 欧美在线视频二区| 日本久久久久亚洲中字幕| 国产精品盗摄久久久|