欧美日韩激情电影,久久亚洲精品毛片,日日夜夜天天综合入口,亚洲激情六月丁香

您的位置: 首頁 >科技 >

斯坦福究警告:不要迷信大模型涌現 是度量選擇結果

2023-05-04 14:52:42 編輯:上官容紫 來源:
導讀 斯坦福大學的研究者對于LLM涌現能力這一說法有一定的質疑,認為這是人為進行選擇度量方式最終所產生的結果,涌現是指在小模型當中不存在,

斯坦福大學的研究者對于LLM涌現能力這一說法有一定的質疑,認為這是人為進行選擇度量方式最終所產生的結果,涌現是指在小模型當中不存在,而出現在大規模模型當中的一種能力,沒有那么多的奇跡會出現。

根據斯坦福大學研究者最新的研究情況,大模型的涌現能力和任務在評價方面指標設置的強度有一定的關系而不是在特定任務和規模下模型行為所發生的一種基本性質的變化,將一些指標變得更為連續和平滑之后,涌現的這種現象就不會十分明顯而適合現行更為接近。

涌現能力首先是在GPT-3這一個家族系列當中發現,在后續的工作過程中,對于這一發現再次做出了強調,表示特定的任務上有一些性能在規模上有時是比較難預測的涌現,這種涌現出來的能力讓人感覺到較為驚訝。所以突然特定出線的能力方面的擴展也被認為是大型語言模型其中的兩個定義的特征其中之一。

斯坦福大學研究者對于特定任務中輸出作為模型規模的函數涌現性以及不可預測的變化作出了質疑,在模型組出現錯誤率的情況,跟隨著模型規模的增加會更為持續平滑并且發生可以預測到的一些變化,看似突然出現了一些不可預測的尖銳程度的變化,很可能是研究者在測量方法上選擇的不同引起的現象。

這就意味著表現這種能力可能是一種虛假的情況,一部分原因是因為在測試數據上擁有太少,對于較小模型的性能不能夠準確地做出估計,另一部分原因是因為對于大規模的模型過少的做出了估計。


免責聲明:本文由用戶上傳,如有侵權請聯系刪除!

最新文章

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ   備案號:

本站除標明“本站原創”外所有信息均轉載自互聯網 版權歸原作者所有。

郵箱:toplearningteam#gmail.com (請將#換成@)

主站蜘蛛池模板: 绥中县| 左贡县| 惠来县| 洛川县| 政和县| 贺兰县| 桦甸市| 兴宁市| 越西县| 和硕县| 石嘴山市| 南部县| 孝感市| 进贤县| 长阳| 台南县| 大安市| 昌平区| 原阳县| 黄大仙区| 报价| 大竹县| 新竹县| 石家庄市| 宜川县| 开江县| 宿州市| 临邑县| 靖江市| 钟山县| 云霄县| 遂宁市| 望城县| 英德市| 孟村| 于都县| 屯昌县| 张家川| 信阳市| 昌平区| 吉安县|