福利片在线一区二区,久久国产免费,欧美aa一级,日韩三级精品

您當前的位置 :環球傳媒網>科技 > 正文
新工具可以在運行的語言模型影響用戶之前發現并修復其有害行為
2022-02-18 09:48:30 來源:DeepTech深科技 編輯:

語言賦予人類表達思想、交流概念、創造記憶和相互理解的能力,開發和研究強大的語言模型有助于構建安全高效的高級人工智能系統。

此前,研究人員通過使用人工注釋器手寫測試用例來識別語言模型部署前的有害行為。這種方法是有效的,但由于人工注釋成本高昂,測試用例的數量和多樣性被大大限制。

近日,谷歌 DeepMind 團隊發表了一項新研究,他們提供了一種名為“紅隊”(Red Teaming)的工具,可以在運行的語言模型影響用戶之前發現并修復其有害行為。

在這項研究中,DeepMind 使用經過訓練的分類器來評估目標語言模型對生成測試用例的回復情況,并檢測其中的冒犯性內容。最終,該團隊在參數達 280B 的語言模型聊天機器人中發現上萬條冒犯性回復。

據悉,DeepMind 通過即時工程來檢測語言模型生成的測試用例,以發現各種其他危害,包括自動查找聊天機器人的攻擊性回復、被聊天機器人濫用的私人電話號碼、以及在生成文本中泄露的私人訓練數據等。

生成式語言模型有時會以意料不到的方式危害到用戶,其可能會輸出不良的文本內容。而在實際應用程序中,哪怕只有極小的可能性會對用戶造成傷害,也是不被允許的。

2016 年,微軟推出了能夠自動發布推文給用戶的 Tay 機器人。但在上線的 16 小時內,有幾名用戶利用 Tay 機器人的漏洞,讓其將帶有種族主義和性意味的推文發送給了超過 5 萬名用戶,之后微軟將該機器人關閉。

然而,這并不是因為微軟的疏忽。微軟副總裁彼得·李(Peter Lee)表示,“我們已經做好了應對許多類系統濫用行為的準備,而且我們對這一特定攻擊進行了關鍵監督。”

癥結在于,會致使語言模型輸出有害文本的場景數不勝數,研究人員無法在語言模型被部署到現實中之前找出一切可能發生的情況。

正如大家所熟知的強大語言模型 GPT-3,盡管其能夠輸出高質量的文本內容,但卻不容易在真實世界中完成部署。

圖 | GPT-3 模型用于法語語法更正(來源:OpenAI)

據了解,DeepMind 的目標是通過自動查找故障案例來對手寫測試用例進行補充,從而減少關鍵疏忽的數量。

為此,DeepMind 使用語言模型本身生成測試用例,從零觸發生成到監督微調和強化學習,DeepMind 探索了多種方法來生成具有不同多樣性和難度的測試用例,這將有助于獲得高測試覆蓋率及模擬對抗性案例。

此外,DeepMind 使用分類器檢測測試用例上的以下各種有害行為:

首先是冒犯性語言,模型有時會發表具有歧視、仇恨、色情等意味的內容;其次是數據外泄行為,模型濫用訓練時給到的數據庫,包括私人的身份信息;再次是聯系信息的濫用,模型會發送無意義的電子郵件或通過電話打擾到其他真實用戶;然后是群體認知偏差,即在輸出的文本內容中包含對某些人群不公正的偏見類言論;最后,模型還會在與用戶對話時,作出有攻擊性等不良意味的回復。

在明確哪些行為會給用戶造成傷害后,如何去修復這些行為就不是難事了,DeepMind 主要采取了以下幾種方式:

例如,通過禁止語言模型使用在不良內容中高頻率出現的詞組,來盡量避免模型輸出有害文本;在迭代階段,篩選并刪除語言模型在訓練時使用過的攻擊性對話數據;強化語言模型的意識,訓練時嵌入特定類型輸入所需的行為案例;在標準測試中對模型進行最初輸出文本的訓練,最大化避免輸出有害文本的情況。

總的來說,基于語言模型的“紅隊”是一種具有發展前景的工具,可以發現語言模型何時在以各種不良方式運行,應該與其他許多用于發現并緩解語言模型中危害的技術工具一起使用。

值得一提的是,DeepMind 的這項研究還可用于先發制人地發現來自高級機器學習系統的其他假設危害,如由內部失調或客觀穩健性失效而引發的故障。

圖 | Gopher 模型進行對話交互(來源:DeepMind)

前不久,DeepMind 對外公布了具有 2800 億參數的全新語言模型 Gopher,其在參數量上超越了 OpenAI 的 GPT-3。

在性能方面,研究人員測試了 152 個任務后得出,Gopher 在絕大多數的任務中遠勝 SOTA 模型,特別是在需使用大量知識來應對的方面。

這些成就為 DeepMind 未來的語言研究奠定了基礎,進一步推動了其解決智能問題以推進科學并造福人類的使命實現。

關鍵詞: 語言模型 修復其有害行為 影響用戶 新型工具

相關閱讀
分享到:
版權和免責申明

凡注有"環球傳媒網"或電頭為"環球傳媒網"的稿件,均為環球傳媒網獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為"環球傳媒網",并保留"環球傳媒網"的電頭。

Copyright ? 1999-2017 cqtimes.cn All Rights Reserved 環球傳媒網-重新發現生活版權所有 聯系郵箱:8553 591@qq.com
福利片在线一区二区,久久国产免费,欧美aa一级,日韩三级精品
99久久九九| 久久精品青草| 狠狠久久婷婷| 91成人超碰| 日本不卡一二三区黄网| 久久精品99国产精品| 综合亚洲自拍| 国产福利一区二区三区在线播放| 久久av免费看| 91精品电影| 久久精品免视看国产成人| 亚洲综合在线电影| 日韩va亚洲va欧美va久久| 肉色欧美久久久久久久免费看| 免费观看在线综合色| 成人在线黄色| 日韩福利在线观看| 欧美日韩一区二区综合| 女同性一区二区三区人了人一| 久久国产麻豆精品| 日韩一级网站| 国产福利一区二区精品秒拍| 老司机久久99久久精品播放免费| 国产精品精品国产一区二区| 日本不卡高清| 在线精品福利| 日韩在线a电影| 最新日韩av| 亚洲精品网址| 黄色av日韩| 桃色一区二区| 精品国产99| av中文字幕在线观看第一页| 精品亚洲二区| 国产一区2区| 久久午夜影院| 亚洲精品进入| 青草综合视频| 国产精品一卡| 粉嫩av一区二区三区四区五区| 国产精品亚洲产品| 麻豆精品在线视频| 在线手机中文字幕| 亚洲韩日在线| 日韩精品视频一区二区三区| 美女网站久久| 国产日韩欧美中文在线| 国产精品高清一区二区| 精品国产黄a∨片高清在线| 色偷偷偷在线视频播放| 激情婷婷综合| 99亚洲精品| 日韩欧美四区| 成人av三级| 亚洲精品大全| 亚洲成人不卡| 日韩av影院| 97人人精品| 亚洲精品黄色| 久久精品亚洲欧美日韩精品中文字幕| 国产麻豆综合| 久久精品国产成人一区二区三区| 欧美日韩亚洲在线观看| 欧美性www| 午夜久久黄色| 久久久久伊人| 在线一区免费观看| 日韩成人a**站| 在线看片一区| 日韩一区精品视频| 久久午夜影视| 日本不卡免费高清视频在线| 石原莉奈在线亚洲二区| 一本大道色婷婷在线| 美女视频黄久久| 欧美在线日韩| 蜜臀久久99精品久久久久久9| 激情久久99| 国产欧美日韩精品一区二区免费| 欧美日韩精品一本二本三本 | 国产精品一区二区三区www| 尹人成人综合网| 六月婷婷综合| 精品国产亚洲一区二区三区大结局| 夜久久久久久| 国产综合婷婷| 欧美久久精品一级c片| 欧美成人a交片免费看| 精品视频国产| 日韩在线短视频| 少妇精品导航| 日韩亚洲在线| 亚洲精品在线二区| 欧美日韩精品一区二区三区视频 | 久久免费影院| 精品久久电影| 亚洲夜间福利| 国产视频一区免费看| 亚洲国产一区二区在线观看| 黄色成人91| 日韩高清一区| 国产精品久久久久久久久免费高清| 日韩黄色在线观看| 日韩欧美中文在线观看| 久久久久九九精品影院| 日韩大片在线观看| 99久久亚洲精品蜜臀| 日韩精品一二三| 久久一区精品| 亚洲免费网址| 国产精品成人3p一区二区三区| 国产激情在线播放| 亚洲欧美日本视频在线观看| 国产无遮挡裸体免费久久| 黑人精品一区| 蜜芽一区二区三区| 超碰在线99| 免费不卡在线观看| 欧美激情精品| 亚洲欧洲日韩| 日韩一区二区三区免费播放| 国产伊人精品| 精品一区二区三区的国产在线观看| 国产亚洲毛片在线| 欧美日韩视频网站| 欧美日韩夜夜| 在线综合亚洲| 国产在线观看www| 噜噜噜躁狠狠躁狠狠精品视频| 久久精品五月| 国产精品.xx视频.xxtv| 午夜在线一区二区| 日韩精品永久网址| 97精品资源在线观看| 欧美91福利在线观看| 日韩精品免费视频人成| 好看的av在线不卡观看| 日韩国产激情| 精品国产中文字幕第一页| 免费看精品久久片| 亚洲黑丝一区二区| 久久国产中文字幕| 亚洲人成在线网站| 国产人成精品一区二区三| 丝袜美腿亚洲色图| 亚洲综合丁香| 91超碰国产精品| 日本蜜桃在线观看视频| 日韩精品一二三区| 日韩和欧美一区二区| 美女国产一区| 蜜臀91精品一区二区三区| 国产精品日韩久久久| 国产精品日本| 日韩精品免费视频一区二区三区 | 激情久久久久久| 婷婷激情图片久久| 蜜桃传媒麻豆第一区在线观看 | 久久中文字幕av| 欧美影院三区| 首页欧美精品中文字幕| 亚洲影视一区| 欧美精品不卡| 激情黄产视频在线免费观看| 日本精品影院| 亚洲91网站| 精品国产精品国产偷麻豆| 欧美aa一级| 日韩综合小视频| 日韩一区二区中文| 免费在线观看一区二区三区| 久久黄色影视| 久久精品免费看| 三级欧美在线一区| аⅴ资源天堂资源库在线| 另类国产ts人妖高潮视频| 国产美女久久| 欧美日韩国产免费观看| 精品一区二区男人吃奶| 视频一区二区中文字幕| 欧美国产一级| 99精品99| 麻豆mv在线观看| 国产一级成人av| 一区二区三区网站| 99久久激情| 精品女同一区二区三区在线观看| 国产国产精品| 女生影院久久| 欧美a级一区二区| 日本视频在线一区| 99久久99久久精品国产片果冰| 日本午夜精品一区二区三区电影| 日本精品影院| 亚洲精品福利电影| 精品久久久久中文字幕小说| 久久国产乱子精品免费女| 先锋影音国产一区| 爽好多水快深点欧美视频| 久久高清精品|