福利片在线一区二区,久久国产免费,欧美aa一级,日韩三级精品

您當(dāng)前的位置 :環(huán)球傳媒網(wǎng)>資訊 > 正文
【它真來(lái)了嗎?RulaiGPT:如~來(lái)~】訓(xùn)練一個(gè)如來(lái)GPT,發(fā)現(xiàn)事情并沒(méi)有那么簡(jiǎn)單...-世界微資訊
2023-07-02 10:41:48 來(lái)源:?jiǎn)袅▎袅?/span> 編輯:

最近“如來(lái)”話術(shù)非常之火啊,看一次笑一次,不懂這個(gè)梗的朋友們可以回顧一下:?

【如來(lái)原版】


【資料圖】

那么,我們能讓 GPT也學(xué)會(huì) 如來(lái)話術(shù)嗎?思路其實(shí)很簡(jiǎn)單,只要我們把那些經(jīng)典語(yǔ)錄讓 GPT 學(xué)習(xí)學(xué)習(xí)。筆者自己做了些實(shí)驗(yàn),還確實(shí)訓(xùn)練處理一個(gè)馬馬虎虎的 「如來(lái)GPT」,雖然泛化性能并不好。不過(guò)整個(gè)實(shí)驗(yàn)過(guò)程還是挺有意思,這里分享出來(lái),在結(jié)尾我還提出了一些值得探索的點(diǎn),希望有興趣的朋友一起討論!

這個(gè)小項(xiàng)目是基于我最近的一個(gè)Github —— LLM-Tuning實(shí)現(xiàn)的,本文涉及到的相關(guān)的代碼、數(shù)據(jù)集、教程都在倉(cāng)庫(kù)里,建議點(diǎn)個(gè)Star??后配合本文食用:

項(xiàng)目地址:

/beyondguo/LLM-Tuning

一、數(shù)據(jù)準(zhǔn)備

我們從網(wǎng)上先收集最基本的“如來(lái)話術(shù)”:

{"q":"問(wèn):中國(guó)人認(rèn)為宇宙萬(wàn)法的那個(gè)源頭,它是什么","a":"答:它是如如"}{"q":"問(wèn):我說(shuō)如來(lái),他真來(lái)了嗎","a":"答:如來(lái)"}{"q":"問(wèn):我經(jīng)常說(shuō)如來(lái)這個(gè)詞有秘密,如來(lái)、如來(lái)了嗎?","a":"答:如來(lái)~"}{"q":"問(wèn):到底來(lái)沒(méi)來(lái)?","a":"答:如來(lái)~"}{"q":"問(wèn):如來(lái)是什么意思?","a":"答:來(lái)了又好像沒(méi)來(lái),沒(méi)來(lái)又好像來(lái)了"}

當(dāng)然,這些是肯定不夠的,所以我們要做一些數(shù)據(jù)增強(qiáng),這里我們可以直接使用 ChatGPT 來(lái)幫我們做增強(qiáng):

例如,我給 ChatGPT 這樣的 instruction:

{"q":"問(wèn):到底來(lái)沒(méi)來(lái)?","a":"答:如來(lái)~"}請(qǐng)把問(wèn)題q改寫(xiě)10次,然后返回。每一行一個(gè)json(不要換行),共10行。

就會(huì)得到:

{"q":?"問(wèn):是否已經(jīng)到達(dá)?",?"a":?"答:如來(lái)~"}{"q":?"問(wèn):是否已經(jīng)抵達(dá)?",?"a":?"答:如來(lái)~"}{"q":?"問(wèn):是否已經(jīng)來(lái)了?",?"a":?"答:如來(lái)~"}{"q":?"問(wèn):到底到了沒(méi)有?",?"a":?"答:如來(lái)~"}{"q":?"問(wèn):是否已經(jīng)到場(chǎng)?",?"a":?"答:如來(lái)~"}{"q":?"問(wèn):是否已經(jīng)現(xiàn)身?",?"a":?"答:如來(lái)~"}{"q":?"問(wèn):是否已經(jīng)抵京?",?"a":?"答:如來(lái)~"}{"q":?"問(wèn):是否已經(jīng)到達(dá)目的地?",?"a":?"答:如來(lái)~"}{"q":?"問(wèn):是否已經(jīng)抵達(dá)所在地?",?"a":?"答:如來(lái)~"}{"q":?"問(wèn):到底有沒(méi)有來(lái)?",?"a":?"答:如來(lái)~"}

通過(guò)這樣的方法,我們對(duì)上述每個(gè)話術(shù),都做數(shù)據(jù)增強(qiáng)。當(dāng)然,我們還可以手動(dòng)添加一些其他的擾動(dòng)。文件rulai_中展示了我數(shù)據(jù)增強(qiáng)之后的語(yǔ)料。

二、讓模型學(xué)習(xí)“如來(lái)話術(shù)”

這里我們采用 baichuan-7B作為基座,來(lái)訓(xùn)練這個(gè)模型。這是因?yàn)?baichuan-7B 本身沒(méi)有經(jīng)過(guò) chat 式的訓(xùn)練,所以我們可以更好地觀察模型是否真的學(xué)到了新的話術(shù)。

分詞:

#?_VISIBLE_DEVICES=0?python?tokenize_dataset_?\????--model_checkpoint?baichuan-inc/baichuan-7B?\????--input_file?rulai_?\????--prompt_key?q?\????--target_key?a?\????--save_name?rulai_baichuan-7B?\????--max_seq_length?2000?\????--skip_overlength?False

LoRA 訓(xùn)練:

#?_VISIBLE_DEVICES=0,1,2,3?python?baichuan_lora_?\????--tokenized_dataset?rulai_baichuan-7B?\????--lora_rank?4?\????--per_device_train_batch_size?16?\????--gradient_accumulation_steps?1?\????--num_train_epochs?3?\????--save_steps?200?\????--save_total_limit?2?\????--learning_rate?1e-4?\????--fp16?\????--remove_unused_columns?false?\????--logging_steps?50?\????--output_dir?weights/rulai_baichuan-7B

我這里將上述訓(xùn)練好的模型,稱之為 RulaiGPT_v0,即最初始的版本。

測(cè)一測(cè)咱們的 RulaiGPT:

效果

例子1:

輸入:我說(shuō)如來(lái),誒,他到底來(lái)沒(méi)來(lái)?

baichuan-7B輸出:來(lái)了。我又說(shuō),你咋知道的呢?他說(shuō),你看?。?/code>

RulaiGPT_v0輸出:如來(lái)

例子2:

輸入:他到底來(lái)沒(méi)來(lái)???

baichuan-7B輸出:來(lái)了,但不是我想要的那個(gè)。

RulaiGPT_v0輸出:如~來(lái)~

三、完了,它只會(huì)“如來(lái)”了,咋辦?【拯救災(zāi)難性遺忘】

如果全部的訓(xùn)練語(yǔ)料都是這些如來(lái)話術(shù),可能會(huì)讓模型只會(huì)講這些話:你問(wèn)它“我睡不著咋辦?”,他回復(fù)“如來(lái)~”;你問(wèn)他“你是誰(shuí)開(kāi)發(fā)的?”,他也說(shuō)“如來(lái)”。。。這就很尷尬了,相當(dāng)于學(xué)廢了。

例子:

輸入:我睡不著!

baichuan-7B輸出:你該吃藥了。失眠,是現(xiàn)代人最常見(jiàn)的睡眠障礙。......

RulaiGPT_v0輸出:如來(lái)~

本質(zhì)上,這是一個(gè)“災(zāi)難性遺忘”的問(wèn)題,我們給的如來(lái)語(yǔ)聊對(duì)原始的概率分布造成了太大了影響,所以你問(wèn)啥這個(gè)GPT都覺(jué)得回答“如來(lái)”是最有可能的。

我們希望模型還能做一些其他的正常對(duì)話,所以我做了下面的兩個(gè)嘗試:

1. 將如來(lái)話術(shù),跟正常的對(duì)話進(jìn)行混合,得到新的訓(xùn)練語(yǔ)料。然后使用這個(gè)語(yǔ)料重新訓(xùn)練 LoRA?!居洖?RulaiGPT_v1

我這里直接采用的是ChatBaichuan-HC3 項(xiàng)目中的語(yǔ)料(一萬(wàn)多條),跟rulai_(不到一百條)拼湊成 rulai_文件(為了節(jié)省GitHub repo空間,這個(gè)大家自行構(gòu)造,就是兩個(gè)json文件合并)。

使用該數(shù)據(jù),重新訓(xùn)練。

訓(xùn)練完之后,我發(fā)現(xiàn),模型可以正常對(duì)話了,但是“如來(lái)”話術(shù)又不太會(huì)了...

例子(正常對(duì)話):

輸入:我睡不著!

baichuan-7B輸出:你該吃藥了。失眠,是現(xiàn)代人最常見(jiàn)的睡眠障礙。......

RulaiGPT_v0輸出:如來(lái)~

RulaiGPT_v1輸出:很抱歉,您的問(wèn)題沒(méi)有描述清楚。請(qǐng)?zhí)峁└嘈畔⒒騿?wèn)題細(xì)節(jié),我會(huì)盡力幫助您解決問(wèn)題。<-- 可以正常對(duì)話了

例子(如來(lái)之謎):

輸入:他到底來(lái)沒(méi)來(lái)???

baichuan-7B輸出:來(lái)了,但不是我想要的那個(gè)。

RulaiGPT_v0輸出:如~來(lái)~

RulaiGPT_v1輸出:我不知道你所說(shuō)的"如來(lái)"是誰(shuí)。如果你能告訴我更多關(guān)于這個(gè)人的信息,我會(huì)盡力幫助你的。<-- 但如來(lái)話術(shù)又不會(huì)了...

猜測(cè)是因?yàn)槲⒄{(diào)語(yǔ)料中的如來(lái)語(yǔ)料占比太少,模型記不太住,這就陷入了兩難的境地。

于是我做了第二個(gè)嘗試:

2. 在上一步的基礎(chǔ)上,讓模型把如來(lái)話術(shù)再“復(fù)習(xí)”一次,同時(shí)混入部分正常話術(shù),防止再次災(zāi)難性遺忘。【記為 RulaiGPT_v2

為了不浪費(fèi)前面訓(xùn)練的擁有了基礎(chǔ)對(duì)話能力的 RulaiGPT_v1, 我這里在它的基礎(chǔ)上繼續(xù)訓(xùn)練,復(fù)習(xí)一下之前學(xué)過(guò)的如來(lái)話術(shù)。

但是,單純復(fù)習(xí)如來(lái)話術(shù),再次導(dǎo)致災(zāi)難性遺忘的風(fēng)險(xiǎn)又比較大,所以我同時(shí)混入部分正常話術(shù),實(shí)例如下:

{"q":?"你能給我解答一下宇宙萬(wàn)物的根基是什么嗎?",?"a":?"它是如如"}{"q":?"我經(jīng)常說(shuō)如來(lái)這個(gè)詞有秘密,如來(lái)、如來(lái)了嗎?",?"a":?"如來(lái)~"}{"q":?"問(wèn):為什么英國(guó)人不反對(duì)英國(guó)每年花這么多納稅人的錢(qián)養(yǎng)王室?...",?"a":?"答:英國(guó)王室在英國(guó)的歷史中扮演了重要的角色,雖然它現(xiàn)在的職能可能不如以前那么重要,..."}{"q":?"問(wèn):實(shí)習(xí)生遭遇辦公室政治,怎么辦?...",?"a":?"答:辦公室政治可能會(huì)對(duì)實(shí)習(xí)生造成負(fù)面影響,所以你應(yīng)該盡力避免被卷入其中。..."}

完整數(shù)據(jù)見(jiàn)文件夾中的 rulai_文件。

為了在上一步的 LoRA 模型上繼續(xù)訓(xùn)練,我們可以在 中直接添加 --previous_lora_weights參數(shù),來(lái)指定之前訓(xùn)練好的 LoRA 參數(shù),從而讓模型繼續(xù)訓(xùn)練,而不是重新訓(xùn)練一個(gè) LoRA。(參考了PEFT庫(kù)中的LoRA繼續(xù)訓(xùn)練的討論)

另外,為了進(jìn)一步降低災(zāi)難性遺忘的風(fēng)險(xiǎn),我把learning_rate降低到了1e-5,batch 降為1,讓模型繼續(xù)訓(xùn)練5輪。

經(jīng)過(guò)了這樣的“復(fù)習(xí)”之后,模型終于馬馬虎虎既能正常對(duì)話,又能跟你聊如來(lái)了:

RulaiGPT_v2效果展示:

總的來(lái)說(shuō),其實(shí)離我的預(yù)期還是差得很遠(yuǎn),但目前還沒(méi)想到好的解決辦法,只能說(shuō)想要掌握如來(lái)的奧秘,并沒(méi)有那么簡(jiǎn)單吧~

我個(gè)人覺(jué)得有以下幾個(gè)地方值得探索:

在構(gòu)造QA語(yǔ)料的時(shí)候,到底加不加“問(wèn):”,“答:”這樣顯式的模板呢?

怎樣的數(shù)據(jù),容易導(dǎo)致模型災(zāi)難性遺忘?

LoRA 微調(diào)時(shí)如何緩解災(zāi)難性遺忘?

如何平衡“記住新知識(shí)”和“災(zāi)難性遺忘”兩方面?

大家有什么想法歡迎來(lái)評(píng)論區(qū)討論,或者來(lái)我的Github項(xiàng)目的discussion區(qū)討論哦!

項(xiàng)目地址:

關(guān)鍵詞:

相關(guān)閱讀
分享到:
版權(quán)和免責(zé)申明

凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來(lái)源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。

Copyright ? 1999-2017 cqtimes.cn All Rights Reserved 環(huán)球傳媒網(wǎng)-重新發(fā)現(xiàn)生活版權(quán)所有 聯(lián)系郵箱:8553 591@qq.com
福利片在线一区二区,久久国产免费,欧美aa一级,日韩三级精品
日韩影院精彩在线| 国产一区导航| 免费成人在线观看| 亚洲自拍另类| 国产欧美日韩影院| 婷婷综合一区| 欧美日韩黄网站| 国产精品久久| 精品免费av一区二区三区| 中文在线中文资源| 国产aⅴ精品一区二区四区| 免费在线亚洲欧美| 另类专区亚洲| 亚洲tv在线| 久久精品xxxxx| 国产精品一区二区美女视频免费看| 国产伦精品一区二区三区千人斩| 精品国产99| 电影91久久久| 日韩av首页| 亚洲免费一区二区| 成人精品国产亚洲| 免费成人性网站| 国产一区2区| 日本va欧美va欧美va精品| a天堂资源在线| 日韩一区二区三区精品视频第3页| 国产精品观看| 尤物网精品视频| 国产日韩中文在线中文字幕| 国产探花一区在线观看| 亚洲午夜久久久久久尤物| 999精品色在线播放| 国产伦精品一区二区三区千人斩| 欧美a级片一区| 国产高清日韩| 日韩国产一区二区| 国产精品免费精品自在线观看| 日韩精品午夜| 中文精品电影| 国产一区调教| 日韩精品91亚洲二区在线观看| 91精品国产自产观看在线| 国产精品极品在线观看| 久久久久美女| 精品久久久久中文字幕小说| 蜜桃视频在线观看一区二区| 久久久9色精品国产一区二区三区| jizzjizz中国精品麻豆| 亚洲人www| 亚洲精品国产精品粉嫩| 亚洲福利精品| 亚洲天堂av资源在线观看| 亚洲欧洲日本mm| 欧美xxxx中国| 国产精品777777在线播放 | 最新国产精品久久久| 国产一区二区三区四区大秀 | 日韩中文字幕不卡| 国产一区二区三区自拍| 精品国产91| 国产一区二区三区天码| 国内自拍视频一区二区三区| 亚洲精品第一| 性色av一区二区怡红| 超碰在线99| 欧美日韩国产v| 日韩激情一区| 给我免费播放日韩视频| 国产精品成人3p一区二区三区| а√在线中文在线新版| 亚洲香蕉网站| 亚洲永久av| 亚洲午夜免费| 国产精品一区毛片| 日韩在线不卡| 欧美国产极品| 99精品美女| 日韩国产欧美在线播放| 粉嫩av一区二区三区四区五区| 亚洲综合小说| 欧美日韩一区二区三区在线电影| 亚洲色图网站| 喷白浆一区二区| 欧美成人日韩| 久久视频精品| 六月婷婷一区| 国产欧美日韩亚洲一区二区三区| 亚洲精品91| 日韩美女国产精品| 日韩专区一卡二卡| 精品国产中文字幕第一页 | 成人在线超碰| 免费视频一区二区三区在线观看 | 亚洲人成亚洲精品| 亚洲国产日韩欧美在线| 国产一区二区精品久| 久久麻豆视频| 香蕉精品视频在线观看| 久久香蕉国产| 国产综合欧美| 日韩激情网站| 美女尤物国产一区| 国产在线日韩精品| 美女视频网站久久| 午夜在线精品偷拍| 麻豆91小视频| 蜜桃成人av| 欧美在线看片| 美女一区网站| 国产白浆在线免费观看| 日韩精品2区| 久久久久久婷| 福利精品在线| 成人自拍av| 日韩福利视频导航| 国产精品美女久久久| 丰满少妇一区| 亚洲精品中文字幕99999| 国产不卡精品| 欧美精品中文| 91精品亚洲| 久久精品国产福利| 日韩在线电影| 久久精品青草| 西西人体一区二区| 97在线精品| 影音先锋久久精品| 国产日本亚洲| 国际精品欧美精品| 国产探花在线精品一区二区| 日欧美一区二区| 乱人伦精品视频在线观看| 免费在线欧美黄色| 久久国产精品久久久久久电车| 少妇久久久久| 国产精品大片| 国产欧美日韩影院| 国产一区二区亚洲| 亚洲精品乱码| 91精品电影| 国产aa精品| 精品久久美女| 老司机免费视频一区二区三区| 黄页网站一区| 欧美日韩国产高清| 亚洲精品永久免费视频| 国产精品久久久久久久久久白浆| 在线精品一区| 亚洲欧洲日韩精品在线| 国产在线日韩| 中文精品电影| 日本欧美一区二区| 欧美丰满日韩| 精品国产a一区二区三区v免费| 日韩在线成人| 日本欧美大码aⅴ在线播放| 精品九九在线| 91一区二区| 成人在线超碰| 久久xxx视频| 久久wwww| 亚洲激情黄色| 亚洲一区日韩在线| 国产精品一线| av中文字幕在线观看第一页| 老牛影视一区二区三区| www在线观看黄色| 日韩在线一区二区| 免费日本视频一区| 伊人国产精品| 国产精品videossex| 久久国产免费| 福利欧美精品在线| 国产一区日韩一区| 欧美成人精品| 免费在线看一区| 荡女精品导航| 欧洲激情综合| 欧美高清不卡| 久久影院一区二区三区| 亚洲精品自拍| 欧美+亚洲+精品+三区| 国产精品白浆| 国产精品久久乐| sm捆绑调教国产免费网站在线观看| 国产欧美日本| 国产视频一区二| 麻豆网站免费在线观看| 国产精品a级| 在线天堂资源www在线污| 99视频精品全部免费在线视频| 欧美99久久| 深夜福利一区| 日韩美女国产精品| 91亚洲无吗| 日韩欧美少妇| 91青青国产在线观看精品| 久久视频一区| 天堂久久av|