方法概述

我們的模型以以下格式的文本作為輸入:

模型會在SEP標(biāo)記后生成提示,因為它是一個自回歸語言模型,而非seq2seq模型。


從人類反饋中學(xué)習(xí)強(qiáng)化學(xué)習(xí)(RLHF)

RLHF的實現(xiàn)分為以下三個主要步驟:

步驟1:監(jiān)督微調(diào)(SFT)

在監(jiān)督微調(diào)階段,我們?yōu)槟P吞峁┭菔緮?shù)據(jù),幫助其學(xué)習(xí)所需的響應(yīng)格式和相關(guān)信息。在我們的案例中,數(shù)據(jù)集格式為image_description[prompt](https://prompts.explinks.com/)。由于沒有公開的圖像描述和提示數(shù)據(jù)集,我們采用以下方法:

  1. 收集圖像描述數(shù)據(jù)集,并通過OpenAItext-davinci-003模型提取提示。
  2. 使用HuggingFace Transformers的標(biāo)準(zhǔn)腳本進(jìn)行語言模型微調(diào),并對腳本進(jìn)行調(diào)整,僅在提示部分計算損失。

訓(xùn)練過程在單個NVIDIA A100 80GB GPU上耗時約90分鐘。


步驟2:獎勵建模(Reward Modeling)

獎勵建模包含兩個階段:偏好收集和獎勵建模。

偏好收集

我們?yōu)槊總€圖像描述生成三個提示,并使用Stable Diffusion 1.5生成四張圖像。隨后,通過Toloka眾包平臺對這些圖像進(jìn)行成對比較,注釋者選擇更優(yōu)的一組圖像。

獎勵建模

我們選擇使用distilroberta作為獎勵模型,并通過Transformers庫中的AutoModelForSequenceClassification進(jìn)行訓(xùn)練。模型以image_description[SEP]prompt格式的文本輸入,并預(yù)測一個表示質(zhì)量的數(shù)值。

訓(xùn)練過程使用二進(jìn)制交叉熵損失函數(shù),目標(biāo)是預(yù)測左提示是否優(yōu)于右提示。在單個NVIDIA A100 80GB GPU上,訓(xùn)練耗時約15分鐘,驗證集準(zhǔn)確率為0.63,足以支持RLHF微調(diào)。


步驟3:強(qiáng)化學(xué)習(xí)(RLHF)

在RLHF階段,我們面臨超參數(shù)調(diào)優(yōu)的挑戰(zhàn),特別是學(xué)習(xí)率和init_kl參數(shù)的選擇。我們發(fā)現(xiàn)較低的參數(shù)值效果最佳。

訓(xùn)練過程中,價值損失持續(xù)下降,獎勵模型的預(yù)測獎勵顯著增加,但這并不意味著模型完全優(yōu)化,因為獎勵模型本身可能存在缺陷。


視覺效果展示

以下是通過我們的模型生成的圖像示例:

除非特別說明,以上圖像均由Stable Diffusion 1.5生成。


下一步計劃

我們已將所有代碼和數(shù)據(jù)開源,供社區(qū)使用。未來,研究者可以基于我們的成果,為DALL-E 2、Midjourney等其他模型開發(fā)類似的解決方案。我們期待您的反饋和建議,共同推動文本到圖像生成技術(shù)的發(fā)展。


原文鏈接: https://toloka.ai/blog/improving-text-to-image-models-by-prompt-engineering-with-rlhf/
熱門推薦
一個賬號試用1000+ API
助力AI無縫鏈接物理世界 · 無需多次注冊
3000+提示詞助力AI大模型
和專業(yè)工程師共享工作效率翻倍的秘密
返回頂部
上一篇
Llama 3 已發(fā)布!在 Together AI API 中以每秒 350 個 token 的速度試用它...
下一篇
揭秘Anthropic的Claude 3 API產(chǎn)品線奧秘
国内精品久久久久影院日本,日本中文字幕视频,99久久精品99999久久,又粗又大又黄又硬又爽毛片
成人国产精品视频| 成人h精品动漫一区二区三区| 精品久久99ma| 久久久久久久久久久久电影| 在线视频你懂得一区| 国产经典欧美精品| 麻豆精品精品国产自在97香蕉| 亚洲国产视频在线| 一区二区三区欧美视频| 日本一区二区电影| 国产精品毛片久久久久久久| 国产色91在线| 久久品道一品道久久精品| 久久99久久久久| 亚洲女同女同女同女同女同69| 日本一区二区三区四区| 国产精品的网站| 中文字幕一区二区三区四区| 国产精品美女视频| 色一情一乱一乱一91av| 欧美精品日韩综合在线| 精品久久人人做人人爽| 国产一区二区在线视频| 91色.com| 在线看国产一区| 免费成人在线网站| 国产黑丝在线一区二区三区| 精品国产髙清在线看国产毛片| 成人中文字幕合集| 精品婷婷伊人一区三区三| 日韩欧美区一区二| 国产精品黄色在线观看| 欧美日韩国产综合一区二区三区| 日韩女优电影在线观看| 成人av网址在线观看| 亚洲综合一二区| 国产·精品毛片| 在线免费观看日本一区| 麻豆精品一区二区三区| 亚洲视频一二三| 国产精品一区二区在线看| 日本丰满少妇一区二区三区| 欧美成人精品3d动漫h| 99久久久久久99| 日韩一区二区免费高清| 亚洲精品欧美专区| 国产高清不卡一区二区| 午夜精品久久久久影视| 91欧美一区二区| 国产综合久久久久久久久久久久| 欧美性生活大片视频| 中文av一区二区| 精品美女在线播放| 日韩午夜激情电影| 91精品婷婷国产综合久久性色 | 国产综合色视频| 美女一区二区在线观看| 奇米亚洲午夜久久精品| 日韩国产精品大片| 欧美探花视频资源| eeuss鲁片一区二区三区在线看| 精品999久久久| 欧美一区二区福利视频| 日本网站在线观看一区二区三区| 亚洲美女免费在线| 亚洲国产sm捆绑调教视频| 亚洲一区二区三区精品在线| 亚洲一区在线观看免费| 亚洲午夜久久久久久久久久久| 亚洲成人免费在线| 91精品一区二区三区在线观看| 欧美私模裸体表演在线观看| 欧美性色欧美a在线播放| 欧美日韩国产一级| 欧美成人乱码一区二区三区| 国产亚洲综合在线| 亚洲激情男女视频| 国产一区亚洲一区| 99精品一区二区三区| 欧美日韩三级一区| 国产日韩欧美a| 亚洲国产另类av| 国产99久久久精品| 欧美绝品在线观看成人午夜影视| 久久一区二区三区国产精品| 国产传媒日韩欧美成人| 99免费精品视频| 欧美精品久久99久久在免费线| 日韩久久久久久| 一区二区三区在线视频免费| 久久激情五月激情| 欧美视频一区二区三区四区 | 日韩欧美电影在线| 亚洲图片激情小说| 国产一区二区免费看| 在线不卡免费av| 亚洲色图.com| 国产精品99久久不卡二区| 欧美日韩另类一区| 亚洲日本丝袜连裤袜办公室| 国产伦精品一区二区三区免费迷| 欧美亚洲一区三区| 日韩美女啊v在线免费观看| 久久精品国产秦先生| 在线精品观看国产| ...中文天堂在线一区| 国产精品99久久久久久宅男| 日韩一区二区三区在线视频| 亚洲国产乱码最新视频| 欧美吞精做爰啪啪高潮| 亚洲精品视频观看| 91在线一区二区三区| 亚洲国产激情av| 国产91丝袜在线18| 日本一区二区三区四区| 国产精品 欧美精品| 精品福利二区三区| 国产精品亚洲综合一区在线观看| 久久综合久久综合九色| 黄页网站大全一区二区| 国产清纯白嫩初高生在线观看91| 国产精品69久久久久水密桃| 国产亚洲成年网址在线观看| 粉嫩一区二区三区性色av| 国产精品福利影院| 色综合激情五月| 日韩二区在线观看| 久久久五月婷婷| 99久久久国产精品| 午夜精品久久久久久久99水蜜桃 | 日韩精品一卡二卡三卡四卡无卡| 国产精品久久综合| av在线不卡网| 亚洲综合999| 欧美挠脚心视频网站| 激情五月激情综合网| 亚洲国产精品精华液ab| 色婷婷综合中文久久一本| 奇米一区二区三区| 亚洲色欲色欲www在线观看| 欧美精品精品一区| 国产aⅴ综合色| 午夜视频在线观看一区二区 | 99v久久综合狠狠综合久久| 亚洲aaa精品| 国产精品国产三级国产有无不卡 | 91理论电影在线观看| 人人爽香蕉精品| 亚洲欧洲av另类| 日韩欧美亚洲国产另类| 色综合久久中文字幕综合网| 激情久久久久久久久久久久久久久久| 欧美激情在线看| 日韩精品一区二区三区三区免费 | 欧美精品一二三| 国产电影精品久久禁18| 亚洲成a人v欧美综合天堂| 国产精品国产三级国产普通话蜜臀 | 一本色道久久综合亚洲91| 精品一区二区三区在线播放视频| 亚洲欧美另类久久久精品| 国产午夜一区二区三区| 日韩免费性生活视频播放| 欧美日韩不卡视频| 欧美色图一区二区三区| av电影在线观看一区| 国产很黄免费观看久久| 狠狠色综合播放一区二区| 天天色 色综合| 亚洲成人激情av| 一区二区三区在线免费视频| 国产精品高潮久久久久无| 国产日本亚洲高清| 欧美国产精品一区| 国产精品私人影院| 国产精品美女久久久久久2018| www欧美成人18+| 久久久99久久精品欧美| 日韩精品一区二区三区中文不卡 | 国产日韩欧美高清在线| 国产免费久久精品| 中文字幕中文字幕一区二区| 中文字幕亚洲一区二区va在线| 国产精品天美传媒| 国产精品成人午夜| 亚洲综合偷拍欧美一区色| 蜜臀久久99精品久久久久宅男| 免费观看一级欧美片| 国产成a人亚洲精| 91麻豆精东视频| 欧美日韩日日骚| 久久这里只有精品6| 亚洲视频1区2区| 舔着乳尖日韩一区| 国产美女在线精品| 在线看国产日韩| 欧美va亚洲va香蕉在线| 亚洲日本一区二区三区| 日韩av电影一区| 91老司机福利 在线|