文心 AI 作畫的最終目的是通過 AI 技術(shù)便捷地為人類創(chuàng)造美的作品,激發(fā)人的想象力和創(chuàng)作力。其在藝術(shù)創(chuàng)作、虛擬現(xiàn)實、圖像編輯、AI 輔助設(shè)計、虛擬數(shù)字人等領(lǐng)域有著廣泛的應(yīng)用前景,也為這些領(lǐng)域未來的發(fā)展提供了無限的創(chuàng)意和可能。

文心AI作畫API的接口說明

文心AI作畫API基于 ERNIE-ViLG 大模型,可根據(jù)用戶輸入的中文文本自動創(chuàng)作圖片。該 API 涉及兩個主要接口:提交請求和查詢結(jié)果。提交請求接口允許用戶傳入文本、分辨率、風(fēng)格參數(shù)來創(chuàng)建作畫任務(wù),并返回任務(wù) ID。查詢結(jié)果接口用于查看圖片生成狀態(tài),并在任務(wù)完成后獲取生成圖片的地址鏈接。

如何注冊并獲取API Key

注冊百度智能云賬號

要使用文心AI作畫API,首先需要注冊一個百度智能云賬號。在注冊完成并登錄后,進入“控制臺”模塊,然后選擇“產(chǎn)品服務(wù)”中的“人工智能”模塊,找到“智能創(chuàng)作平臺”項目,點擊領(lǐng)取免費的接口資源。

在這里插入圖片描述

獲取API Key和Secret Key

在“應(yīng)用列表”中,創(chuàng)建一個新的應(yīng)用以獲取個人的 API Key 和 Secret Key。這些密鑰將用于在代碼中進行 API 訪問的身份驗證。

在這里插入圖片描述

實現(xiàn)文心AI作畫的代碼示例

提交請求的代碼實現(xiàn)

下面的代碼展示了如何創(chuàng)建“提交請求”接口文件,并根據(jù)申請的 API Key 和 Secret Key,以及自定義輸入的文本和參數(shù)信息,獲取圖片生成任務(wù) ID。

import requests
import json

API_KEY = "自己申請的API Key"
SECRET_KEY = "自己申請的Secret Key"

def main():

    url = "https://aip.baidubce.com/rpc/2.0/ernievilg/v1/txt2img?access_token=" + get_access_token()

    payload = json.dumps({
        "text": "中國山水畫",#輸入中文描述
        "resolution": "1024*1024",#選擇圖片分辨率,可支持1024*1024、1024*1536、1536*1024
        "style": "古風(fēng)",#選擇圖像風(fēng)格,古風(fēng)、二次元、寫實風(fēng)格、浮世繪、未來主義、賽博朋克等等
        "num": 2#輸入要生成的圖片數(shù)量,可選1~6張
    })
    headers = {
        'Content-Type': 'application/json',
        'Accept': 'application/json'
    }

    response = requests.request("POST", url, headers=headers, data=payload)

    print(response.text)

#獲取Access Token
def get_access_token():
    """
    使用 AK,SK 生成鑒權(quán)簽名(Access Token)
    :return: access_token,或是None(如果錯誤)
    """
    url = "https://aip.baidubce.com/oauth/2.0/token"
    params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}
    return str(requests.post(url, params=params).json().get("access_token"))

if __name__ == '__main__':
    main()

查詢結(jié)果的代碼實現(xiàn)

在獲取任務(wù) ID 后,可以通過以下代碼查詢生成圖片的結(jié)果。

import requests
import json
from io import BytesIO#BytesIO實現(xiàn)了在內(nèi)存中讀寫bytes
from PIL import Image
import os

API_KEY = "自己申請的API Key"
SECRET_KEY = "自己申請的Secret Key"

def main():
    #API接口的url 
    url = "https://aip.baidubce.com/rpc/2.0/ernievilg/v1/getImg?access_token=" + get_access_token()
   #發(fā)送請求獲取網(wǎng)頁內(nèi)容 
    payload = json.dumps({
        "taskId": "提交請求代碼返回的 'taskId' 的值"
    })
    headers = {
        'Content-Type': 'application/json',
        'Accept': 'application/json'
    }    
    response = requests.request("POST", url, headers=headers, data=payload)
    print('請求的返回值:',response.text)
    json_result = json.loads(response.text)
    imgUrls=json_result['data']['imgUrls']#返回imgUrls的結(jié)果
    print("imgUrls的返回值:", imgUrls)

    #獲得圖片網(wǎng)址并將圖片保存到本地
    for i in range(0,len(imgUrls)):
        img_url=imgUrls[i]
        print('imges_url:',img_url)
        img_url=img_url['image']
        print('image_url:',img_url)
        #保存圖片到本地
        req=requests.get(img_url)#獲取圖片網(wǎng)址
        image = Image.open(BytesIO(req.content))#在內(nèi)存中打開圖片
        image.save(os.path.join('圖片保存路徑','{}.jpg'.format(i)), 'JPEG')

#獲取Access Token
def get_access_token():
    """
    使用 AK,SK 生成鑒權(quán)簽名(Access Token)
    :return: access_token,或是None(如果錯誤)
    """
    url = "https://aip.baidubce.com/oauth/2.0/token"
    params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}
    return str(requests.post(url, params=params).json().get("access_token"))

if __name__ == '__main__':
    main()

文心AI作畫的實驗與效果展示

實驗環(huán)境與實施細節(jié)

百度 ERNIE-ViLG 2.0 的參數(shù)量為 24B,包括 1.3B 的文本編碼器和 10 個 2.2B 的混合降噪專家(U-Net)。訓(xùn)練數(shù)據(jù)包括 1.70 億對圖片-文本數(shù)據(jù)。對于英文的文本,使用百度翻譯 API 直接翻譯成中文。

實驗結(jié)果分析

實驗結(jié)果顯示,ERNIE-ViLG 2.0 模型在 MS-COCO 數(shù)據(jù)集上的表現(xiàn)優(yōu)于 DALL-E 2 和 Stable Diffusion。人為評估同樣顯示,ERNIE-ViLG 2.0 的生成效果更好。通過逐漸增加混合降噪專家的數(shù)量,模型在 10 個專家時效果最佳。

實驗結(jié)果圖示

文心AI作畫在實際應(yīng)用中的價值

在藝術(shù)創(chuàng)作中的應(yīng)用

文心 AI 作畫能夠通過輸入的文本生成多種風(fēng)格的圖像,這在藝術(shù)創(chuàng)作領(lǐng)域具有巨大潛力。藝術(shù)家可以借助這一技術(shù)工具,快速生成創(chuàng)意作品,實現(xiàn)從文本到圖像的高效轉(zhuǎn)化。

在虛擬現(xiàn)實中的應(yīng)用

在虛擬現(xiàn)實領(lǐng)域,文心 AI 作畫提供了一種便捷的圖像生成方式。通過輸入描述性文本,開發(fā)者可以快速生成逼真的虛擬場景,提升虛擬現(xiàn)實的沉浸感和交互性。

FAQ

  1. 問:如何使用百度文心 ERNIE-ViLG API 生成圖像?

  2. 問:生成的圖像是否可以商用?

  3. 問:文心 AI 作畫支持哪些風(fēng)格的圖像生成?

  4. 問:生成的圖像質(zhì)量如何?

  5. 問:如何獲取更多的接口調(diào)用次數(shù)?

上一篇:

GLIDE 應(yīng)用代碼:深入解析與實踐指南

下一篇:

使用GLIDE API獲取緩存圖片的關(guān)鍵方法
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊

多API并行試用

數(shù)據(jù)驅(qū)動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費