
一文快速了解如何調用天工API接口
接入模型表單字段詳細說明:
參數名稱 | 參數說明 |
接入點名稱 | 填寫接入點名稱 |
接入點描述 | 描述接入模型的業務需求,如接入場景、用途(如測試、線上業務)等 |
接入模型 | 可選擇【模型廣場】或【精調模型】中的模型進行接入選擇【模型廣場】中的模型后,需進一步選擇模型版本選擇【精調模型】中的模型后,需進一步選擇模型版本和 Checkpoint。當前僅支持基于豆包系列模型進行精調的模型 |
購買方式 | – 支持使用【按Token付費】、【按模型單元付費】2種模式 |
模型單元是調用某個特定模型的 TPM(Token per Minite)配額。創建推理接入點選擇按模型單元付費后,用戶可以獲得比按 Token 付費更大的并發量,且無需再為 Token 消耗付費。模型單元付費方式為預付費。
我們對Doubao系列模型與部分開源模型支持模型單元。支持范圍請參考產品計費
目前支持在+ 創建推理接入 點配置算力保障時,進行購買模型單元,可以配置購買模型單元的數量、時長、是否自動續費。自動續費支持按照單次自動續費時長(按天)及自動續費次數(永久生效、自定義次數)自定義配置。
通過【模型推理】列表頁,找到需要調整的接入點,點擊右側的 ··· 可以進行調整模型單元、續費、退訂。
點擊續費按鈕,會跳轉到費用中心的續費管理頁面,可以進行續費操作
想要刪除買了模型單元的接入點,需要到費用中心退訂管理中操作模型單元退訂,退訂成功后,再進行接入點的刪除操作。
注意:因為模型單元是按實例組購買的,點擊接入點名稱詳情中復制的模型單元ID是實例組 ID,實例組存在強綁定關系,因此續費、退訂須同步發起。請注意,未到期的模型單元退訂會產生懲罰系數,無法100%退費。
進入 API Key 管理 頁面,選擇需要的項目,點擊 創建 API Key,即可生成長效 API Key。all權限默認給予項目下所有模型接入點和智能體訪問權限。
<dependency>
<groupId>com.volcengine</groupId>
<artifactId>volcengine-java-sdk-ark-runtime</artifactId>
<version>LATEST</version>
</dependency>
import com.volcengine.ark.runtime.model.completion.chat.ChatCompletionRequest;
import com.volcengine.ark.runtime.model.completion.chat.ChatMessage;
import com.volcengine.ark.runtime.model.completion.chat.ChatMessageRole;
import com.volcengine.ark.runtime.service.ArkService;
import java.util.ArrayList;
import java.util.List;
public class DouBaoDemo {
public static void main(String[] args) {
ArkService service = new ArkService("ARK_API_KEY");
System.out.println("\n----- 標準請求 -----");
final List<ChatMessage> messages = new ArrayList<>();
final ChatMessage systemMessage = ChatMessage.builder().role(ChatMessageRole.SYSTEM).content("你是豆包,是由字節跳動開發的 AI 人工智能助手").build();
final ChatMessage userMessage = ChatMessage.builder().role(ChatMessageRole.USER).content("請自我介紹?").build();
messages.add(systemMessage);
messages.add(userMessage);
ChatCompletionRequest chatCompletionRequest = ChatCompletionRequest.builder()
.model("${YOUR_ENDPOINT_ID}")
.messages(messages)
.build();
service.createChatCompletion(chatCompletionRequest).getChoices().forEach(choice -> System.out.println(choice.getMessage().getContent()));
System.out.println("\n----- 流請求 -----");
final List<ChatMessage> streamMessages = new ArrayList<>();
final ChatMessage streamSystemMessage = ChatMessage.builder().role(ChatMessageRole.SYSTEM).content("你是豆包,是由字節跳動開發的 AI 人工智能助手").build();
final ChatMessage streamUserMessage = ChatMessage.builder().role(ChatMessageRole.USER).content("請自我介紹?").build();
streamMessages.add(streamSystemMessage);
streamMessages.add(streamUserMessage);
ChatCompletionRequest streamChatCompletionRequest = ChatCompletionRequest.builder()
.model("${YOUR_ENDPOINT_ID}")
.messages(streamMessages)
.build();
service.streamChatCompletion(streamChatCompletionRequest)
.doOnError(Throwable::printStackTrace)
.blockingForEach(
choice -> {
if (choice.getChoices().size() > 0) {
System.out.print(choice.getChoices().get(0).getMessage().getContent());
}
}
);
service.shutdownExecutor();
}
}