
ChatGPT生態(tài)系統(tǒng)的安全漏洞導(dǎo)致第三方網(wǎng)站賬戶和敏感數(shù)據(jù)泄露
Elastic 的推理 API 可讓開發(fā)人員在 Elastic 環(huán)境中輕松訪問人工智能模型并對其執(zhí)行推理。 該 API 無需自托管模型或通過外部 API 進行單獨的推理調(diào)用,從而簡化了在 Elastic 中創(chuàng)建和查詢矢量索引的過程。 值得注意的是,無需手動遍歷現(xiàn)有詞法搜索索引中的每個文檔來添加向量嵌入,只需調(diào)用一次 API,即可創(chuàng)建推理攝取管道并重新為數(shù)據(jù)建立索引。
Cohere 的整個 Embed v3 模型系列–包括我們最先進的英語嵌入模型(embed-english-v3.0)和多語言嵌入模型(embed-multilingual-v3.0)–現(xiàn)在可通過 Elastic 的推理 API 在 Elastic Cloud 和 Elastic 自管理環(huán)境中使用。
我們還很高興地宣布,推理 API 原生支持浮點和 int8(或字節(jié))嵌入。 Int8 壓縮允許用戶利用 Elastic 對字節(jié)矢量的支持,將嵌入的大小減少 4倍,而對搜索質(zhì)量的影響卻很小。 由于矢量數(shù)據(jù)庫的成本在一定程度上與存儲矢量的大小相關(guān),因此開發(fā)人員可以在不影響準確性的情況下降低存儲成本。 Cohere 的嵌入模型在使用 int8(字節(jié))壓縮時,其性能可與 OpenAI 的嵌入模型相媲美,而存儲成本僅為后者的一小部分。 下圖顯示了各種嵌入模型的 MTEB 精度與約 2.5 億嵌入數(shù)據(jù)集的存儲成本的比較。
我們很高興 Elastic 行業(yè)領(lǐng)先的平臺能讓開發(fā)人員更輕松地訪問我們的嵌入式產(chǎn)品。
使用推理應(yīng)用程序接口(Inference API)實現(xiàn) Cohere 的嵌入只需調(diào)用幾個應(yīng)用程序接口。
首先,創(chuàng)建一個推理模型,指定一個 Cohere 的嵌入模型。 在本例中,我們將使用 Cohere 的基準英語模型 “embed-english-v3.0″,并使用 int8 壓縮。 要在 Elastic 中使用 int8 壓縮,我們將指定embedding_type
為byte
。
PUT _inference/text_embedding/cohere_embeddings
{
"service": "cohere",
"service_settings": {
"api_key": "<cohere_api_key>",
"model_id": "embed-english-v3.0",
"embedding_type": "byte"
}
}
接下來,為包含嵌入內(nèi)容的新索引創(chuàng)建索引映射。 在此,您將指定由您選擇的向量和壓縮技術(shù)決定的某些參數(shù)。
PUT cohere-embeddings
{
"mappings": {
"properties": {
"content_embedding": {
"type": "dense_vector",
"dims": 1024,
"element_type": "byte"
},
"content": {
"type": "text"
}
}
}
}
接下來,創(chuàng)建一個帶有推理處理器的攝取管道,以便在將內(nèi)容攝取到索引時自動計算嵌入。
PUT _ingest/pipeline/cohere_embeddings
{
"processors": [
{
"inference": {
"model_id": "cohere_embeddings",
"input_output": {
"input_field": "content",
"output_field": "content_embedding"
}
}
}
]
}
要完成新索引的設(shè)置,請使用您剛剛創(chuàng)建的攝取管道重新索引現(xiàn)有來源的數(shù)據(jù)。 新索引將包含管道中指定的輸入字段中所有文本數(shù)據(jù)的嵌入,供您在語義搜索中使用。
POST _reindex?wait_for_completion=false
{
"source": {
"index": "test-data",
"size": 50
},
"dest": {
"index": "cohere-embeddings",
"pipeline": "cohere_embeddings"
}
}
現(xiàn)在您的索引已經(jīng)創(chuàng)建,您可以使用 KNN 向量搜索和 Cohere 的嵌入來輕松查詢。
GET cohere-embeddings/_search
{
"knn": {
"field": "content_embedding",
"query_vector_builder": {
"text_embedding": {
"model_id": "cohere_embeddings",
"model_text": "Elasticsearch and Cohere"
}
},
"k": 10,
"num_candidates": 100
},
"_source": [
"id",
"content"
]
}
就是這樣! 利用 Cohere 嵌入在您的 Elastic 索引中進行語義搜索。 要開始使用,請為 Cohere 創(chuàng)建一個試用 API 密鑰,并嘗試使用 Elastic 的推理 API 和 Cohere 的嵌入。
冪簡集成是國內(nèi)領(lǐng)先的API集成管理平臺,專注于為開發(fā)者提供全面、高效、易用的API集成解決方案。冪簡API平臺提供了多種維度發(fā)現(xiàn)API的功能:通過關(guān)鍵詞搜索API、從API Hub分類瀏覽API、從開放平臺分類瀏覽企業(yè)間接尋找API等。
此外,冪簡集成開發(fā)者社區(qū)會編寫API入門指南、多語言API對接指南、API測評等維度的文章,讓開發(fā)者選擇符合自己需求的API。
本文翻譯源自:https://cohere.com/blog/elastic-inference-api
ChatGPT生態(tài)系統(tǒng)的安全漏洞導(dǎo)致第三方網(wǎng)站賬戶和敏感數(shù)據(jù)泄露
想要系統(tǒng)了解Agentic Workflow,看這25篇論文就夠了
生成式 AI 在電商領(lǐng)域究竟有多牛,這款產(chǎn)品給出了回答
AI Agent 開源和創(chuàng)業(yè)項目大盤點,Agent 基礎(chǔ)設(shè)施正在崛起
人工智能(AI) VS 商業(yè)智能(BI) 區(qū)別與聯(lián)系是什么?
使用 RESTful API 探索藝術(shù)世界
如何在Java、Python、GO程序中使用AI人臉識別API接口
什么是API產(chǎn)品經(jīng)理?
基本 API 設(shè)計模式:打造卓越 Web 服務(wù)的指南