試想一下場景,我們在使用數(shù)據(jù)地圖或指標(biāo)查詢時(shí),指標(biāo)預(yù)存信息為“欠款金額”,而我們搜索的指標(biāo)為“未還款金額”,雖然語義上很接近,但是ES的分詞詞典中并沒有“未還款”,匹配不上,會(huì)導(dǎo)致我們搜索不到指標(biāo)信息。為了提升搜索效果,通常會(huì)給ES配置同義詞表,把預(yù)存的指標(biāo)信息和開發(fā)、業(yè)務(wù)人員常使用的指標(biāo)名稱做同義詞配置,提高查詢效果。

基于Embedding進(jìn)行語義檢索的過程大致如下:


1.?對(duì)預(yù)存指標(biāo)信息生成語義向量(Embedding),存入向量數(shù)據(jù)庫作為基準(zhǔn);2.?將用戶搜索指標(biāo)信息向量化后,檢索向量數(shù)據(jù)庫;3.?計(jì)算兩者之間的向量距離(如余弦相似度距離),找出與用戶搜索詞最近的幾個(gè)向量。那最近的幾個(gè)向量,其實(shí)就是語義和搜索詞相似的,而并不一定需要相同的關(guān)鍵詞。

2. 搭建領(lǐng)域知識(shí)庫,提供私域問答

通常我們遇到以下場景會(huì)考慮搭建本地知識(shí)庫:1.?我們所需的行業(yè)知識(shí)比較專業(yè),大模型不能確保準(zhǔn)確、高效的提供;2.?在利用大模型能力的過程中,我們內(nèi)部的數(shù)據(jù)跟環(huán)境不能對(duì)外暴露,需完全可控,避免任何的數(shù)據(jù)隱私泄露以及安全風(fēng)險(xiǎn)。該需求比較普遍,通常采用Embedding + 向量檢索引擎 + LLM?的方式,處理過程流程如下:

處理的過程包括:

1. 先將原始文檔中的文本內(nèi)容全部提取出來。然后根據(jù)語義切塊,切成多個(gè)chunk,可以理解為可以完整表達(dá)一段意思的文本段落。在這個(gè)過程中還可以額外做一些元數(shù)據(jù)抽取,敏感信息檢測等行為。

2. 將這些Chunk都丟給embedding模型,來求取這些chunk的embedding。

3. 將embedding和原始chunk一起存入到向量數(shù)據(jù)庫中。

問題提煉:這個(gè)部分是可選的,之所以存在是因?yàn)橛行﹩栴}是需要依賴于上下文的。因?yàn)橛脩魡柕男聠栴}可能沒辦法讓LLM理解這個(gè)用戶的意圖。

向量檢索:獨(dú)立問題求取embedding這個(gè)功能會(huì)在text2vec模型中進(jìn)行。在獲得embedding之后就可以通過這個(gè)embedding來搜索已經(jīng)事先存儲(chǔ)在向量數(shù)據(jù)庫中的數(shù)據(jù)。推理求解:在獲得最相關(guān)的知識(shí)之后,我們就可以讓LLM基于最相關(guān)的知識(shí)和獨(dú)立問題來進(jìn)行求解推理,得到最終的答案。? ?

3. Text2SQL代碼生成,結(jié)果可視化

大模型可以根據(jù)自然語言輸入快速生成SQL代碼片段,并通過可視化的方式展示結(jié)果,從而協(xié)助數(shù)據(jù)人員的日常工作。這減少了編寫復(fù)雜查詢所花費(fèi)的時(shí)間,因此可以投入更多時(shí)間來理解業(yè)務(wù)和分析查詢結(jié)果,以此從數(shù)據(jù)結(jié)果中獲取決策支持。

可以通過大模型創(chuàng)建一個(gè) SQL 查詢來獲取一組特定的數(shù)據(jù),例如:“顯示 2022 年每月的平均收入。”

大模型可以將其轉(zhuǎn)換為 SQL 查詢,如下:

SELECT AVG(revenue) AS average_revenue, MONTH(date) AS month
FROM sales
WHERE YEAR(date) = 2022
GROUP BY MONTH(date);

集成可視化功能后的效果圖如下:

4. 數(shù)據(jù)集探索性數(shù)據(jù)分析

EDA數(shù)據(jù)分析師在分析之前往往需要花費(fèi)大量時(shí)間準(zhǔn)備和清理數(shù)據(jù)。利用大模型可以提供數(shù)據(jù)預(yù)處理技術(shù),如處理缺失值、處理異常值、變量相關(guān)性分析以及解決用戶數(shù)據(jù)質(zhì)量問題的建議。通過數(shù)據(jù)預(yù)處理建議,有助于簡化數(shù)據(jù)準(zhǔn)備過程,并確保分析質(zhì)量。該能力屬于大模型的通用基礎(chǔ)能力。

總結(jié)

本文簡要介紹了大模型LLM在數(shù)據(jù)領(lǐng)域應(yīng)用的思路,具體方案會(huì)在后續(xù)專題中逐步展開。大模型的快速發(fā)展為企業(yè)數(shù)據(jù)體系帶來了新機(jī)遇,企業(yè)思考在數(shù)據(jù)治理、數(shù)據(jù)安全、數(shù)據(jù)整合、數(shù)據(jù)分析與挖掘以及業(yè)務(wù)應(yīng)用等方面,通過大模型應(yīng)用來提高生產(chǎn)力。隨著OpenAI開發(fā)者大會(huì)召開,ChatGPT使用成本也逐步降低,并且國產(chǎn)大模型百花齊放,模型效果逐漸提高,將助力大模型應(yīng)用在各行各業(yè)中大放異彩。

原文轉(zhuǎn)自 微信公眾號(hào)@數(shù)據(jù)思考筆記

熱門推薦
一個(gè)賬號(hào)試用1000+ API
助力AI無縫鏈接物理世界 · 無需多次注冊
3000+提示詞助力AI大模型
和專業(yè)工程師共享工作效率翻倍的秘密
返回頂部
上一篇
一文說盡大模型技術(shù)之一:LLM的架構(gòu)
下一篇
人工智能(AI) VS 商業(yè)智能(BI) 區(qū)別與聯(lián)系是什么?
国内精品久久久久影院日本,日本中文字幕视频,99久久精品99999久久,又粗又大又黄又硬又爽毛片
国产日韩欧美a| 国产日韩欧美一区二区三区乱码| 国产成人精品一区二区三区网站观看| 欧美亚洲动漫制服丝袜| 久久日韩粉嫩一区二区三区| 蜜桃视频在线观看一区| 日韩无一区二区| 国产一区二区网址| 国产精品网曝门| 成年人午夜久久久| 亚洲精品一二三| 欧美理论电影在线| 久久99精品久久久久久| 国产欧美精品一区二区三区四区| 高清久久久久久| 亚洲欧美视频一区| 91精品国产综合久久福利软件| 图片区小说区区亚洲影院| 欧美一区二区三区白人| 国产精品一区二区三区99| 亚洲欧美一区二区视频| 日韩午夜精品视频| 91亚洲男人天堂| 免费观看日韩av| 国产精品电影院| 日韩一区二区麻豆国产| av不卡免费在线观看| 亚洲成人免费av| 久久精品一区四区| 在线观看日韩av先锋影音电影院| 日韩不卡一区二区三区| 国产精品毛片久久久久久| 欧美日韩国产在线观看| 从欧美一区二区三区| 日本女优在线视频一区二区| 亚洲欧美二区三区| 国产欧美日韩综合精品一区二区| 在线综合视频播放| 欧洲精品中文字幕| eeuss鲁一区二区三区| 精品一区二区影视| 日韩和欧美一区二区三区| 亚洲视频一区二区在线| 中文字幕国产一区| 久久久精品免费观看| 精品国产成人系列| 亚洲精品一区在线观看| 欧美日韩www| 精品视频在线免费| 欧洲一区二区三区在线| av电影在线不卡| 国产+成+人+亚洲欧洲自线| 加勒比av一区二区| 国产精品一区二区久久不卡| 国产美女精品一区二区三区| 另类的小说在线视频另类成人小视频在线 | 欧美电影在线免费观看| 欧美性色aⅴ视频一区日韩精品| av亚洲精华国产精华精| gogogo免费视频观看亚洲一| 99久久er热在这里只有精品15| 成人污污视频在线观看| av不卡免费在线观看| 色94色欧美sute亚洲线路一久| 色婷婷香蕉在线一区二区| 欧美少妇xxx| 精品久久人人做人人爽| 欧美国产日韩在线观看| 亚洲日本va午夜在线电影| 亚洲高清不卡在线观看| 激情综合色综合久久综合| 成人黄色在线看| 欧美日韩一级黄| 日韩免费一区二区| 一区在线播放视频| 日本中文在线一区| 成人少妇影院yyyy| 69久久夜色精品国产69蝌蚪网| 日韩三级免费观看| 亚洲美女少妇撒尿| 国产一区二区三区四区五区入口| 91蝌蚪porny成人天涯| 欧美xfplay| 亚洲一区在线观看视频| 国产精品白丝av| 欧美日韩国产免费| 国产精品视频在线看| 日本不卡一二三区黄网| 99久久综合99久久综合网站| 欧美一区二区私人影院日本| 亚洲视频免费在线观看| 国产精品自拍网站| 日韩欧美精品在线| 亚洲福利电影网| av午夜精品一区二区三区| 日韩一区二区三区高清免费看看| 亚洲色图都市小说| 99久久伊人精品| 国产午夜精品一区二区三区嫩草| 亚洲电影视频在线| 91福利国产精品| 国产精品乱子久久久久| 国产激情偷乱视频一区二区三区| 欧美日韩五月天| 性欧美疯狂xxxxbbbb| 91国在线观看| 亚洲欧美日韩一区二区| www.成人在线| 中文字幕中文字幕在线一区| 国产成人免费视频精品含羞草妖精| 欧美日韩国产精品自在自线| 亚洲综合成人网| 欧美中文字幕不卡| 亚洲一区二区三区小说| 欧美天天综合网| 五月天精品一区二区三区| 欧美女孩性生活视频| 青青国产91久久久久久| 欧美大肚乱孕交hd孕妇| 国产精品一区二区久久不卡 | 欧美aⅴ一区二区三区视频| 日韩一区二区视频在线观看| 久久精品国产亚洲aⅴ| 久久欧美一区二区| 成人avav影音| 亚洲高清视频在线| 欧美一级日韩不卡播放免费| 老色鬼精品视频在线观看播放| 欧美一区三区四区| 国模娜娜一区二区三区| 国产精品久久久久久久蜜臀 | 久久综合久久99| thepron国产精品| 丝袜美腿亚洲色图| 欧美一级一级性生活免费录像| 国产精品自产自拍| 亚洲一二三区在线观看| 欧美视频一区在线| 国产精一区二区三区| 亚洲免费在线播放| 精品剧情v国产在线观看在线| 成人黄色一级视频| 精品亚洲国内自在自线福利| 中文字幕永久在线不卡| 欧美一区二区大片| 99久久99久久精品免费看蜜桃 | 亚洲综合丁香婷婷六月香| 欧美精品一区二区蜜臀亚洲| 色婷婷狠狠综合| 国产高清不卡一区| 青青草国产成人99久久| 亚洲天堂网中文字| 久久久久久9999| 日韩一二三区视频| 色婷婷国产精品综合在线观看| 国产成人av电影在线| 日本美女一区二区三区视频| 亚洲人成电影网站色mp4| 久久蜜桃av一区二区天堂| 欧美一区二区三区不卡| 欧美色涩在线第一页| 色综合天天综合狠狠| 成人性生交大片免费看中文| 精品一区二区三区免费播放| 亚洲成a人片综合在线| 亚洲永久精品国产| 亚洲人成网站色在线观看| 国产精品午夜电影| 中文字幕av一区 二区| 久久久精品免费观看| 久久久亚洲精品石原莉奈| 日韩欧美精品三级| 精品国免费一区二区三区| 精品电影一区二区| 久久夜色精品一区| 国产三级一区二区| 国产亚洲一本大道中文在线| 欧美精品一区二区三区在线播放| 精品盗摄一区二区三区| 精品久久久久av影院| 久久美女艺术照精彩视频福利播放 | 亚洲欧洲中文日韩久久av乱码| 亚洲欧美偷拍三级| 亚洲成av人片在线| 视频一区二区不卡| 国内精品不卡在线| 99久久99久久综合| 欧美精选午夜久久久乱码6080| 欧美精三区欧美精三区| 日韩一级完整毛片| 久久九九99视频| 亚洲婷婷综合久久一本伊一区| 亚洲精品少妇30p| 三级不卡在线观看| 国产精品99久| 91黄视频在线| 久久综合久久综合久久| 国产精品久久久久久妇女6080| 亚洲午夜久久久久久久久电影网| 精品一区二区三区av|