在后訓(xùn)練階段,他們使用與 Llama 3.1 類(lèi)似的方法,通過(guò)在預(yù)訓(xùn)練模型之上進(jìn)行多輪對(duì)齊來(lái)生成最終的聊天模型。每一輪都包括監(jiān)督微調(diào)(SFT)、拒絕采樣(RS)和直接偏好優(yōu)化(DPO)。

在后訓(xùn)練階段,他們將上下文長(zhǎng)度支持?jǐn)U展到 128K 標(biāo)記,同時(shí)保持與預(yù)訓(xùn)練模型相同的質(zhì)量。他們還進(jìn)行合成數(shù)據(jù)生成,通過(guò)仔細(xì)的數(shù)據(jù)處理和過(guò)濾來(lái)確保高質(zhì)量。他們精心混合數(shù)據(jù),以?xún)?yōu)化多種能力的高質(zhì)量表現(xiàn),如總結(jié)、重寫(xiě)、遵循指令、語(yǔ)言推理和工具使用。

為了使社區(qū)能夠在這些模型上進(jìn)行創(chuàng)新,他們與全球排名前兩位的移動(dòng)系統(tǒng)芯片(SoC)公司高通和聯(lián)發(fā)科,以及為 99% 的移動(dòng)設(shè)備提供基礎(chǔ)計(jì)算平臺(tái)的 Arm 密切合作。今天發(fā)布的權(quán)重基于 BFloat16 數(shù)值。他們的團(tuán)隊(duì)正在積極探索將運(yùn)行得更快的量化變體,他們希望很快能分享更多相關(guān)信息。

Llama Stack 發(fā)布

2023年7月,Meta 發(fā)布了關(guān)于 Llama Stack API 的意見(jiàn)征詢(xún),這是一個(gè)標(biāo)準(zhǔn)化接口,用于規(guī)范工具鏈組件(如微調(diào)、合成數(shù)據(jù)生成等),以定制 Llama 模型并構(gòu)建智能應(yīng)用程序。社區(qū)反響熱烈。

此后,Meta 一直在努力將 API 付諸實(shí)踐。他們?yōu)橥评?、工具使用?RAG 構(gòu)建了 API 的參考實(shí)現(xiàn)。此外,他們還與合作伙伴合作,幫助他們適配成為 API 的提供者。最后,他們引入了 Llama Stack Distribution 作為一種打包多個(gè) API 提供者的方式,這些提供者能夠很好地協(xié)同工作,為開(kāi)發(fā)者提供單一端點(diǎn)。他們現(xiàn)在正與社區(qū)分享一種簡(jiǎn)化且一致的體驗(yàn),使他們能夠在多種環(huán)境中使用 Llama 模型,包括本地、云端、單節(jié)點(diǎn)和設(shè)備端。

完整的發(fā)布內(nèi)容包括:

  1. 1. Llama CLI (命令行界面),用于構(gòu)建、配置和運(yùn)行 Llama Stack 發(fā)行版
  2. 2. 多種語(yǔ)言的客戶(hù)端代碼,包括 Python、Node.js、Kotlin 和 Swift
  3. 3. Llama Stack Distribution Server 和 Agents API Provider 的 Docker 容器
  4. 4. 多個(gè)發(fā)行版
    1. 1. 通過(guò) Meta 內(nèi)部實(shí)現(xiàn)和 Ollama 的單節(jié)點(diǎn) Llama Stack 發(fā)行版
    2. 2. 通過(guò) AWS、Databricks、Fireworks 和 Together 的云端 Llama Stack 發(fā)行版
    3. 3. 通過(guò) PyTorch ExecuTorch 實(shí)現(xiàn)的 iOS 設(shè)備上的 Llama Stack 發(fā)行版
    4. 4. 由 Dell 支持的本地部署 Llama Stack 發(fā)行版

系統(tǒng)級(jí)安全

采取開(kāi)放方法有許多好處。它有助于確保全球更多人能夠獲得 AI 帶來(lái)的機(jī)會(huì),防止權(quán)力集中在少數(shù)人手中,并在社會(huì)中更公平、更安全地部署技術(shù)。在 Meta 不斷創(chuàng)新的同時(shí),他們也希望確保能夠賦予開(kāi)發(fā)者構(gòu)建安全和負(fù)責(zé)任系統(tǒng)的能力。

在他們之前的發(fā)布和持續(xù)努力支持負(fù)責(zé)任創(chuàng)新的基礎(chǔ)上,今天他們?yōu)樗麄兊陌踩U舷盗刑砑恿诵碌母拢?/p>

這些新解決方案已集成到他們的參考實(shí)現(xiàn)、演示和應(yīng)用程序中,并可供開(kāi)源社區(qū)從第一天起就使用。

立即嘗試 Llama 3.2

Llama 3.2 有望比以往任何時(shí)候都能接觸到更多人,并實(shí)現(xiàn)令人興奮的新用例。Meta 相信,與開(kāi)源社區(qū)共享這些模型是不夠的。他們希望確保開(kāi)發(fā)者也擁有負(fù)責(zé)任地使用 Llama 構(gòu)建所需的工具。作為他們持續(xù)負(fù)責(zé)任發(fā)布工作的一部分,他們?yōu)殚_(kāi)發(fā)者提供新的工具和資源,并且一如既往地會(huì)在他們的負(fù)責(zé)任使用指南中更新最佳實(shí)踐。

文章轉(zhuǎn)自微信公眾號(hào)@知常明智

上一篇:

提速 RAG 應(yīng)用:用 DeepSeek API 替換本地 Ollama 模型,LlamaIndex 實(shí)戰(zhàn)解析

下一篇:

Open-Meteo 的歷史天氣數(shù)據(jù) API 詳解
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊(cè)

多API并行試用

數(shù)據(jù)驅(qū)動(dòng)選型,提升決策效率

查看全部API→
??

熱門(mén)場(chǎng)景實(shí)測(cè),選對(duì)API

#AI文本生成大模型API

對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)

#AI深度推理大模型API

對(duì)比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)