虛擬數字人-阿里云視覺智能開發平臺

虛擬數字人-阿里云視覺智能開發平臺

專用API
【更新時間: 2024.07.15】 虛擬數字人技術以AI實時渲染為核心,快速構建輕量級數字人物。依托達摩院在語音、圖像、3D美術、NLP等領域的技術,提供實時交互的數字人流媒體產品、高效的視頻合成服務,以及定制化的數字人資產構建。
5749元/路/月 去服務商官網采購>
瀏覽次數
129
采購人數
0
試用次數
0
! SLA: N/A
! 響應: N/A
! 適用于個人&企業
收藏
×
完成
取消
×
書簽名稱
確定
<
產品介紹
>

什么是阿里云視覺智能開發平臺的虛擬數字人?

虛擬數字人以AI驅動實時渲染為核心能力,提供快速輕量的數字人構建路徑。基于達摩院在語音、圖像、3D美術、自然語言處理等領域的技術優勢,提供以實時交互為目標的「數字人流媒體」產品、以效率化內容生產為目標的「數字人視頻合成」產品,以及豐富表現力的數字人資產構建定制服務。現在購買,暢享數字人帶來的無限可能!

什么是阿里云視覺智能開發平臺的虛擬數字人接口?

由服務使用方的應用程序發起,以Restful風格為主、通過公網HTTP協議調用阿里云視覺智能開發平臺的虛擬數字人,從而實現程序的自動化交互,提高服務效率。

阿里云視覺智能開發平臺的虛擬數字人有哪些核心功能?

  1. 數字人流媒體:阿里數字人提供數字人標準化PaaS服務,可集成到各種終端上。通過阿里云虛擬數字人的PaaS接口傳遞數字人即將播報的文本,可以獲得數字人播報的視頻流或離線視頻文件。支持在線直播、數字人助理播報等效果,并且可以集成在Web、移動端、PC端、線下大屏等各種類型終端上
  2. 數字人視頻合成:阿里數字人提供離線驅動3D/2D數字人進行文本播報生成對應視頻的產品能力。支持通過API以及SaaS頁面兩種方式向服務端發送文本,服務端接收到數據后處理成數字人的聲音、表情、口型、動作,然后將對應數據合成指定格式的視頻,并提供對應的視頻下載地址
  3. 數字人資產庫:阿里數字人提供3D/2D數字人形象的預覽、捏臉、換裝、聲音切換等編輯管理能力。官方提供了豐富的3D數字人和2D數字人形象,并支持對官方形象進行預覽和編輯,如換裝以及聲音切換等(2D數字人形象暫不支持編輯)
  4. 語音、視覺多模態表達:集成自然語言理解算法,根據播報的內容智能驅動數字人表情和動作,實現語音、表情、手勢動作的多模態表達
  5. 虛擬數字人視頻創作:基于數字人開放平臺的技術能力,提供預置的3D虛擬數字人形象,并支持文本輸入生成數字人視頻,支持更換背景、設置字幕、自定義數字人音色、形象,可快速生成視頻,進行下一步的自由創作或者直接投放
  6. 自主靈活配置多種素材:支持驅動人物表情與動作,基于表情驅動及動作驅動的數字人技術,生成的數字人形象可以根據播報的內容,零延遲匹配對應的唇形。同時,根據文本的語義分析,配以對應的手勢動作,使數字人播報更加流暢自然,富有感染力

阿里云視覺智能開發平臺的虛擬數字人的核心優勢是什么?

  1. 強大的AI技術能力:阿里數字人依托阿里達摩院在語音、圖像、3D美術、自然語言處理(NLP)等領域的技術優勢,阿里虛擬數字人服務能夠提供高度智能化的實時渲染和驅動能力,使得數字人的表現更加自然、生動。

  2. 多模態交互能力:阿里數字人通過集成CV(計算機視覺)、3D、語音、NLP以及包含知識、情感、記憶、個性的對話大模型等多模態技術,阿里虛擬數字人能夠實現情感化的雙工交互,即能夠理解和響應用戶的情緒,并據此進行更加自然和人性化的互動,提升用戶體驗。

  3. 高效的構建與定制服務:阿里數字人提供低門檻、輕量級、易集成的數字人構建路徑,無論是3D數字人還是2D數字人,都能快速構建并接入到客戶的業務中。同時,提供豐富的數字人資產形象庫和完善的視頻創作SAAS產品,滿足不同客戶的個性化需求。

  4. 廣泛的應用場景:阿里數字人支持視頻合成、流媒體實時交互、數字造星等多種應用場景。用戶可以根據需求選擇不同風格的數字人、音色、背景等,生成適用于教育、電商、新聞、視頻客服、助理、直播等多種場景的數字人播報視頻或實時交互內容。

  5. 靈活的技術底座與擴展性:阿里數字人提供基于AI驅動的數字人實時渲染推流的PaaS技術底座,支持客戶根據自身業務需求開發應用,并具備未來推出更多驅動模式的能力,確保了服務的靈活性和可擴展性。

在哪些場景會用到阿里云視覺智能開發平臺的虛擬數字人?

1.內容創作

阿里數字人可應用于新聞播報、政策解讀、課件講解將文本、語音等內容轉化為以數字人形象為主的視頻內容,使其能夠滿足在電視、網站、視頻平臺或社交平臺等視聽媒體的投放或傳播需求。阿里數字人為內容創作者提供更低門檻、更強表現力的視頻內容創作工具,提升創作效率,放大內容價值。

2.數字員工

您的專屬數字員工支持數字人形象與智能助理場景結合,將傳統文本互動升級為數字人交互,打造同時具備親切感與專業度的數字員工形象。應用數字員工,可替代真人完成基本的業務咨詢答疑、信息播報、數據查詢、業務流程辦理等服務。阿里數字人可以與觀眾進行雙向互動和實時反饋,提高觀眾的參與度和興趣度,相較于單向傳播的真人直播,虛擬直播的互動性更強,提升了用戶體驗

3.視頻客服

我們的功能優勢通過賦予客服機器人阿里數字人的形象,將傳統的在線/熱線客服升級成為支持WebRTC或VoLTE視頻客服。支持個性化配置客服形象和聲音,讓AI服務過程更親切、更有溫度;支持文本+語音+視頻雙向交互,并且可以根據用戶的表情、動作和環境信息定制服務響應策略。虛擬數字人克隆技術可以實現多元化的形象定制,只需拍攝幾分鐘的真人視頻,上傳至克隆平臺,通過AI深度建模,完美復刻真人形象,適用于多種場景

 

4.虛擬直播

阿里數字人能夠實現全天候不間斷的直播,無需真人主播,節省了真人直播所需的休息時間和流量空檔期,使品牌能夠在全時段得到曝光,更好地獲取流量。相比于真人直播的高昂成本,包括聘請主播、場地租賃、設備配置等,虛擬數字人直播無需這些開銷,只需一部手機或電腦即可搭建直播間,且可快速復制,極大降低了成本

<
產品價格
>

3D數字人流媒體

目前包含預付費、按量計費兩種模式:

預付費模式

規格名稱

價格

3D數字人流媒體

5749元/路/月

說明

5749元/路/月,這里的路指的是并發路數,也就是同一時刻支持幾個用戶與數字人進行交互,1路并發就是支持同一時刻只有1個用戶與數字人進行交互。3D數字人流媒體(停復機)的路數同理。

按量計費模式

規格名稱

價格

3D數字人流媒體(停復機)

0.60元/路/分鐘

數字人視頻合成

目前包含按量計費和預付費流量包兩種模式:

按量計費模式

規格名稱

價格

數字人視頻合成

9.9元/分鐘(計費精確到秒,相當于0.165元/秒)

預付費流量包(100分鐘以上)

如您對視頻合成用量較大(100分鐘以上),可根據實際需求購買視頻合成預付費流量包,在使用視頻合成創作時,會優先抵扣資源包中的流量,超出資源包的流量再按量計費。點此購買

2D真人形象定制

目前包含按量計費一種模式:

按量計費模式

規格名稱

價格

2D真人形象定制(不支持退款)

6999元/每個形象/年(第二年使用需續費,續費價格請聯系工作人員)

說明
  • 上傳5-10分鐘拍攝視頻后,除去用戶確認時間,算法訓練最長10個工作日處理完成;

  • 人工審核通過后,將會發送短信通知您,您需前往控制臺進行確認訓練,確認后將自動扣費,不支持退款;

<
使用指南
>

1. 接入流程

  1. 申請阿里云賬號,完成實名認證(個人或企業均可)

  2. 申請購買權限,完成購買開通服務

  3. 配置應用

  4. 服務端接入

  5. 客戶端接入

2. 申請賬號

  • 您需要提前申請好一個阿里云賬號,并完成實名認證,具體操作方式可參考準備工作

3. 申請購買

  • 擁有了阿里云賬號之后,您需要通過虛擬數字人開放平臺的申請審核,然后才能進行購買,具體操作方式可參考開通服務

4. 配置應用

5. 服務端接入

  • 虛擬數字人開放平臺服務端接入依賴OpenAPI

  • 在調用OpenAPI之前需要拿到API調用所需要的AK和SK, 獲取方式可參考獲取AccessKey文檔

  • 詳細的服務端接入文檔可參考服務端 API 接入篇

6. 客戶端接入

  • 客戶端接入,主要解決的是視頻流拉取的問題,采用阿里云音視頻RTC的技術方案,提供了豐富的客戶端接入能力

  • 詳細的客戶端接入文檔可參考3D數字人實時流媒體

7. 客戶端硬件要求

  • 1路并發的帶寬要求:

類別

要求

備注

下行速率

2Mb/s

720P/路,僅考慮RTC拉流,不包含應用中數字人以外其他功能所占帶寬

上行速率

1Mb/s

僅考慮音頻互動通道

指南詳情鏈接:https://help.aliyun.com/zh/avatar/avatar/getting-started/integrate-dvh-open-platform?spm=5176.23370677.J_7001639620.3.43515917lQi2AU
<
產品問答
>
?
是否支持測試體驗?
針對3D阿里數字人流媒體產品,用戶可以通過下單3D阿里數字人流媒體(停復機)商品進行測試體驗。該商品屬于后付費商品,下單時不需要付費,使用時才需付費。用戶可以在項目管理中創建App關聯該實例進行測試預覽
?
3D數字人形象是否可以定制?
目前不支持3D數字人定制以及導入功能
?
數字人交互時表情是否根據內容自動生成?
在數字人流媒體服務中,表情是根據文本內容自動生成的,無需額外配置
?
阿里數字人流媒體服務的擬真人渲染效果如何?
阿里數字人流媒體服務可以達到市面上主流的擬真人渲染效果
?
是否支持其他對話機器人引擎?
互動數字人目前只支持云小蜜,可以通過播報數字人結合ASR、其他對話機器人
?
接入開放平臺生成類似真人的數字人與卡通類型的數字人,兩者的接入和開發成本區別大嗎?
接入部分的工作量沒有區別
?
產品是否可以私有化部署?視頻流是否有加密?
阿里數字人產品不支持私有化部署,視頻流不支持不走公網
?
播報數字人如何做打斷?
可以通過設置API SendMessage請求參數內"TextRequest.interrupt"為true來實現打斷
<
關于我們
>
阿里云計算有限公司,成立于2009年,是全球領先的云計算及人工智能技術服務提供商。作為阿里巴巴集團的云服務部門,阿里云致力于通過先進的云計算技術,為全球企業、開發者和政府機構提供安全、穩定、可靠的云服務。公司服務覆蓋計算、存儲、數據庫、網絡、大數據、人工智能等多個領域,擁有遍布全球的數據中心和強大的技術實力,支持企業數字化轉型和創新。
聯系信息
服務時間: 0:00 - 24:00
電話號碼: 86 571 8502 2600
網頁在線客服: 咨詢
AI時代,領先企業的共同選擇
阿里云以全球云基礎設施、超大規模普惠算力、先進AI技術體系助力企業開啟AI時代的領先之路,一起乘云而上!
阿里云,數字經濟的技術基礎設施
云計算是一場偉大的變革,讓計算成為公共服務,提供隨時隨地可用的算力。在數字經濟大潮下,云計算是數據的基礎,價值在于讓客戶有了數據處理的可能,而不只是IDC搬遷帶來的成本節約。
 
01為千行百業創新提速
為300萬企業和組織發展提速,助力數字經濟和產業加速融合
 
02開發者首選創新加速器
阿里云以普惠算力和豐富的技術產品,服務1000萬開發者
 
03為社會創造美好生活
阿里云持續踐行綠色、公益、普惠,用科技服務社會大眾
 
企業社會責任,綠色、可持續
呼吁全球的創新者,用技術做有情有義的事,為世界帶來有益改變,更能幫助解決人類面臨的貧困、教育、環境等問題。
<
最可能同場景使用的其他API
>
API接口列表
<
產品價格
>

3D數字人流媒體

目前包含預付費、按量計費兩種模式:

預付費模式

規格名稱

價格

3D數字人流媒體

5749元/路/月

說明

5749元/路/月,這里的路指的是并發路數,也就是同一時刻支持幾個用戶與數字人進行交互,1路并發就是支持同一時刻只有1個用戶與數字人進行交互。3D數字人流媒體(停復機)的路數同理。

按量計費模式

規格名稱

價格

3D數字人流媒體(停復機)

0.60元/路/分鐘

數字人視頻合成

目前包含按量計費和預付費流量包兩種模式:

按量計費模式

規格名稱

價格

數字人視頻合成

9.9元/分鐘(計費精確到秒,相當于0.165元/秒)

預付費流量包(100分鐘以上)

如您對視頻合成用量較大(100分鐘以上),可根據實際需求購買視頻合成預付費流量包,在使用視頻合成創作時,會優先抵扣資源包中的流量,超出資源包的流量再按量計費。點此購買

2D真人形象定制

目前包含按量計費一種模式:

按量計費模式

規格名稱

價格

2D真人形象定制(不支持退款)

6999元/每個形象/年(第二年使用需續費,續費價格請聯系工作人員)

說明
  • 上傳5-10分鐘拍攝視頻后,除去用戶確認時間,算法訓練最長10個工作日處理完成;

  • 人工審核通過后,將會發送短信通知您,您需前往控制臺進行確認訓練,確認后將自動扣費,不支持退款;

<
使用指南
>

1. 接入流程

  1. 申請阿里云賬號,完成實名認證(個人或企業均可)

  2. 申請購買權限,完成購買開通服務

  3. 配置應用

  4. 服務端接入

  5. 客戶端接入

2. 申請賬號

  • 您需要提前申請好一個阿里云賬號,并完成實名認證,具體操作方式可參考準備工作

3. 申請購買

  • 擁有了阿里云賬號之后,您需要通過虛擬數字人開放平臺的申請審核,然后才能進行購買,具體操作方式可參考開通服務

4. 配置應用

5. 服務端接入

  • 虛擬數字人開放平臺服務端接入依賴OpenAPI

  • 在調用OpenAPI之前需要拿到API調用所需要的AK和SK, 獲取方式可參考獲取AccessKey文檔

  • 詳細的服務端接入文檔可參考服務端 API 接入篇

6. 客戶端接入

  • 客戶端接入,主要解決的是視頻流拉取的問題,采用阿里云音視頻RTC的技術方案,提供了豐富的客戶端接入能力

  • 詳細的客戶端接入文檔可參考3D數字人實時流媒體

7. 客戶端硬件要求

  • 1路并發的帶寬要求:

類別

要求

備注

下行速率

2Mb/s

720P/路,僅考慮RTC拉流,不包含應用中數字人以外其他功能所占帶寬

上行速率

1Mb/s

僅考慮音頻互動通道

指南詳情鏈接:https://help.aliyun.com/zh/avatar/avatar/getting-started/integrate-dvh-open-platform?spm=5176.23370677.J_7001639620.3.43515917lQi2AU
<
依賴服務
>
<
產品問答
>
?
是否支持測試體驗?
針對3D阿里數字人流媒體產品,用戶可以通過下單3D阿里數字人流媒體(停復機)商品進行測試體驗。該商品屬于后付費商品,下單時不需要付費,使用時才需付費。用戶可以在項目管理中創建App關聯該實例進行測試預覽
?
3D數字人形象是否可以定制?
目前不支持3D數字人定制以及導入功能
?
數字人交互時表情是否根據內容自動生成?
在數字人流媒體服務中,表情是根據文本內容自動生成的,無需額外配置
?
阿里數字人流媒體服務的擬真人渲染效果如何?
阿里數字人流媒體服務可以達到市面上主流的擬真人渲染效果
?
是否支持其他對話機器人引擎?
互動數字人目前只支持云小蜜,可以通過播報數字人結合ASR、其他對話機器人
?
接入開放平臺生成類似真人的數字人與卡通類型的數字人,兩者的接入和開發成本區別大嗎?
接入部分的工作量沒有區別
?
產品是否可以私有化部署?視頻流是否有加密?
阿里數字人產品不支持私有化部署,視頻流不支持不走公網
?
播報數字人如何做打斷?
可以通過設置API SendMessage請求參數內"TextRequest.interrupt"為true來實現打斷
<
關于我們
>
阿里云計算有限公司,成立于2009年,是全球領先的云計算及人工智能技術服務提供商。作為阿里巴巴集團的云服務部門,阿里云致力于通過先進的云計算技術,為全球企業、開發者和政府機構提供安全、穩定、可靠的云服務。公司服務覆蓋計算、存儲、數據庫、網絡、大數據、人工智能等多個領域,擁有遍布全球的數據中心和強大的技術實力,支持企業數字化轉型和創新。
聯系信息
服務時間: 0:00 - 24:00
電話號碼: 86 571 8502 2600
網頁在線客服: 咨詢
AI時代,領先企業的共同選擇
阿里云以全球云基礎設施、超大規模普惠算力、先進AI技術體系助力企業開啟AI時代的領先之路,一起乘云而上!
阿里云,數字經濟的技術基礎設施
云計算是一場偉大的變革,讓計算成為公共服務,提供隨時隨地可用的算力。在數字經濟大潮下,云計算是數據的基礎,價值在于讓客戶有了數據處理的可能,而不只是IDC搬遷帶來的成本節約。
 
01為千行百業創新提速
為300萬企業和組織發展提速,助力數字經濟和產業加速融合
 
02開發者首選創新加速器
阿里云以普惠算力和豐富的技術產品,服務1000萬開發者
 
03為社會創造美好生活
阿里云持續踐行綠色、公益、普惠,用科技服務社會大眾
 
企業社會責任,綠色、可持續
呼吁全球的創新者,用技術做有情有義的事,為世界帶來有益改變,更能幫助解決人類面臨的貧困、教育、環境等問題。
<
最可能同場景使用的其他API
>