![]() |
實時音視頻-北京火山引擎
專用API
【更新時間: 2024.06.27】
億級 DAU 產品驗證打磨的音視頻最佳實踐,提供全球范圍內高質量、低延時的實時音視頻通信能力,幫助開發者快速構建語音通話、視頻通話、互動直播、轉推直播等豐富的場景功能。
0.007元/分鐘起
去服務商官網采購>
|
瀏覽次數
46
采購人數
0
試用次數
0
收藏
×
完成
取消
×
書簽名稱
確定
|
- API詳情
- 定價
- 使用指南
- 常見 FAQ
- 關于我們
- 相關推薦


什么是北京火山引擎的實時音視頻?
火山引擎實時音視頻(Volcengine Real Time Communication,veRTC)提供全球范圍內高可靠、高并發、低延時的實時音視頻通信能力,實現多種類型的實時交流和互動。通過在應用中接入 veRTC SDK,并調用 veRTC 提供的 API,可以快速構建:音視頻聊天、在線教育、直播連麥、視頻會議、游戲語音、云游戲、云端渲染等豐富場景功能,覆蓋互娛、教育、游戲、會議等各種行業需求。
什么是北京火山引擎的實時音視頻接口?
北京火山引擎的實時音視頻有哪些核心功能?
基礎功能
- 語音通話:支持 1v1 語音聊天和多人語音群聊,48kHz 全頻帶采樣,先進 3A 處理算法,還原高音質。
- 視頻通話:支持 1v1 視頻聊天和多人視頻群聊,VR 最高支持 8K 高清畫質,采用行業領先的編解碼算法策略
- 互動直播:單房間支持最多 1000 名主播,10 萬名觀眾,首幀時長中位數 <300ms
進階功能
- 連麥互動:支持主播與觀眾連麥、主播與主播連麥,上下麥切換體驗平滑流暢。
- 合流轉推:將多人 RTC 流進行云端合流轉碼,支持合流、自定義布局,并推流到指定直播 CDN。
- 伴音伴奏:將本地背景音、伴奏等同步發送給遠端用戶。
- 氛圍音:支持播放短小的氛圍音和音效文件,如笑聲、鼓掌、歡呼、尖叫等氛圍音效果。
- 耳返:支持耳返監聽功能,支持調節耳返的音量,耳返延時低至 50ms。
- AI 降噪:通過 AI 算法有效抑制常見平穩噪聲和非平穩噪聲,為用戶提供超純凈音質體驗。
- 推送多路流:支持同時發送高清大流和低清小流,接收端根據網絡自動訂閱。
- 超分:支持將低分辨率視頻超分成高分辨率視頻,提高視頻清晰度和畫質。
- 屏幕共享:將電腦桌面、窗口、指定區域分享給其他人,支持與攝像頭畫面同時顯示。
- 自采集自渲染:支持自定義的視頻源和渲染器,可以更靈活地處理視頻。
- 云端錄制:通過 OpenAPI 發起錄制任務請求,veRTC 進行音視頻錄制并上傳至客戶指定的存儲平臺
擴展功能
- 美顏特效:深度融合火山引擎 CV 功能,支持基礎美顏、高級美顏、濾鏡、貼紙等。
- 空間音頻:一種能夠呈現聲源的空間方位的音頻技術,提高用戶音頻體驗的沉浸感。
- 范圍語音:一種音頻效果,開啟此功能后,聲音的衰減系數隨距離聲源的距離變大而變大。
- 美聲音效:設置變聲、混響、語音變調功能。
- 曲庫管理:獲取歌曲列表、搜索歌曲、獲取熱歌榜單等。
- 背景分割:支持通過 AI 算法將人物與背景分割。
- 添加視頻水印:為實時音視頻通信的視頻畫面添加自定義水印。
- ASR 語音識別:采用業內領先的端到端算法模型,準確地將語音內容轉寫成文字。
- 發送和接收媒體補充增強信息(SEI):SEI 信息跟隨音視頻幀發送,實現 SEI 內容與音視頻內容精準同步。
- 內容審核:支持音視頻敏感內容審核功能,確保內容安全。
- AI 應用:一站式的 AI 接入服務,支持表情識別、手勢識別、注意力識別、中英文開口時長等 AI 功能。
北京火山引擎的實時音視頻的核心優勢是什么?
1. 音頻 3A 處理
業界領先的 3A 算法。實現 48kHz 高音質全雙工的回聲消除。自動噪聲抑制、自動增益使用超低計算量機器學習算法,更低的功耗實現更好的效果。
2. 機型主動適配
適配 40000+ 款不同的機型,根據設備的性能打分、覆蓋率等進行差異化的視頻采集/編碼策略,實現 RTC 硬編硬解的機型適配(按實際通話時長計算)比例超過 90%。
3. 最佳畫質
采用 H.265 編碼器,效率較 H.264 顯著提升。另外支持 Simulcast、SVC、ROI、自動碼率等先進編碼策略和超分、視頻降噪、暗光增強等先進畫質增強算法,可根據不同機型性能,下發不同檔位的視頻分辨率,移動端最高支持 1080P,PC 端最高支持 4K,VR 最高支持 8K。
4. 高可用
支持單元化部署,分鐘級急速擴容。同城雙機房,多線路冗余傳輸。符合 SLA 服務等級協議規定的指標,服務可用性不低于 99.9%。
5. 低延時
基于優質全球傳輸網絡,全球端到端 400ms 延時達標率 ≥ 99.5%,服務端平均延時 < 50ms。
6. 弱網自適應
應用 FEC、ARQ、HARQ、自適應 Jitter Buffer、自適應碼率下發等弱網策略,實現 50% 丟包無感知恢復,最高 80% 抗丟包能力。支持內容自適應編碼,可基于線上視頻清晰度的實時反饋來進行自動碼率調整,減輕網絡傳輸的壓力。同時采用智能擁塞控制算法 VICC,能夠根據不同的網絡條件、業務偏好和碼率特征進行自適應調整,以提升各種復雜弱網下的帶寬利用率。
7. 性能動態適配
支持智能流控協議,可以綜合考慮音視頻通話中每個訂閱者的個性化需求,在網絡情況、終端性能發生變化的時候,自動調整音視頻流的配置,提升用戶體驗。
8. 場景化策略
支持區分不同業務場景的參數配置下發,根據不同用戶規模、機型、地區、網絡模型采取不同的適配策略,滿足多樣化的高質量音視頻體驗需求。
9. 高效集成開發
提供靈活規范的 API,支持一鍵配置業務最佳實踐,降低開發者集成復雜度,提高開發效率,平均 2 周內即可上線。可裁剪的 SDK 包設計,CPU 內存占用更低。適用于各種平臺,可以快速構建多端應用。
10. 超大規模互動
行業首創單房間支持超千人同時開麥,突破傳統實時音視頻上麥人數限制,互動人數提升 20 倍以上,觀眾人數無上限。
11. 多樣化產品融合
與火山引擎平臺各核心產品深度融合,聯動美顏特效、直播、點播、內容審核、語音識別、AI 應用等產品,為用戶提供各種實時音視頻場景下的全鏈路解決方案。
12. 安全合規
擁有完善的安全保護體系,可提供全鏈路音視頻加密、用戶業務數據隔離,且滿足 ISO 等信息安全標準以及 GDPR、CCPA 等跨境安全合規要求。
在哪些場景會用到北京火山引擎的實時音視頻?
1. 在線KTV
排麥獨唱與實時互動結合是當前互娛社交領域的熱門玩法,用戶跟隨音樂演唱歌曲并與其他用戶進行音視頻實時互動,滿足了用戶才藝展示的需求,為用戶之間關系的構建提供了玩法通道;通過排麥獨唱增加了房間內互動的樂趣,有助于提高用戶活躍度及用戶留存率。火山引擎提供實時音視頻通話、正版音樂曲庫、K歌音效處理等互動K歌一站式解決方案,幫助開發者無門檻搭建排麥獨唱場景。
2. 一起看直播
一起看直播是社交娛樂的新場景,通過實時音視頻互動體驗線下與朋友一起看直播的氛圍。房主創建一個線上實時互動的房間,在房間內播放直播視頻,邀請用戶一起邊看直播邊視頻聊天。火山引擎基于實時音視頻 SDK,提供抖音同款“一起看直播”解決方案。支持添加美顏特效、房間內文字聊天,增強好友看播趣味互動。
3. 游戲房
游戲房是泛娛樂社交領域的一種新玩法,例如情侶小游戲、聊天室小游戲等。主播或用戶在傳統的語音聊天室或語音通話的基礎上選擇不同的小游戲,例如五子棋、你畫我猜、猜拳等。通過小游戲可以增加用戶的停留時長,創造更多的話題。對于聊天室場景,主播可以邀請麥下的觀眾與其一起玩小游戲,與他們實時互通。
4. 音視頻通話
音視頻通話是社交中一種最常見的基礎場景,在與陌生人之間通話時,更多地需要剔除角色的差異。通過輸入用戶 ID,創建并進入一個線上實時互動的房間,雙方可以在房間內實時暢聊,同時支持添加美顏特效,為用戶打造一個穩定、高質量的音視頻聊天室。


計費類型 | 計價檔位 | 規格 | 單價(元/分鐘) | 微信小程序端 單價(元/分鐘) |
---|---|---|---|---|
音頻通信 | 純音頻 | 純音頻 | 0.007 | 0.009 |
視頻通信 | 360P 視頻 | 視頻分辨率不高于 360P(800 x 360 = 288000) | 0.014 | 0.016 |
視頻通信 | 720P 視頻 | 視頻分辨率高于 360P(800 x 360 = 288000),但不高于 720P(1600 x 720 = 1152000) | 0.028 | 0.03 |
視頻通信 | 1080P 視頻 | 視頻分辨率高于 720P(1600 x 720 = 1152000),但不高于 1080P(2400 x 1080 = 2592000) | 0.063 | 0.072 |
視頻通信 | 2K 視頻 | 視頻分辨率高于(2400 x 1080 = 2592000),但不高于 2K(3200 x 1440 = 4608000) | 0.112 | / |
視頻通信 | 4K 視頻 | 視頻分辨率高于(3200 x 1440 = 4608000),但不高于 4K(4800 x 2160 = 10368000) | 0.252 | / |


步驟1:登錄火山引擎控制臺
登錄火山引擎控制臺 。
步驟2:實名認證
登錄成功后,你必須先進行實名認證,參看實名認證:
步驟3:申請開通 RTC 服務
-
你必須在總覽頁選擇 「實時音視頻」 進入,并 申請開通 。
-
你必須勾選 同意《實時音視頻服務協議》 ,才可以成功開通實時音視頻服務。
步驟4:創建 RTC 應用,獲取 AppId
- 【可選】在多人團隊協作中,你可能希望通過子賬戶(IAM)功能細化權限管理,參看賬號和授權創建和授權子賬號應用管理權限。
- 登錄 RTC 控制臺后,你可以在 「應用管理」 中管理應用,包括修改應用名稱,查看 AppID、 AppKey、創建時間等。 其中,
defaultAppName
為系統默認創建。
說明
- AppId 是每個應用的唯一標識符,在調用 volcEngineRTC SDK 的 API 接口實現功能,如創建對象時,你必須填入你獲取到的 AppId 。
- AppKey 是每個應用對應的密鑰,請妥善保管。AppKey 用于生成 Token 鑒權,一旦你的密鑰泄露,可能會被盜用流量。
- 如果你需要創建新的應用,可以在 「應用管理」 中點擊創建應用 , 提交更多創建應用的申請。
指南詳情鏈接:https://www.volcengine.com/docs/6348/69865




計算 |
存儲 |
數據庫 | 容器與中間件 |
人工智能與機器學習 | 網絡 | CDN與邊緣 | 大數據 |
視頻云 | 安全 | 企業服務與云通信 | 查看全部產品 |
企業上云
基于多云開放的高可用架構,火山引擎幫助企業業務快速云上部署,保障業務運行穩定,不斷追求極致性能,使企業云上每一次計算及存儲都能獲得最優配置。
音視頻
基于字節跳動音視頻場景下的產品與運營實踐,火山引擎為客戶提供覆蓋全場景云端一體音視頻解決方案,一站獲取完備音視頻能力,助力業務創新敏捷落地。
智能營銷
基于抖音集團的用戶增長方法論,火山引擎從業務視角出發,持續串聯內容生產、內容管理、公私域運營等環節,提供覆蓋營銷全鏈路的完整解決方案。
汽車行業
基于抖音集團在智能與數據領域的沉淀,火山引擎以“智能駕駛云”、“智能座艙云”、“體驗運營云”為核心,打造個性化的互動智能座艙,提升全生命周期用戶體驗,構建精細化用戶運營和業務增長能力。
金融行業
基于字節跳動的技術積累,火山引擎為金融機構提供從底層技術架構到技術中臺,再到各類智能應用的全方位技術支持,構建數字敏捷,激發金融活力。
文娛行業
基于抖音集團穩定的基礎產品能力、數據驅動的營銷增長套件、AI加持的智能互動產品與多媒體技術,火山引擎為企業構建穩定業務、擴大用戶觸點、驅動交互創新、實現業務增長。
醫療
基于對生物醫學行業的關注,火山引擎與行業深度結合,通過BT+IT技術推動行業加速,為客戶提供多場景的解決方案,支持客戶業務創新、敏捷落地。
政府文旅
基于抖音集團的技術底座,火山引擎整合云基礎、數據、人工智能、物聯網等技術能力,全面助力城市實現數字化轉型,在城市治理、文旅營銷等場景中全面實現效率提升。
通信傳媒
基于抖音集團在泛資訊、短視頻等領域的前沿能力,火山引擎提供了覆蓋內容引入、生產、運營、分發、消費的端到端服務能力,打造完善的媒體數智化運營體系。
大消費
基于抖音集團的場景化實踐,火山引擎圍繞人貨場關系,整合云基礎、數據、算法、AI、內容等能力,實現從投放到交易的數據化閉環,幫助企業數字化運營效率提升。
優質的服務,全方位的支持 火山引擎堅定進入云市場 我們將始終堅持三個關鍵的理念 |
||
定制化服務方案 |
全方位業務響應 |
專業化技術支持 |


計費類型 | 計價檔位 | 規格 | 單價(元/分鐘) | 微信小程序端 單價(元/分鐘) |
---|---|---|---|---|
音頻通信 | 純音頻 | 純音頻 | 0.007 | 0.009 |
視頻通信 | 360P 視頻 | 視頻分辨率不高于 360P(800 x 360 = 288000) | 0.014 | 0.016 |
視頻通信 | 720P 視頻 | 視頻分辨率高于 360P(800 x 360 = 288000),但不高于 720P(1600 x 720 = 1152000) | 0.028 | 0.03 |
視頻通信 | 1080P 視頻 | 視頻分辨率高于 720P(1600 x 720 = 1152000),但不高于 1080P(2400 x 1080 = 2592000) | 0.063 | 0.072 |
視頻通信 | 2K 視頻 | 視頻分辨率高于(2400 x 1080 = 2592000),但不高于 2K(3200 x 1440 = 4608000) | 0.112 | / |
視頻通信 | 4K 視頻 | 視頻分辨率高于(3200 x 1440 = 4608000),但不高于 4K(4800 x 2160 = 10368000) | 0.252 | / |


步驟1:登錄火山引擎控制臺
登錄火山引擎控制臺 。
步驟2:實名認證
登錄成功后,你必須先進行實名認證,參看實名認證:
步驟3:申請開通 RTC 服務
-
你必須在總覽頁選擇 「實時音視頻」 進入,并 申請開通 。
-
你必須勾選 同意《實時音視頻服務協議》 ,才可以成功開通實時音視頻服務。
步驟4:創建 RTC 應用,獲取 AppId
- 【可選】在多人團隊協作中,你可能希望通過子賬戶(IAM)功能細化權限管理,參看賬號和授權創建和授權子賬號應用管理權限。
- 登錄 RTC 控制臺后,你可以在 「應用管理」 中管理應用,包括修改應用名稱,查看 AppID、 AppKey、創建時間等。 其中,
defaultAppName
為系統默認創建。
說明
- AppId 是每個應用的唯一標識符,在調用 volcEngineRTC SDK 的 API 接口實現功能,如創建對象時,你必須填入你獲取到的 AppId 。
- AppKey 是每個應用對應的密鑰,請妥善保管。AppKey 用于生成 Token 鑒權,一旦你的密鑰泄露,可能會被盜用流量。
- 如果你需要創建新的應用,可以在 「應用管理」 中點擊創建應用 , 提交更多創建應用的申請。
指南詳情鏈接:https://www.volcengine.com/docs/6348/69865






計算 |
存儲 |
數據庫 | 容器與中間件 |
人工智能與機器學習 | 網絡 | CDN與邊緣 | 大數據 |
視頻云 | 安全 | 企業服務與云通信 | 查看全部產品 |
企業上云
基于多云開放的高可用架構,火山引擎幫助企業業務快速云上部署,保障業務運行穩定,不斷追求極致性能,使企業云上每一次計算及存儲都能獲得最優配置。
音視頻
基于字節跳動音視頻場景下的產品與運營實踐,火山引擎為客戶提供覆蓋全場景云端一體音視頻解決方案,一站獲取完備音視頻能力,助力業務創新敏捷落地。
智能營銷
基于抖音集團的用戶增長方法論,火山引擎從業務視角出發,持續串聯內容生產、內容管理、公私域運營等環節,提供覆蓋營銷全鏈路的完整解決方案。
汽車行業
基于抖音集團在智能與數據領域的沉淀,火山引擎以“智能駕駛云”、“智能座艙云”、“體驗運營云”為核心,打造個性化的互動智能座艙,提升全生命周期用戶體驗,構建精細化用戶運營和業務增長能力。
金融行業
基于字節跳動的技術積累,火山引擎為金融機構提供從底層技術架構到技術中臺,再到各類智能應用的全方位技術支持,構建數字敏捷,激發金融活力。
文娛行業
基于抖音集團穩定的基礎產品能力、數據驅動的營銷增長套件、AI加持的智能互動產品與多媒體技術,火山引擎為企業構建穩定業務、擴大用戶觸點、驅動交互創新、實現業務增長。
醫療
基于對生物醫學行業的關注,火山引擎與行業深度結合,通過BT+IT技術推動行業加速,為客戶提供多場景的解決方案,支持客戶業務創新、敏捷落地。
政府文旅
基于抖音集團的技術底座,火山引擎整合云基礎、數據、人工智能、物聯網等技術能力,全面助力城市實現數字化轉型,在城市治理、文旅營銷等場景中全面實現效率提升。
通信傳媒
基于抖音集團在泛資訊、短視頻等領域的前沿能力,火山引擎提供了覆蓋內容引入、生產、運營、分發、消費的端到端服務能力,打造完善的媒體數智化運營體系。
大消費
基于抖音集團的場景化實踐,火山引擎圍繞人貨場關系,整合云基礎、數據、算法、AI、內容等能力,實現從投放到交易的數據化閉環,幫助企業數字化運營效率提升。
優質的服務,全方位的支持 火山引擎堅定進入云市場 我們將始終堅持三個關鍵的理念 |
||
定制化服務方案 |
全方位業務響應 |
專業化技術支持 |