![]() |
文本轉語音-Voicery
專用API
【更新時間: 2024.08.28】
Voicery提供的文本轉語音API 是一種定制化的語音引擎平臺,能夠將文本內容轉換為自然、流暢的語音。該服務支持多種語言和口音,并提供多個語音選擇,以滿足不同用戶的需求。
標準 :$0.001 每個字符
去服務商官網采購>
|
瀏覽次數
65
采購人數
0
試用次數
0
收藏
×
完成
取消
×
書簽名稱
確定
|
- API詳情
- 定價
- 使用指南
- 常見 FAQ
- 關于我們
- 相關推薦


什么是Voicery的文本轉語音?
自定義文本轉語音語音引擎服務-Voicery 是一項技術服務,它允許用戶通過輸入文本生成自然的語音輸出。該服務的核心在于其先進的語音合成技術,能夠模擬人類的語音特征,使生成的聲音聽起來真實且自然。Voicery 支持多種語言和語音風格的選擇,用戶可以根據特定的應用需求定制語音,如調整語速、音調等。這項服務廣泛應用于需要語音輸出的行業,例如客戶服務系統、智能設備以及媒體內容制作。
Voicery的文本轉語音有哪些核心功能?
- 定制化語音引擎:為企業定制獨特的聲音,包括語言、語調、情感等。
- 多種語言和口音支持:提供英語(美國)、英語(澳大利亞)、英語(英國)、英語(加拿大)、英語(印度)、英語(愛爾蘭)、英語(蘇格蘭)、英語(南非)等多種語言和口音的語音。
- 情感和風格的多樣性:能夠模擬對話式、旁白、生氣、害怕、快樂的等多種情感和風格。
- 高質量的語音合成:利用尖端的人工智能和深度學習技術,提供高質量的語音合成服務。
- 云、本地、離線或混合部署:支持多種部署方式,以滿足不同企業的需求。
- 實時流音頻和SSML標記:提供實時流音頻服務,并允許使用SSML標記調整音頻。
Voicery的文本轉語音的核心優勢是什么?
- 定制化服務:能夠根據企業需求定制獨特的聲音。
- 先進的技術:利用最新的人工智能和深度學習技術。
- 多樣化的語言和口音:提供多種語言和口音選擇,滿足全球市場的需求。
- 情感和風格的豐富性:能夠模擬多種情感和風格,使語音更加自然和逼真。
- 靈活的部署選項:支持云、本地、離線或混合部署,適應不同企業的IT架構。
- 實時音頻流和SSML標記:提供實時音頻流服務,并允許使用SSML標記進行音頻調整。
在哪些場景會用到Voicery的文本轉語音?
Voicery如果還在運營,可以為視覺障礙者提供一個強大的輔助閱讀工具。通過將電子書籍、網頁文章或文檔內容轉換成自然流暢的語音,這些用戶能夠更輕松地獲取信息,無需依賴他人或傳統的盲文材料。這種技術不僅提高了他們的自主性,還擴大了他們的閱讀選擇,使他們能夠享受與視力正常的同伴相同的閱讀體驗。
車載導航系統: 在駕駛時,Voicery的文本轉語音服務可以提供實時的語音導航指令,從而減少駕駛員在查看地圖或屏幕時的視覺分散。這不僅提高了駕駛安全性,也使得駕駛員能夠更專注于道路狀況。此外,該技術還可以用于讀取實時交通更新和天氣預報,進一步增強駕駛體驗。
語言學習應用: 教育領域的應用開發者可以利用Voicery的API來開發語言學習工具,這些工具能夠將書面文本轉換為標準發音的語音,幫助學習者練習聽力和發音。這種交互式學習方式特別適合那些希望提高外語口語能力的學習者,使他們能夠在沒有教師直接指導的情況下,通過模仿正確的發音來提高語言技能。
企業信息播報系統: 在企業環境中,Voicery的文本轉語音服務可以用于將內部通訊、報告或關鍵業務指標轉化為語音輸出。員工可以在執行其他任務,如處理客戶服務請求或進行數據分析時,通過聽覺接收這些信息。這種多任務處理能力提高了工作效率,確保員工能夠及時了解重要更新,同時保持對主要工作的專注。




1. 獲取API密鑰
- 注冊賬戶:訪問Voicery官方網站,完成注冊流程。
- 登錄賬戶:使用您的憑據登錄到Voicery賬戶。
- 獲取API密鑰:進入賬戶設置或API管理頁面,找到并生成您的API密鑰。確保保管好該密鑰,因為它用于身份驗證。
2. 設置請求環境
- HTTP客戶端:選擇一個HTTP客戶端工具,如Postman,或者在您的編程語言中使用HTTP庫(如Python的
requests
、JavaScript的axios
等)。 - 身份驗證:在HTTP請求的頭部中添加身份驗證信息。通常,您需要設置
Authorization
頭部,如下所示:Authorization: Bearer <YOUR_API_KEY>?
3. 構建請求
- 選擇端點:根據Voicery API文檔,確定您要調用的API端點。例如,轉換文本為語音的端點可能是
/text-to-speech
。 - 確定請求方法:根據API文檔選擇HTTP方法(GET、POST、PUT、DELETE等)。大多數文本轉語音的操作會使用POST方法。
- 準備請求體:
- 內容格式:確定請求體的格式(通常為JSON)。例如,文本轉語音請求的體可能包含以下內容:
{ "text": "Hello, world!", "language": "en", "voice": "male" }?
- 字段說明:根據API文檔,配置必需和可選的字段(如
text
、language
、voice
等)。
- 內容格式:確定請求體的格式(通常為JSON)。例如,文本轉語音請求的體可能包含以下內容:
4. 發送請求
- 生成音頻 :要生成音頻,請向/generate端點發出POST請求。
-
curl https://api.voicery.com/generate \ -H "Authorization: Bearer YOUR-API-KEY" \ -H "Content-Type: application/json; version=1" \ -d '{"text": "This is a test.", "speaker": "steven", "style": "narration", "encoding": "wav"}' \ > my-audio.wav
- 音頻時序:我們可以為從我們的 API 生成的音頻中找到的句子、單詞和音素提供精確的計時信息。要請求音頻計時,請發出標準請求來生成音頻,但將編碼屬性設置為json 。
-
//音頻時序示例 {"type": "phoneme", "start": null, "end": null, "value": "SIL", "time": 0, "duration": 487} {"type": "word", "start": null, "end": null, "value": "<silence>", "time": 0, "duration": 487} {"type": "phoneme", "start": 0, "end": 5, "value": "HH", "time": 487, "duration": 50} {"type": "phoneme", "start": 0, "end": 5, "value": "EH", "time": 537, "duration": 75} {"type": "phoneme", "start": 0, "end": 5, "value": "L", "time": 612, "duration": 100} {"type": "phoneme", "start": 0, "end": 5, "value": "OW", "time": 712, "duration": 300} {"type": "word", "start": 0, "end": 5, "value": "Hello", "time": 487, "duration": 525} {"type": "phoneme", "start": 7, "end": 10, "value": "AY", "time": 1012, "duration": 125} {"type": "phoneme", "start": 7, "end": 10, "value": "M", "time": 1137, "duration": 100} {"type": "word", "start": 7, "end": 10, "value": "I'm", "time": 1012, "duration": 225} {"type": "phoneme", "start": 11, "end": 14, "value": "B", "time": 1237, "duration": 50} {"type": "phoneme", "start": 11, "end": 14, "value": "AA", "time": 1287, "duration": 350} {"type": "phoneme", "start": 11, "end": 14, "value": "B", "time": 1637, "duration": 125} {"type": "word", "start": 11, "end": 14, "value": "Bob", "time": 1237, "duration": 525} {"type": "phoneme", "start": null, "end": null, "value": "SIL", "time": 1762, "duration": 450} {"type": "word", "start": null, "end": null, "value": "<silence>", "time": 1762, "duration": 450} {"type": "sentence", "start": 0, "end": 15, "value": "Hello, I'm Bob!", "time": 0, "duration": 2212}
5. 處理響應
- 接收響應:解析API響應。響應通常包括狀態碼和響應體。
- 狀態碼:例如,200表示請求成功,400表示請求有誤,500表示服務器錯誤。
- 響應體:響應體的內容根據API的不同操作而異。例如,文本轉語音的響應體可能包含音頻數據或轉換結果的URL。
- 處理數據:根據API文檔的說明,提取和使用響應數據。
6. 錯誤處理
- 識別錯誤:根據響應的狀態碼和錯誤信息(如錯誤代碼、消息等)確定問題的性質。
- 調試:根據API文檔中的錯誤描述,調整請求參數或處理邏輯,解決常見問題(如無效的API密鑰、請求格式錯誤等)。
7. 測試和調試
- 測試工具:使用API測試工具(如Postman)進行請求測試,驗證請求和響應是否按預期工作。
- 調試代碼:在編程語言中,使用調試工具或日志記錄功能,查看請求和響應過程中的詳細信息,幫助診斷問題。
詳情參考:https://www.voicery.com/docs








1. 獲取API密鑰
- 注冊賬戶:訪問Voicery官方網站,完成注冊流程。
- 登錄賬戶:使用您的憑據登錄到Voicery賬戶。
- 獲取API密鑰:進入賬戶設置或API管理頁面,找到并生成您的API密鑰。確保保管好該密鑰,因為它用于身份驗證。
2. 設置請求環境
- HTTP客戶端:選擇一個HTTP客戶端工具,如Postman,或者在您的編程語言中使用HTTP庫(如Python的
requests
、JavaScript的axios
等)。 - 身份驗證:在HTTP請求的頭部中添加身份驗證信息。通常,您需要設置
Authorization
頭部,如下所示:Authorization: Bearer <YOUR_API_KEY>?
3. 構建請求
- 選擇端點:根據Voicery API文檔,確定您要調用的API端點。例如,轉換文本為語音的端點可能是
/text-to-speech
。 - 確定請求方法:根據API文檔選擇HTTP方法(GET、POST、PUT、DELETE等)。大多數文本轉語音的操作會使用POST方法。
- 準備請求體:
- 內容格式:確定請求體的格式(通常為JSON)。例如,文本轉語音請求的體可能包含以下內容:
{ "text": "Hello, world!", "language": "en", "voice": "male" }?
- 字段說明:根據API文檔,配置必需和可選的字段(如
text
、language
、voice
等)。
- 內容格式:確定請求體的格式(通常為JSON)。例如,文本轉語音請求的體可能包含以下內容:
4. 發送請求
- 生成音頻 :要生成音頻,請向/generate端點發出POST請求。
-
curl https://api.voicery.com/generate \ -H "Authorization: Bearer YOUR-API-KEY" \ -H "Content-Type: application/json; version=1" \ -d '{"text": "This is a test.", "speaker": "steven", "style": "narration", "encoding": "wav"}' \ > my-audio.wav
- 音頻時序:我們可以為從我們的 API 生成的音頻中找到的句子、單詞和音素提供精確的計時信息。要請求音頻計時,請發出標準請求來生成音頻,但將編碼屬性設置為json 。
-
//音頻時序示例 {"type": "phoneme", "start": null, "end": null, "value": "SIL", "time": 0, "duration": 487} {"type": "word", "start": null, "end": null, "value": "<silence>", "time": 0, "duration": 487} {"type": "phoneme", "start": 0, "end": 5, "value": "HH", "time": 487, "duration": 50} {"type": "phoneme", "start": 0, "end": 5, "value": "EH", "time": 537, "duration": 75} {"type": "phoneme", "start": 0, "end": 5, "value": "L", "time": 612, "duration": 100} {"type": "phoneme", "start": 0, "end": 5, "value": "OW", "time": 712, "duration": 300} {"type": "word", "start": 0, "end": 5, "value": "Hello", "time": 487, "duration": 525} {"type": "phoneme", "start": 7, "end": 10, "value": "AY", "time": 1012, "duration": 125} {"type": "phoneme", "start": 7, "end": 10, "value": "M", "time": 1137, "duration": 100} {"type": "word", "start": 7, "end": 10, "value": "I'm", "time": 1012, "duration": 225} {"type": "phoneme", "start": 11, "end": 14, "value": "B", "time": 1237, "duration": 50} {"type": "phoneme", "start": 11, "end": 14, "value": "AA", "time": 1287, "duration": 350} {"type": "phoneme", "start": 11, "end": 14, "value": "B", "time": 1637, "duration": 125} {"type": "word", "start": 11, "end": 14, "value": "Bob", "time": 1237, "duration": 525} {"type": "phoneme", "start": null, "end": null, "value": "SIL", "time": 1762, "duration": 450} {"type": "word", "start": null, "end": null, "value": "<silence>", "time": 1762, "duration": 450} {"type": "sentence", "start": 0, "end": 15, "value": "Hello, I'm Bob!", "time": 0, "duration": 2212}
5. 處理響應
- 接收響應:解析API響應。響應通常包括狀態碼和響應體。
- 狀態碼:例如,200表示請求成功,400表示請求有誤,500表示服務器錯誤。
- 響應體:響應體的內容根據API的不同操作而異。例如,文本轉語音的響應體可能包含音頻數據或轉換結果的URL。
- 處理數據:根據API文檔的說明,提取和使用響應數據。
6. 錯誤處理
- 識別錯誤:根據響應的狀態碼和錯誤信息(如錯誤代碼、消息等)確定問題的性質。
- 調試:根據API文檔中的錯誤描述,調整請求參數或處理邏輯,解決常見問題(如無效的API密鑰、請求格式錯誤等)。
7. 測試和調試
- 測試工具:使用API測試工具(如Postman)進行請求測試,驗證請求和響應是否按預期工作。
- 調試代碼:在編程語言中,使用調試工具或日志記錄功能,查看請求和響應過程中的詳細信息,幫助診斷問題。
詳情參考:https://www.voicery.com/docs



