![]() |
AI 語(yǔ)音轉(zhuǎn)文本服務(wù)-Speechmatics
專用API
【更新時(shí)間: 2024.08.07】
Speechmatics AI 語(yǔ)音生成器,融合了精準(zhǔn)的語(yǔ)音識(shí)別技術(shù)與前沿的人工智能及大型語(yǔ)言模型(LLM)。通過(guò)API接口,它能夠處理50種語(yǔ)言的轉(zhuǎn)錄、翻譯和語(yǔ)義理解,為多語(yǔ)言環(huán)境提供強(qiáng)大支持。
|
瀏覽次數(shù)
129
采購(gòu)人數(shù)
7
試用次數(shù)
2
試用
收藏
×
完成
取消
×
書(shū)簽名稱
確定
|
- API詳情
- 定價(jià)
- 使用指南
- 常見(jiàn) FAQ
- 關(guān)于我們
- 相關(guān)推薦


什么是Speechmatics的AI 語(yǔ)音轉(zhuǎn)文本服務(wù)?
Speechmatics AI 語(yǔ)音生成器是將準(zhǔn)確的語(yǔ)音識(shí)別與最新的 AI 和 LLM 技術(shù)相結(jié)合,所有這些都通過(guò)一個(gè) API 實(shí)現(xiàn)。支持 50 種語(yǔ)言的轉(zhuǎn)錄、翻譯和理解,使用最準(zhǔn)確、最全面的語(yǔ)音 API 為您的應(yīng)用程序提供支持。專為 50 多種語(yǔ)言的實(shí)時(shí)轉(zhuǎn)錄和翻譯而打造。我們的尖端語(yǔ)音技術(shù)由語(yǔ)音 AI 領(lǐng)域的先驅(qū)者開(kāi)發(fā),確保您能夠以最佳方式進(jìn)行構(gòu)建。
什么是Speechmatics的AI 語(yǔ)音轉(zhuǎn)文本服務(wù)接口?
Speechmatics的AI 語(yǔ)音轉(zhuǎn)文本服務(wù)有哪些核心功能?
- 高精度轉(zhuǎn)錄:提供無(wú)與倫比的轉(zhuǎn)錄準(zhǔn)確性,無(wú)論是實(shí)時(shí)轉(zhuǎn)錄還是批處理模式,都能確保最佳性能和快速轉(zhuǎn)錄,支持自定義詞典、說(shuō)話者和頻道分類、數(shù)字格式識(shí)別等功能,以進(jìn)一步提高轉(zhuǎn)錄精度。
- 靈活部署:支持本地和云兩種部署方式。用戶可以根據(jù)自己的需求在本地環(huán)境中托管API,或者通過(guò)云部署獲得安全且可擴(kuò)展的訪問(wèn),提供Docker容器或預(yù)配置的虛擬設(shè)備,方便用戶在自己的架構(gòu)、安全性和合規(guī)性需求下部署。
- 多語(yǔ)言支持:支持50種語(yǔ)言,涵蓋大多數(shù)母語(yǔ),并具備處理各種方言和口音的能力,提供翻譯功能,可以將音頻轉(zhuǎn)錄并翻譯為超過(guò)30種語(yǔ)言,或進(jìn)行英語(yǔ)之間的互譯,自動(dòng)檢測(cè)所說(shuō)的語(yǔ)言,確保準(zhǔn)確的轉(zhuǎn)錄。
- 高級(jí)功能:提供置信度分?jǐn)?shù)、單詞計(jì)時(shí)、高級(jí)標(biāo)點(diǎn)符號(hào)和大小寫(xiě)等功能,幫助用戶進(jìn)行高效的后期處理和編輯,支持音頻事件識(shí)別,如自動(dòng)檢測(cè)和標(biāo)記媒體中的非語(yǔ)音聲音,提高可訪問(wèn)性并自動(dòng)化字幕制作。
- 行業(yè)優(yōu)化:提供針對(duì)行業(yè)優(yōu)化的英語(yǔ)語(yǔ)言包,包含特定行業(yè)的術(shù)語(yǔ),如財(cái)務(wù)等,并計(jì)劃推出更多行業(yè)語(yǔ)言包。
- AI支持功能:結(jié)合精準(zhǔn)的轉(zhuǎn)錄與語(yǔ)音功能,提供如翻譯、摘要、情緒分析、主題識(shí)別和章節(jié)劃分等高級(jí)AI功能,摘要功能自動(dòng)生成視頻或社交媒體平臺(tái)的摘要,方便觀眾快速了解內(nèi)容,情緒分析功能幫助了解客戶對(duì)服務(wù)的感受,主題和章節(jié)功能提供討論的主題和時(shí)間戳,提升觀眾參與度。
Speechmatics的AI 語(yǔ)音轉(zhuǎn)文本服務(wù)的核心優(yōu)勢(shì)是什么?
|
|
單一、統(tǒng)一的API |
|
自動(dòng)語(yǔ)言識(shí)別 無(wú)需設(shè)置預(yù)期語(yǔ)言(盡管如果您愿意也可以設(shè)置)Speechmatics將自動(dòng)識(shí)別輸入語(yǔ)言以確保最高的準(zhǔn)確性。 |
|
自定義詞典 準(zhǔn)確捕捉最專業(yè)的詞匯 - 公司名稱行業(yè)術(shù)語(yǔ)、俚語(yǔ)等等。使用自定義詞典您絕對(duì)不會(huì)錯(cuò)過(guò)任何一個(gè)單詞。 |
|
![]() |
直播。即時(shí)。實(shí)時(shí) |
無(wú)與倫比的精度 即使在充滿挑戰(zhàn)的環(huán)境中我們?yōu)楦鞣N聲音提供了前所未有的性能,并在現(xiàn)實(shí)世界和暗雜的環(huán)境中進(jìn)行了壓力測(cè)試.因此您始終可以信賴我們的輸出。 |
|
![]() |
尋找新受眾 |
在哪些場(chǎng)景會(huì)用到Speechmatics的AI 語(yǔ)音轉(zhuǎn)文本服務(wù)?
- Red Bee 讓每個(gè)人都能參與體育運(yùn)動(dòng):Red Bee 幫助英國(guó)第四頻道成為第一家播放完全無(wú)障礙殘奧會(huì)的廣播公司。
-
視頻團(tuán)隊(duì)的工作空間:Red Bee 幫助英國(guó)第四頻道成為第一家播放完全無(wú)障礙殘奧會(huì)的廣播公司。
- 利用語(yǔ)音識(shí)別進(jìn)行實(shí)時(shí)字幕廣播:Red Bee 幫助英國(guó)第四頻道成為第一家播放完全無(wú)障礙殘奧會(huì)的廣播公司。




Speechmatics 為轉(zhuǎn)錄提供了兩個(gè)操作點(diǎn):
- 增強(qiáng)——針對(duì)盡可能高的準(zhǔn)確度進(jìn)行了優(yōu)化。
- 標(biāo)準(zhǔn) - (默認(rèn))針對(duì)快速批量周轉(zhuǎn)時(shí)間進(jìn)行了優(yōu)化。
請(qǐng)注意,實(shí)時(shí)轉(zhuǎn)錄時(shí),標(biāo)準(zhǔn)和增強(qiáng)操作點(diǎn)的延遲都由此處max_delay
描述的配置選項(xiàng)控制。
請(qǐng)注意,您選擇的操作點(diǎn)將影響定價(jià)以及本地客戶的處理成本效率。
{
"type": "transcription",
"transcription_config": {
"language": "en",
"operating_point": "enhanced"
}
}
輸出區(qū)域
僅對(duì)于英語(yǔ)語(yǔ)言包,可以根據(jù)output_locale
配置設(shè)置指定生成轉(zhuǎn)錄時(shí)要使用的拼寫(xiě)規(guī)則。
可用的三種英語(yǔ)區(qū)域設(shè)置是:
- 英式英語(yǔ) (en-GB)
- 美國(guó)英語(yǔ) (en-US)
- 澳大利亞英語(yǔ) (en-AU)
用英語(yǔ)轉(zhuǎn)錄時(shí),建議指定語(yǔ)言環(huán)境。如果沒(méi)有指定語(yǔ)言環(huán)境,轉(zhuǎn)錄中的拼寫(xiě)可能會(huì)不一致。
以下區(qū)域支持中文普通話:
- 簡(jiǎn)體普通話 (cmn-Hans)
- 繁體普通話 (cmn-Hant)
默認(rèn)是簡(jiǎn)體普通話。
示例配置請(qǐng)求如下:
{
"type": "transcription",
"transcription_config": {
"language": "en",
"output_locale": "en-GB"
}
}
域名語(yǔ)言優(yōu)化
一些 Speechmatics 語(yǔ)言包針對(duì)特定領(lǐng)域進(jìn)行了優(yōu)化,這些領(lǐng)域需要對(duì)特定詞匯和術(shù)語(yǔ)具有高精度。使用域參數(shù)可提供額外的轉(zhuǎn)錄準(zhǔn)確性。以下示例顯示了雙語(yǔ)西班牙語(yǔ)和英語(yǔ)模型的使用:
{
"type": "transcription",
"transcription_config": {
"language": "es",
"domain": "bilingual-en"
}
}
預(yù)計(jì)雖然特定領(lǐng)域會(huì)有所改進(jìn),但該領(lǐng)域之外的其他領(lǐng)域的準(zhǔn)確性可能會(huì)下降。




我們的目標(biāo)是理解每一個(gè)聲音
在 Speechmatics,我們創(chuàng)建了有史以來(lái)最全面、最準(zhǔn)確的語(yǔ)音 API。我們通過(guò)為企業(yè)提供 AI 時(shí)代的基礎(chǔ)語(yǔ)音技術(shù)來(lái)改變企業(yè)的工作方式。
我們的故事
Speechmatics 的故事始于 20 世紀(jì) 80 年代,當(dāng)時(shí)創(chuàng)始人托尼·羅賓遜博士在劍橋大學(xué)率先采用神經(jīng)網(wǎng)絡(luò)方法解決語(yǔ)音識(shí)別問(wèn)題。
我們的價(jià)值
我們的價(jià)值觀指導(dǎo)著我們?cè)谶@里所做的一切。僅僅取得偉大的成就是不夠的-我們的價(jià)值觀讓我們知道我們?cè)谝哉_的方式做事,
深切關(guān)懷 我們的目標(biāo)是“理解每一個(gè)聲音”。這種想法 不僅僅延伸到我們的技術(shù)。我們非常關(guān)心我 們的客戶,尤其是當(dāng)涉及到我們的行為對(duì)世 界的影響時(shí)。 |
以人為本 我們信奉以人為本的理念。我們想要的不只 是最好的團(tuán)隊(duì),我們想要最合適的人。當(dāng)您 成為我們團(tuán)隊(duì)的一員時(shí),我們將竭盡所能幫 助您發(fā)展技能。 |
有雄心壯志 要想在行業(yè)內(nèi)做出積極的改變,就需要采取 大膽、有遠(yuǎn)見(jiàn)的行動(dòng)。這就是我們相信遠(yuǎn)大 目標(biāo)的原因。我們的結(jié)果表明,雖然改變從 來(lái)都不容易,但總是值得的。 |
快速移動(dòng) 我們相信在復(fù)雜和簡(jiǎn)單之間找到完美的平 衡。當(dāng)你成為像我們這樣的協(xié)作團(tuán)隊(duì)的一員 時(shí),你可以自由地快速失敗并繼續(xù)前進(jìn)。 |




Speechmatics 為轉(zhuǎn)錄提供了兩個(gè)操作點(diǎn):
- 增強(qiáng)——針對(duì)盡可能高的準(zhǔn)確度進(jìn)行了優(yōu)化。
- 標(biāo)準(zhǔn) - (默認(rèn))針對(duì)快速批量周轉(zhuǎn)時(shí)間進(jìn)行了優(yōu)化。
請(qǐng)注意,實(shí)時(shí)轉(zhuǎn)錄時(shí),標(biāo)準(zhǔn)和增強(qiáng)操作點(diǎn)的延遲都由此處max_delay
描述的配置選項(xiàng)控制。
請(qǐng)注意,您選擇的操作點(diǎn)將影響定價(jià)以及本地客戶的處理成本效率。
{
"type": "transcription",
"transcription_config": {
"language": "en",
"operating_point": "enhanced"
}
}
輸出區(qū)域
僅對(duì)于英語(yǔ)語(yǔ)言包,可以根據(jù)output_locale
配置設(shè)置指定生成轉(zhuǎn)錄時(shí)要使用的拼寫(xiě)規(guī)則。
可用的三種英語(yǔ)區(qū)域設(shè)置是:
- 英式英語(yǔ) (en-GB)
- 美國(guó)英語(yǔ) (en-US)
- 澳大利亞英語(yǔ) (en-AU)
用英語(yǔ)轉(zhuǎn)錄時(shí),建議指定語(yǔ)言環(huán)境。如果沒(méi)有指定語(yǔ)言環(huán)境,轉(zhuǎn)錄中的拼寫(xiě)可能會(huì)不一致。
以下區(qū)域支持中文普通話:
- 簡(jiǎn)體普通話 (cmn-Hans)
- 繁體普通話 (cmn-Hant)
默認(rèn)是簡(jiǎn)體普通話。
示例配置請(qǐng)求如下:
{
"type": "transcription",
"transcription_config": {
"language": "en",
"output_locale": "en-GB"
}
}
域名語(yǔ)言優(yōu)化
一些 Speechmatics 語(yǔ)言包針對(duì)特定領(lǐng)域進(jìn)行了優(yōu)化,這些領(lǐng)域需要對(duì)特定詞匯和術(shù)語(yǔ)具有高精度。使用域參數(shù)可提供額外的轉(zhuǎn)錄準(zhǔn)確性。以下示例顯示了雙語(yǔ)西班牙語(yǔ)和英語(yǔ)模型的使用:
{
"type": "transcription",
"transcription_config": {
"language": "es",
"domain": "bilingual-en"
}
}
預(yù)計(jì)雖然特定領(lǐng)域會(huì)有所改進(jìn),但該領(lǐng)域之外的其他領(lǐng)域的準(zhǔn)確性可能會(huì)下降。






我們的目標(biāo)是理解每一個(gè)聲音
在 Speechmatics,我們創(chuàng)建了有史以來(lái)最全面、最準(zhǔn)確的語(yǔ)音 API。我們通過(guò)為企業(yè)提供 AI 時(shí)代的基礎(chǔ)語(yǔ)音技術(shù)來(lái)改變企業(yè)的工作方式。
我們的故事
Speechmatics 的故事始于 20 世紀(jì) 80 年代,當(dāng)時(shí)創(chuàng)始人托尼·羅賓遜博士在劍橋大學(xué)率先采用神經(jīng)網(wǎng)絡(luò)方法解決語(yǔ)音識(shí)別問(wèn)題。
我們的價(jià)值
我們的價(jià)值觀指導(dǎo)著我們?cè)谶@里所做的一切。僅僅取得偉大的成就是不夠的-我們的價(jià)值觀讓我們知道我們?cè)谝哉_的方式做事,
深切關(guān)懷 我們的目標(biāo)是“理解每一個(gè)聲音”。這種想法 不僅僅延伸到我們的技術(shù)。我們非常關(guān)心我 們的客戶,尤其是當(dāng)涉及到我們的行為對(duì)世 界的影響時(shí)。 |
以人為本 我們信奉以人為本的理念。我們想要的不只 是最好的團(tuán)隊(duì),我們想要最合適的人。當(dāng)您 成為我們團(tuán)隊(duì)的一員時(shí),我們將竭盡所能幫 助您發(fā)展技能。 |
有雄心壯志 要想在行業(yè)內(nèi)做出積極的改變,就需要采取 大膽、有遠(yuǎn)見(jiàn)的行動(dòng)。這就是我們相信遠(yuǎn)大 目標(biāo)的原因。我們的結(jié)果表明,雖然改變從 來(lái)都不容易,但總是值得的。 |
快速移動(dòng) 我們相信在復(fù)雜和簡(jiǎn)單之間找到完美的平 衡。當(dāng)你成為像我們這樣的協(xié)作團(tuán)隊(duì)的一員 時(shí),你可以自由地快速失敗并繼續(xù)前進(jìn)。 |