![]() |
Amazon 文本數(shù)據(jù)提取服務(wù)-Textract
專用API
【更新時(shí)間: 2024.06.18】
Amazon Textract是一種機(jī)器學(xué)習(xí)服務(wù),能夠自動(dòng)從掃描的文檔中提取文本、手寫內(nèi)容、布局元素和數(shù)據(jù)。它超越了傳統(tǒng)的光學(xué)字符識別,能夠識別、理解和提取文檔中的特定數(shù)據(jù)。Textract文本提取器支持多種文檔格式。
|
瀏覽次數(shù)
80
采購人數(shù)
0
試用次數(shù)
0
收藏
×
完成
取消
×
書簽名稱
確定
|

- API詳情
- 定價(jià)
- 使用指南
- 常見 FAQ
- 關(guān)于我們
- 相關(guān)推薦


什么是Textract的Amazon 文本數(shù)據(jù)提取服務(wù)?
Amazon Textract 是一種高度先進(jìn)的文本提取器,它使用機(jī)器學(xué)習(xí)技術(shù)從掃描文檔中自動(dòng)提取文本、手寫內(nèi)容、布局元素和數(shù)據(jù)。這項(xiàng)服務(wù)超越了傳統(tǒng)的OCR技術(shù),能夠識別文本、理解和提取文檔中的具體數(shù)據(jù),從而顯著提高了數(shù)據(jù)處理的效率和準(zhǔn)確性。
Textract文本提取器支持多種文檔格式,包括PDF、TIFF、PNG和JPEG,使其成為金融服務(wù)、醫(yī)療保健、公共部門等多個(gè)領(lǐng)域的理想選擇。用戶可以通過AWS管理控制臺、AWS CLI或AWS SDK輕松使用這項(xiàng)服務(wù),快速提取關(guān)鍵業(yè)務(wù)數(shù)據(jù),如金融表格中的抵押貸款利率、申請人姓名和發(fā)票總額。
此外,Textract文本提取器還提供了強(qiáng)大的自定義功能,允許用戶根據(jù)自己的業(yè)務(wù)需求定制預(yù)訓(xùn)練模型,以滿足特定的文檔處理需求。這意味著用戶可以快速自動(dòng)化文檔處理流程,無論是處理貸款還是從發(fā)票和收據(jù)中提取信息,都能夠在幾分鐘內(nèi)完成,而不是之前的幾小時(shí)甚至幾天。
什么是Textract的Amazon 文本數(shù)據(jù)提取服務(wù)接口?
Textract的Amazon 文本數(shù)據(jù)提取服務(wù)有哪些核心功能?
一、文本、手寫和布局元素提取: Amazon Textract能夠從文檔中提取文本、手寫內(nèi)容和布局元素,如段落、標(biāo)題、列表、頁眉、頁腳等 |
![]() |
二、邊界框坐標(biāo)返回 所有提取的數(shù)據(jù)都會(huì)返回邊界框坐標(biāo)(多邊形框架),幫助用戶確定每一段已識別的數(shù)據(jù)在文檔中的具體位置 |
![]() ![]() |
![]() |
三、置信度分?jǐn)?shù) Amazon Textract還為它識別的所有內(nèi)容返回置信度分?jǐn)?shù),以便用戶可以根據(jù)這些分?jǐn)?shù)就如何使用結(jié)果做出明智的決定 |
![]() |
四、自定義查詢 允許用戶自定義預(yù)訓(xùn)練的模型,以提高特定業(yè)務(wù)文檔類型的提取準(zhǔn)確性 |
五、光學(xué)字符識別(OCR) 自動(dòng)從文檔和圖像中檢測并識別打印文本和手寫文本,應(yīng)用OCR提升辦公效率 |
![]() |
六、表格數(shù)據(jù)提取 能夠識別文檔中的表格,并保留表格的結(jié)構(gòu)和其中的數(shù)據(jù)關(guān)聯(lián) |
![]() |
Textract的Amazon 文本數(shù)據(jù)提取服務(wù)的技術(shù)原理是什么?
Textract的Amazon 文本數(shù)據(jù)提取服務(wù)的核心優(yōu)勢是什么?
textract文本提取器不僅僅是OCR,它能識別、理解并提取文檔中的特定數(shù)據(jù),包括表格數(shù)據(jù)提取和簽名檢測 |
![]() |
![]() |
支持多種文檔格式 textract文本提取器支持PDF、TIFF、PNG和JPEG等多種文檔格式,適用于金融服務(wù)、醫(yī)療保健、公共部門等多個(gè)領(lǐng)域 |
易于集成 用戶可以通過AWS管理控制臺、AWS CLI或AWS SDK輕松使用textract文本提取器,快速提取關(guān)鍵業(yè)務(wù)數(shù)據(jù) |
![]() |
![]() |
自定義預(yù)訓(xùn)練模型 textract文本提取器允許用戶自定義預(yù)訓(xùn)練功能,以滿足特定的文檔處理需求。 |
快速處理能力 textract文本提取器可以在幾分鐘內(nèi)提取數(shù)據(jù),而不再需要耗費(fèi)幾小時(shí)甚至幾天的時(shí)間。 |
![]() |
![]() |
數(shù)據(jù)安全與合規(guī) 使用數(shù)據(jù)隱私、加密和合規(guī)性標(biāo)準(zhǔn)安全地自動(dòng)處理數(shù)據(jù)。 |
在哪些場景會(huì)用到Textract的Amazon 文本數(shù)據(jù)提取服務(wù)?
1. 金融服務(wù)
準(zhǔn)確提取有關(guān)金融科技的抵押貸款利率、申請人姓名和發(fā)票總額等各種金融表格的關(guān)鍵業(yè)務(wù)數(shù)據(jù),以在數(shù)分鐘內(nèi)處理貸款和抵押貸款申請。
2. 醫(yī)護(hù)及生命科學(xué)
從健康攝食表單、保險(xiǎn)金申請和預(yù)授權(quán)表單中提取重要患者數(shù)據(jù),結(jié)合醫(yī)療大模型可以更好地為患者和保險(xiǎn)公司服務(wù)。保持?jǐn)?shù)據(jù)在其原始上下文中組織有序,免去對輸出的人工審查。
3. 公共部門
輕松地從政府相關(guān)表格中提取相關(guān)數(shù)據(jù),例如小企業(yè)貸款、聯(lián)邦稅表或商業(yè)申請,具有高度的準(zhǔn)確性。


您按月付費(fèi),計(jì)費(fèi)依據(jù)是您處理的文本的字符數(shù)量。Amazon Polly 的標(biāo)準(zhǔn)語音定價(jià)為:對于超出免費(fèi)套餐的語音或語音標(biāo)記請求,每 100 萬個(gè)字符 4.00 USD。Amazon Polly 的神經(jīng)語音定價(jià)為:對于超出免費(fèi)套餐的語音或請求的語音標(biāo)記,每 100 萬個(gè)字符 16.00 USD。Amazon Polly 的長格式語音定價(jià)為:對于超出免費(fèi)套餐的語音或請求的語音標(biāo)記,每 100 萬個(gè)字符 100.00 USD。 Amazon Polly 的生成式語音定價(jià)為:對于超出免費(fèi)套餐的語音請求,每 100 萬個(gè)字符 30 USD。
對于 Amazon Polly 的標(biāo)準(zhǔn)語音,從您提交第一個(gè) Polly 語音或語音標(biāo)記請求起 12 個(gè)月內(nèi),針對該類請求,免費(fèi)套餐每個(gè)月提供 500 萬個(gè)字符服務(wù)。對于神經(jīng)語音,從您提交第一個(gè)語音或語音標(biāo)記請求起 12 個(gè)月內(nèi),針對該類請求,免費(fèi)套餐每個(gè)月提供 100 萬個(gè)字符服務(wù)。對于長格式語音,從您提交第一個(gè) Polly 語音或語音標(biāo)記請求起 12 個(gè)月內(nèi),針對該類請求,免費(fèi)套餐每個(gè)月提供 50 萬個(gè)字符服務(wù)。 對于生成式語音,從您提交第一個(gè) Polly 語音請求起 12 個(gè)月內(nèi),針對該類請求,免費(fèi)套餐每個(gè)月提供 10 萬字符的服務(wù)。


![]() |
![]() |
![]() |
設(shè)置并登錄您的 AWS 賬戶 | 觀看網(wǎng)絡(luò)研討會(huì)并閱讀文檔。 | 登錄 Polly 控制臺并開始構(gòu)建。 |




AWS 云計(jì)算
Amazon Web Services(AWS)是全球最全面、應(yīng)用最廣泛的云,從全球數(shù)據(jù)中心提供超過 200 項(xiàng)功能齊全的服務(wù)。數(shù)百萬客戶(包括增長最快速的初創(chuàng)公司、最大型企業(yè)和主要的政府機(jī)構(gòu))都在使用 AWS 來降低成本、提高敏捷性并加速創(chuàng)新。
最多的功能
從計(jì)算、存儲(chǔ)和數(shù)據(jù)庫等基礎(chǔ)設(shè)施技術(shù),到機(jī)器學(xué)習(xí)、人工智能、數(shù)據(jù)湖和分析以及物聯(lián)網(wǎng)等新興技術(shù),AWS 提供的服務(wù)以及其中的功能比其他任何云服務(wù)提供商的都要多得多。這使得將現(xiàn)有應(yīng)用程序遷移到云中并構(gòu)建您可以想象的幾乎任何東西都變得更快、更容易且更具成本效益。
AWS 的這些服務(wù)還具有最為多樣復(fù)雜的功能。例如,AWS 提供了種類繁多的數(shù)據(jù)庫,這些數(shù)據(jù)庫是為不同類型的應(yīng)用程序?qū)iT構(gòu)建的,因此您可以選擇適合作業(yè)的工具來獲得最佳的成本和性能。
最大的客戶和合作伙伴社區(qū)
AWS 擁有最大且最具活力的社區(qū),在全球擁有數(shù)百萬活躍客戶和成千上萬個(gè)合作伙伴。幾乎所有行業(yè)和規(guī)模的客戶(包括初創(chuàng)公司、企業(yè)和公共部門組織)都在 AWS 上運(yùn)行所有可能的使用案例。AWS 合作伙伴網(wǎng)絡(luò) (APN) 包括專注于 AWS 服務(wù)的數(shù)千個(gè)系統(tǒng)集成商和成千上萬個(gè)將其技術(shù)應(yīng)用到 AWS 中的獨(dú)立軟件供應(yīng)商 (ISV)。
最安全
AWS 旨在成為當(dāng)今市場上最靈活、最安全的云計(jì)算環(huán)境。我們的核心基礎(chǔ)設(shè)施是為了滿足軍事、全球的銀行和其他高度敏感性組織的安全要求而構(gòu)建。一組深度云安全工具對此提供支持,其中包括超過 300 項(xiàng)安全、合規(guī)性和監(jiān)管服務(wù)及功能,以及對 143 項(xiàng)安全標(biāo)準(zhǔn)和合規(guī)性認(rèn)證的支持。
最快的創(chuàng)新速度
借助 AWS,您可以利用最新技術(shù)更快地進(jìn)行實(shí)驗(yàn)和創(chuàng)新。我們將不斷加快創(chuàng)新步伐,以發(fā)明您可用于轉(zhuǎn)變業(yè)務(wù)的全新技術(shù)。例如,在 2014 年,AWS 通過推出 AWS Lambda 在無服務(wù)器計(jì)算領(lǐng)域開創(chuàng)了先河,該平臺使開發(fā)人員無需預(yù)置或管理服務(wù)器即可運(yùn)行其代碼。AWS 構(gòu)建了 Amazon SageMaker,這是一種完全托管的機(jī)器學(xué)習(xí)服務(wù),可讓日常開發(fā)人員和科學(xué)家無需任何前置經(jīng)驗(yàn)即可運(yùn)用機(jī)器學(xué)習(xí)。
最成熟的運(yùn)營專業(yè)能力
AWS 具有無與倫比的經(jīng)驗(yàn)、成熟度、可靠性、安全性和性能,您可以將其用于最重要的應(yīng)用程序。在超過 17 年的時(shí)間中,AWS 一直在為運(yùn)行各種使用案例的全球數(shù)百萬客戶提供云服務(wù)。在所有云服務(wù)提供商中,AWS 擁有最豐富的大規(guī)模運(yùn)營經(jīng)驗(yàn)。
AWS 區(qū)域的全球網(wǎng)絡(luò)
AWS 擁有覆蓋范圍領(lǐng)先的全球云基礎(chǔ)設(shè)施。Gartner 已將 AWS 區(qū)域/可用區(qū)模型
視為一種值得推薦運(yùn)行方式,適用于要求高可用性的企業(yè)應(yīng)用程序。


您按月付費(fèi),計(jì)費(fèi)依據(jù)是您處理的文本的字符數(shù)量。Amazon Polly 的標(biāo)準(zhǔn)語音定價(jià)為:對于超出免費(fèi)套餐的語音或語音標(biāo)記請求,每 100 萬個(gè)字符 4.00 USD。Amazon Polly 的神經(jīng)語音定價(jià)為:對于超出免費(fèi)套餐的語音或請求的語音標(biāo)記,每 100 萬個(gè)字符 16.00 USD。Amazon Polly 的長格式語音定價(jià)為:對于超出免費(fèi)套餐的語音或請求的語音標(biāo)記,每 100 萬個(gè)字符 100.00 USD。 Amazon Polly 的生成式語音定價(jià)為:對于超出免費(fèi)套餐的語音請求,每 100 萬個(gè)字符 30 USD。
對于 Amazon Polly 的標(biāo)準(zhǔn)語音,從您提交第一個(gè) Polly 語音或語音標(biāo)記請求起 12 個(gè)月內(nèi),針對該類請求,免費(fèi)套餐每個(gè)月提供 500 萬個(gè)字符服務(wù)。對于神經(jīng)語音,從您提交第一個(gè)語音或語音標(biāo)記請求起 12 個(gè)月內(nèi),針對該類請求,免費(fèi)套餐每個(gè)月提供 100 萬個(gè)字符服務(wù)。對于長格式語音,從您提交第一個(gè) Polly 語音或語音標(biāo)記請求起 12 個(gè)月內(nèi),針對該類請求,免費(fèi)套餐每個(gè)月提供 50 萬個(gè)字符服務(wù)。 對于生成式語音,從您提交第一個(gè) Polly 語音請求起 12 個(gè)月內(nèi),針對該類請求,免費(fèi)套餐每個(gè)月提供 10 萬字符的服務(wù)。


![]() |
![]() |
![]() |
設(shè)置并登錄您的 AWS 賬戶 | 觀看網(wǎng)絡(luò)研討會(huì)并閱讀文檔。 | 登錄 Polly 控制臺并開始構(gòu)建。 |






AWS 云計(jì)算
Amazon Web Services(AWS)是全球最全面、應(yīng)用最廣泛的云,從全球數(shù)據(jù)中心提供超過 200 項(xiàng)功能齊全的服務(wù)。數(shù)百萬客戶(包括增長最快速的初創(chuàng)公司、最大型企業(yè)和主要的政府機(jī)構(gòu))都在使用 AWS 來降低成本、提高敏捷性并加速創(chuàng)新。
最多的功能
從計(jì)算、存儲(chǔ)和數(shù)據(jù)庫等基礎(chǔ)設(shè)施技術(shù),到機(jī)器學(xué)習(xí)、人工智能、數(shù)據(jù)湖和分析以及物聯(lián)網(wǎng)等新興技術(shù),AWS 提供的服務(wù)以及其中的功能比其他任何云服務(wù)提供商的都要多得多。這使得將現(xiàn)有應(yīng)用程序遷移到云中并構(gòu)建您可以想象的幾乎任何東西都變得更快、更容易且更具成本效益。
AWS 的這些服務(wù)還具有最為多樣復(fù)雜的功能。例如,AWS 提供了種類繁多的數(shù)據(jù)庫,這些數(shù)據(jù)庫是為不同類型的應(yīng)用程序?qū)iT構(gòu)建的,因此您可以選擇適合作業(yè)的工具來獲得最佳的成本和性能。
最大的客戶和合作伙伴社區(qū)
AWS 擁有最大且最具活力的社區(qū),在全球擁有數(shù)百萬活躍客戶和成千上萬個(gè)合作伙伴。幾乎所有行業(yè)和規(guī)模的客戶(包括初創(chuàng)公司、企業(yè)和公共部門組織)都在 AWS 上運(yùn)行所有可能的使用案例。AWS 合作伙伴網(wǎng)絡(luò) (APN) 包括專注于 AWS 服務(wù)的數(shù)千個(gè)系統(tǒng)集成商和成千上萬個(gè)將其技術(shù)應(yīng)用到 AWS 中的獨(dú)立軟件供應(yīng)商 (ISV)。
最安全
AWS 旨在成為當(dāng)今市場上最靈活、最安全的云計(jì)算環(huán)境。我們的核心基礎(chǔ)設(shè)施是為了滿足軍事、全球的銀行和其他高度敏感性組織的安全要求而構(gòu)建。一組深度云安全工具對此提供支持,其中包括超過 300 項(xiàng)安全、合規(guī)性和監(jiān)管服務(wù)及功能,以及對 143 項(xiàng)安全標(biāo)準(zhǔn)和合規(guī)性認(rèn)證的支持。
最快的創(chuàng)新速度
借助 AWS,您可以利用最新技術(shù)更快地進(jìn)行實(shí)驗(yàn)和創(chuàng)新。我們將不斷加快創(chuàng)新步伐,以發(fā)明您可用于轉(zhuǎn)變業(yè)務(wù)的全新技術(shù)。例如,在 2014 年,AWS 通過推出 AWS Lambda 在無服務(wù)器計(jì)算領(lǐng)域開創(chuàng)了先河,該平臺使開發(fā)人員無需預(yù)置或管理服務(wù)器即可運(yùn)行其代碼。AWS 構(gòu)建了 Amazon SageMaker,這是一種完全托管的機(jī)器學(xué)習(xí)服務(wù),可讓日常開發(fā)人員和科學(xué)家無需任何前置經(jīng)驗(yàn)即可運(yùn)用機(jī)器學(xué)習(xí)。
最成熟的運(yùn)營專業(yè)能力
AWS 具有無與倫比的經(jīng)驗(yàn)、成熟度、可靠性、安全性和性能,您可以將其用于最重要的應(yīng)用程序。在超過 17 年的時(shí)間中,AWS 一直在為運(yùn)行各種使用案例的全球數(shù)百萬客戶提供云服務(wù)。在所有云服務(wù)提供商中,AWS 擁有最豐富的大規(guī)模運(yùn)營經(jīng)驗(yàn)。
AWS 區(qū)域的全球網(wǎng)絡(luò)
AWS 擁有覆蓋范圍領(lǐng)先的全球云基礎(chǔ)設(shè)施。Gartner 已將 AWS 區(qū)域/可用區(qū)模型
視為一種值得推薦運(yùn)行方式,適用于要求高可用性的企業(yè)應(yīng)用程序。

