小語種文字識別服務-阿里云市場

小語種文字識別服務-阿里云市場

專用API
【更新時間: 2024.08.02】 阿里云小語種文字識別能夠支持國際主流幾大語系的自動語言分類判定并返回對應語言的文字信息。語言檢測覆蓋十余個國家地區語種,適用于國際化所需的各類圖文識別與信息翻譯場景。
免費 (200次/月) 去服務商官網采購>
瀏覽次數
1.3K
采購人數
1
試用次數
1
! SLA: N/A
! 響應: N/A
! 適用于個人&企業
試用
收藏
×
完成
取消
×
書簽名稱
確定
<
產品介紹
>

什么是阿里云市場的小語種文字識別服務?

阿里云小語種文字識別服務是一種基于阿里云計算平臺的OCR解決方案,旨在處理和識別多種小語種文本。該服務通過先進的機器學習和人工智能技術,對圖片、掃描件和手寫文本等進行高精度的文字識別。其核心技術包括圖像預處理、文字檢測、字符識別和語言模型優化,使其在處理復雜背景、模糊字符和不規則排版時仍能保持高準確率。用戶只需將包含小語種文本的圖片上傳到阿里云平臺,即可快速獲得文本內容,為多語言業務運營提供了便捷的支持。

什么是阿里云市場的小語種文字識別服務接口?

由服務使用方的應用程序發起,以Restful風格為主、通過公網HTTP協議調用阿里云市場的小語種文字識別服務,從而實現程序的自動化交互,提高服務效率。

阿里云市場的小語種文字識別服務有哪些核心功能?

通用多語言識別

讀光通用多語言識別能夠支持國際主流幾大語系的自動語言分類判定并返回對應語言的文字信息。語言檢測覆蓋十余個國家地區語種,適用于國際化所需的各類圖文識別與信息翻譯場景。

英語專項識別

讀光OCR英文專項識別是針對全英文圖片文檔場景下英文印刷體字符高效檢測和識別的原子能力產品,具備英文專項識別和英文分詞功能,支持旋轉、表格、文字坐標等多項基礎功能,全英文文檔字符識別率超過99%。

 

日語識別

讀光OCR日語識別是針對全日文圖片文檔場景下日文印刷體高效檢測和識別的原子能力產品,支持旋轉、表格、文字坐標等多項基礎功能。

俄語識別

讀光OCR俄語識別是針對圖片文檔場景下俄文印刷體高效檢測和識別的原子能力產品,支持旋轉、表格、文字坐標等多項基礎功能。

韓語識別

讀光OCR韓語識別是針對圖片文檔場景下韓文印刷體高效檢測和識別的原子能力產品,支持旋轉、表格、文字坐標等多項基礎功能。

泰語識別

讀光OCR泰語識別是針對泰語圖片文檔場景下泰文印刷體高效檢測和識別的原子能力產品,支持旋轉、表格、文字坐標等多項基礎功能。

拉丁語識別

讀光OCR拉丁語識別是針對拉丁語系的圖片文檔場景下印刷體高效檢測和識別的原子能力產品,支持旋轉、表格、文字坐標等多項基礎功能。可識別英語,德語,西班牙,法語,意大利語,葡萄牙語,馬來西亞語,印尼語,土耳其語,越南語等語種。

 

阿里云市場的小語種文字識別服務的核心優勢是什么?

準確率高
利用海量的圖片樣本訓練模型,具有超高的準確率 

實時性高
依托于阿里自建的EAS在線服務集群,提供彈性伸縮的低延時服務

技術前沿精深
基于阿里云機器學習平臺PAI,訓練出的文本檢測及識別模型

服務穩定
提供彈性服務,擴展性好,算法持續的迭代優化對用戶穩定性無影響

       

在哪些場景會用到阿里云市場的小語種文字識別服務?

信息翻譯
信息翻譯場景下需要支持覆蓋多個語系,讀光OCR支持國際主流幾大語系的自動語言分類判定并返回對應語言的文字信息

能夠解決
適用于國際化所需的各類圖文識別與信息翻譯場景;語言檢測覆蓋十余個國家地區語種

 

商務公關
商務公關場景下需要多語言以及精準快速翻譯響應,讀光OCR支持國際主流幾大語系的自動語言分類判定并及時返回對應語言的文字信息,語言檢測覆蓋十余個國家地區語種

能夠解決
方便商務人員處理多語言場景

教育領域

小語種識別服務在教育領域發揮著重要作用。它輔助語言學習者更好地理解和掌握小語種,提供實時的翻譯和解釋,幫助學生克服語言障礙,提高學習效率。

 

旅游行業

隨著旅游市場的多元化發展,小語種識別服務在旅游行業中變得越來越重要。我們的服務能夠提供詳盡的多語言旅游信息和指南,包括目的地介紹、文化習俗、旅行小貼士等,滿足不同語言背景游客的需求。

<
產品價格
>

產品規格-后付費按次調用

產品規格-預付費資源包

 

<
使用指南
>

案例:

通用多語言識別

接口說明

本接口適用場景

  • 阿里云通用多語言證識別,是阿里云官方自研 OCR 文字識別產品,適用于國際化所需的各類圖文識別與信息翻譯場景。
  • 阿里云 OCR 產品基于阿里巴巴達摩院強大的 AI 技術及海量數據,歷經多年沉淀打磨,具有服務穩定、操作簡易、實時性高、能力全面等幾大優勢。

本接口核心能力

分類 概述
圖像增強 默認支持圖像增強,包括圖像自動旋轉、畸變自動矯正、模糊圖片自動增強等能力。
多類型覆蓋 支持模糊、光照不均、透視畸變、任意背景等低質量圖像識別。
高精度識別 總體識別準確率可達 98%。

如何使用本接口

步驟 概述
1

開通 通用文字識別 服務。開通服務前后,您可以通過體驗館免費體驗本功能識別效果。

 

2 購買小語種識別資源包。本 API 會贈送免費額度,可使用免費額度測試。
3 可以參照調試頁面提供的代碼示例完成 API 接入開發。接入完成后,調用 API 獲取識別結果。如果使用子賬號調用接口,需要阿里云賬號(主賬號)對 RAM 賬號進行授權。創建 RAM 用戶的具體操作,請參考:創建 RAM 用戶。文字識別服務提供一種系統授權策略,即 AliyunOCRFullAccess。具體授權操作,請參見在用戶頁面為 RAM 用戶授權。

重要提示

類型 概述
類型 概述
圖片格式
  • 本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暫不支持 PDF 格式。
圖片尺寸
  • 圖片長寬需要大于 15 像素,小于 8192 像素。
  • 長寬比需要小于 50。
  • 如需達到較好識別效果,建議長寬均大于 500px。
  • 圖片尺寸過小,會影響識別精度。圖片內單字大小在 10-50px 內時,識別效果較好。
圖片大小
  • 圖片二進制文件不能超過 10MB。
  • 圖片過大會影響接口響應速度,建議使用小于 1.5M 圖片進行識別,且通過傳圖片 URL 的方式調用接口。
其他提示
  • 接口響應速度和圖片中的文字數量有關,如果圖片中文字數量越多,接口響應可能越慢。
  • 接口會自動處理反光、扭曲等干擾信息,但會影響精度。請盡量選擇清晰度高、無反光、無扭曲的圖片。
相關能力

示例

正常返回示例

 
 
{
  "RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
  "Data": "{\"content\":\"PACKING  Shipper/Export   Invoice No & Date  STM TECHNOLOGY INC. 20140730- ST44 \",\"height\":1753,\"orgHeight\":1753,\"orgWidth\":1240,\"prism_version\":\"1.0.9\",\"prism_wnum\":71,\"prism_wordsInfo\":[{\"angle\":0,\"direction\":0,\"height\":33,\"pos\":[{\"x\":348,\"y\":137},{\"x\":531,\"y\":135},{\"x\":532,\"y\":168},{\"x\":348,\"y\":170}],\"prob\":99,\"recClassify\":1,\"width\":184,\"word\":\"PACKING\",\"x\":348,\"y\":135}],\"width\":1240}",
  "Code": "200",
  "Message": "message"
}

詳情參考:https://help.aliyun.com/zh/ocr/developer-reference/api-ocr-api-2021-07-07-overview?spm=a2c4g.11186623.0.0.56ef139bT0vzZP#api-overview-94306-1

 

<
關于我們
>
豐富的企業應用,滿足企業經營和數字化所需 安全合規 亞太合規資質最全的云服務商之一,從基礎設施安全、內核平臺安全、系統服務安全、云安全產品四個層面,保障千行百業客戶的業務安全在線。擁有權威認可的原生安全能力,根據2021年Gartner報告,安全能力全球第一。 技術領先 飛天是阿里云自主研發、國內唯一自研的云計算操作系統,編排調度百萬級服務器,單集群調度規模超十萬臺,具備EB級數據存儲能力,并通過CIPU率先實現虛擬化“0”損耗,提供業界領先的計算性能,既滿足客戶嚴苛的業務要求,又提供高性價比服務。
聯系信息
服務時間: 7*24
電話號碼: 86 571 8502 2600

<
最可能同場景使用的其他API
>
API接口列表
<
產品價格
>

產品規格-后付費按次調用

產品規格-預付費資源包

 

<
使用指南
>

案例:

通用多語言識別

接口說明

本接口適用場景

  • 阿里云通用多語言證識別,是阿里云官方自研 OCR 文字識別產品,適用于國際化所需的各類圖文識別與信息翻譯場景。
  • 阿里云 OCR 產品基于阿里巴巴達摩院強大的 AI 技術及海量數據,歷經多年沉淀打磨,具有服務穩定、操作簡易、實時性高、能力全面等幾大優勢。

本接口核心能力

分類 概述
圖像增強 默認支持圖像增強,包括圖像自動旋轉、畸變自動矯正、模糊圖片自動增強等能力。
多類型覆蓋 支持模糊、光照不均、透視畸變、任意背景等低質量圖像識別。
高精度識別 總體識別準確率可達 98%。

如何使用本接口

步驟 概述
1

開通 通用文字識別 服務。開通服務前后,您可以通過體驗館免費體驗本功能識別效果。

 

2 購買小語種識別資源包。本 API 會贈送免費額度,可使用免費額度測試。
3 可以參照調試頁面提供的代碼示例完成 API 接入開發。接入完成后,調用 API 獲取識別結果。如果使用子賬號調用接口,需要阿里云賬號(主賬號)對 RAM 賬號進行授權。創建 RAM 用戶的具體操作,請參考:創建 RAM 用戶。文字識別服務提供一種系統授權策略,即 AliyunOCRFullAccess。具體授權操作,請參見在用戶頁面為 RAM 用戶授權。

重要提示

類型 概述
類型 概述
圖片格式
  • 本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暫不支持 PDF 格式。
圖片尺寸
  • 圖片長寬需要大于 15 像素,小于 8192 像素。
  • 長寬比需要小于 50。
  • 如需達到較好識別效果,建議長寬均大于 500px。
  • 圖片尺寸過小,會影響識別精度。圖片內單字大小在 10-50px 內時,識別效果較好。
圖片大小
  • 圖片二進制文件不能超過 10MB。
  • 圖片過大會影響接口響應速度,建議使用小于 1.5M 圖片進行識別,且通過傳圖片 URL 的方式調用接口。
其他提示
  • 接口響應速度和圖片中的文字數量有關,如果圖片中文字數量越多,接口響應可能越慢。
  • 接口會自動處理反光、扭曲等干擾信息,但會影響精度。請盡量選擇清晰度高、無反光、無扭曲的圖片。
相關能力

示例

正常返回示例

 
 
{
  "RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
  "Data": "{\"content\":\"PACKING  Shipper/Export   Invoice No & Date  STM TECHNOLOGY INC. 20140730- ST44 \",\"height\":1753,\"orgHeight\":1753,\"orgWidth\":1240,\"prism_version\":\"1.0.9\",\"prism_wnum\":71,\"prism_wordsInfo\":[{\"angle\":0,\"direction\":0,\"height\":33,\"pos\":[{\"x\":348,\"y\":137},{\"x\":531,\"y\":135},{\"x\":532,\"y\":168},{\"x\":348,\"y\":170}],\"prob\":99,\"recClassify\":1,\"width\":184,\"word\":\"PACKING\",\"x\":348,\"y\":135}],\"width\":1240}",
  "Code": "200",
  "Message": "message"
}

詳情參考:https://help.aliyun.com/zh/ocr/developer-reference/api-ocr-api-2021-07-07-overview?spm=a2c4g.11186623.0.0.56ef139bT0vzZP#api-overview-94306-1

 

<
依賴服務
>
<
關于我們
>
豐富的企業應用,滿足企業經營和數字化所需 安全合規 亞太合規資質最全的云服務商之一,從基礎設施安全、內核平臺安全、系統服務安全、云安全產品四個層面,保障千行百業客戶的業務安全在線。擁有權威認可的原生安全能力,根據2021年Gartner報告,安全能力全球第一。 技術領先 飛天是阿里云自主研發、國內唯一自研的云計算操作系統,編排調度百萬級服務器,單集群調度規模超十萬臺,具備EB級數據存儲能力,并通過CIPU率先實現虛擬化“0”損耗,提供業界領先的計算性能,既滿足客戶嚴苛的業務要求,又提供高性價比服務。
聯系信息
服務時間: 7*24
電話號碼: 86 571 8502 2600

<
最可能同場景使用的其他API
>