通義萬相
專用API
【更新時間: 2024.08.12】
通義萬相-文本生成圖像是基于自研的Composer組合生成框架的AI繪畫創(chuàng)作大模型,能夠根據(jù)用戶輸入的文字內(nèi)容,生成符合語義描述的多樣化風(fēng)格的圖像。通過知識重組與可變維度擴散模型,加速收斂并提升最終生成圖片。
|
瀏覽次數(shù)
186
采購人數(shù)
0
試用次數(shù)
1
試用
收藏
×
完成
取消
×
書簽名稱
確定
|
- API詳情
- 定價
- 使用指南
- 常見 FAQ
- 關(guān)于我們
- 相關(guān)推薦


什么是通義萬相?
通義萬相-文本生成圖像是基于自研的Composer組合生成框架的AI繪畫創(chuàng)作大模型,能夠根據(jù)用戶輸入的文字內(nèi)容,生成符合語義描述的多樣化風(fēng)格的圖像。通過知識重組與可變維度擴散模型,加速收斂并提升最終生成圖片的效果,布局自然、細節(jié)豐富、畫面細膩、結(jié)果逼真。AI深度理解中英文文本語義,讓文字秒變精致AI畫作。
什么是通義萬相接口?
通義萬相有哪些核心功能?
-
文本生成圖像:用戶可以輸入文字描述,通義萬相會根據(jù)這些描述生成不同風(fēng)格的創(chuàng)意圖像,如山水畫、古代游船等。用戶還可以對生成的圖像進行點贊、不滿意、生成相似圖、下載原圖和收藏等操作。
-
相似圖像生成:用戶上傳任意圖片后,通義萬相可以進行創(chuàng)意發(fā)散,生成內(nèi)容、風(fēng)格相似的AI畫作。
-
圖像風(fēng)格遷移:用戶上傳原圖和風(fēng)格圖后,通義萬相能夠自動將原圖處理為指定的風(fēng)格圖。
-
應(yīng)用廣場(虛擬模特):在應(yīng)用廣場中,用戶可以上傳圖片并替換模特及背景,創(chuàng)建個性化商品展示圖
通義萬相的核心優(yōu)勢是什么?
-
卓越的性能與可靠性:通義萬相模型服務(wù)以其卓越的性能和穩(wěn)定性著稱,能夠生成高質(zhì)量的圖像,即使在高并發(fā)和大流量環(huán)境下也能保持不低于99%的可用性。
-
簡易的集成與使用體驗:通義萬相模型服務(wù)提供的API接口設(shè)計簡潔明了,極大地簡化了集成過程。即便是缺乏深度技術(shù)知識的用戶,也能夠迅速掌握如何利用通義萬相的能力。
-
多元化應(yīng)用場景拓展:通義萬相模型服務(wù)的多功能性使其成為跨領(lǐng)域的理想選擇。從將抽象概念轉(zhuǎn)化為具體圖像,到個性化涂鴉、人像藝術(shù)化、乃至定制化的人物肖像生成,通義萬相為用戶解鎖了無限創(chuàng)意空間。
-
創(chuàng)新功能愿景:通義萬相展現(xiàn)了強大的創(chuàng)新能力,例如在文生視頻領(lǐng)域,它最出色的特點就是“最聽話”,基本能很好地理解給到的長文本、復(fù)雜提示詞,把想要的關(guān)鍵要素都完整地表達出來
在哪些場景會用到通義萬相?
1. 廣告與營銷物料生成:文生圖能夠即時響應(yīng)廣告文案,生成符合品牌調(diào)性、產(chǎn)品特性和營銷策略的視覺內(nèi)容,節(jié)省了傳統(tǒng)拍攝與后期制作的成本,廣告內(nèi)容根據(jù)實時熱點迅速調(diào)整,實現(xiàn)高度定制化和敏捷營銷。
2. 教育與培訓(xùn)資源制作:教育工作者和培訓(xùn)師利用文生圖模型來創(chuàng)建生動、直觀的教學(xué)素材,有助于提升教學(xué)內(nèi)容的吸引力和理解度,定制化的圖像資源還能用于制作互動課件、電子教科書,豐富教育資源庫。
3. 新聞與媒體內(nèi)容生產(chǎn):新聞機構(gòu)和內(nèi)容平臺采用文生圖技術(shù)來增強報道的視覺呈現(xiàn),即時生成的視覺內(nèi)容不僅能吸引讀者注意力,提高閱讀體驗,還能確保新聞報道的時效性和準(zhǔn)確性。
4. 游戲與娛樂內(nèi)容開發(fā):游戲開發(fā)者借助文生圖大模型來快速生成游戲內(nèi)的角色、道具、環(huán)境元素等美術(shù)資源,用于動態(tài)生成游戲NPC(非玩家角色)外觀或定制化的玩家角色,增加游戲世界的多樣性和沉浸感。


模型服務(wù) |
模型名稱 |
計費單價 |
通義萬相-文本生成圖像 |
wanx-v1 |
0.16元/張 |
通義萬相-人像風(fēng)格重繪 |
wanx-style-repaint-v1 |
0.12元/張 |
通義萬相-圖像背景生成 |
wanx-background-generation-v2 |
0.08元/張 |
通義萬相-涂鴉作畫 |
wanx-sketch-to-image-lite |
0.06元/張 |
通義萬相-Cosplay動漫人物生成 |
wanx-style-cosplay-v1 |
公測,免費額度300張 |
通義萬相-AnyText圖文融合 |
wanx-anytext-v1 |
公測,免費額度300張 |


- 已開通服務(wù)并獲得API-KEY:API-KEY的獲取與配置。
- 已安裝最新版SDK:安裝DashScope SDK。




達摩院成立于2017年10月,致力于探索科技未知,以人類愿景為驅(qū)動力,面向未來開展基礎(chǔ)科學(xué)和創(chuàng)新性技術(shù)研究。希望打通應(yīng)用基礎(chǔ)研究和產(chǎn)業(yè)應(yīng)用,探索技術(shù)產(chǎn)品化、產(chǎn)品市場化的轉(zhuǎn)換路徑。
達摩院在數(shù)字技術(shù)領(lǐng)域取得了一系列技術(shù)突破并實現(xiàn)規(guī)模化應(yīng)用,構(gòu)建了全方位的人工智能基礎(chǔ)能力,推出了業(yè)界領(lǐng)先的通義系列大模型,孵化出平頭哥半導(dǎo)體公司等。接下來,達摩院將繼續(xù)聚焦中長期科學(xué)技術(shù)研究,重點布局人工智能、集成電路等前沿領(lǐng)域。
發(fā)展歷程
- 2023年2月,天眼查App顯示,阿里巴巴達摩院(杭州)科技有限公司發(fā)生工商變更,注冊資本由1000萬人民幣增至3億人民幣,增幅2900%。
- 2023年6月,阿里巴巴達摩院(杭州)科技有限公司的“達摩院開放域自然對話合成算法”備案通過,應(yīng)用于對話生成場景,服務(wù)于智能對話類的企業(yè)端客戶,利用對話意圖理解、對話內(nèi)容生成等技術(shù),通過API提供對話生成功能,備案號為網(wǎng)信算備330110507206401230019號;“達摩院圖像合成算法”備案通過,應(yīng)用于圖像生成場景,服務(wù)于圖像合成類的企業(yè)端客戶,通過API提供文字信息轉(zhuǎn)化為圖像信息的功能,備案號為網(wǎng)信算備330110507206401230027號;“達摩院交互式多能型合成算法”備案通過,應(yīng)用于開放域多模態(tài)內(nèi)容生成場景,服務(wù)于問答、咨詢類的企業(yè)端客戶,通過API提供根據(jù)用戶輸入生成多模態(tài)信息的功能,備案號為網(wǎng)信算備330110507206401230035號。
- 2023年7月,阿里巴巴達摩院(杭州)科技有限公司發(fā)生工商變更,周明卸任法定代表人、執(zhí)行董事兼總經(jīng)理,由張建鋒接任。
- 2023年8月,該公司達摩院語音合成算法、達摩院虛擬試衣合成算法、達摩院人臉融合合成算法備案通過。
- 2024年2月,阿里巴巴達摩院(杭州)科技有限公司的“達摩院服飾上身合成算法”備案通過,應(yīng)用于圖像生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶上傳的服飾參考圖和模特圖,將服飾圖里的服飾融合到模特身上,生成對應(yīng)服飾商品的廣告圖,備案號為網(wǎng)信算備330110507206401240055號。
- 2024年4月,該公司達摩院單圖生成3D合成算法備案通過,主要應(yīng)用于圖像生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶輸入的需要被3D生成的單張單體物體的圖片,生成該物體的任意視角下的圖像,達到利用單張圖像生成3D模型的效果。備案號為網(wǎng)信算備330110507206401240063號。
- 2024年4月,該公司達摩院人物姿態(tài)編輯合成算法備案通過,主要應(yīng)用于圖像生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶輸入的骨架圖和人物圖,生成人物姿態(tài)編輯后的結(jié)果圖像。備案號為網(wǎng)信算備330110507206401240071號。
- 2024年6月,阿里巴巴達摩院(杭州)科技有限公司達摩院人物舞蹈視頻合成算法備案通過,主要功能是應(yīng)用于視頻生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶輸入的人物參考圖和所選的預(yù)設(shè)姿態(tài)序列,生成指定姿態(tài)序列下的人物舞蹈視頻。備案號為330110507206401240089號。


模型服務(wù) |
模型名稱 |
計費單價 |
通義萬相-文本生成圖像 |
wanx-v1 |
0.16元/張 |
通義萬相-人像風(fēng)格重繪 |
wanx-style-repaint-v1 |
0.12元/張 |
通義萬相-圖像背景生成 |
wanx-background-generation-v2 |
0.08元/張 |
通義萬相-涂鴉作畫 |
wanx-sketch-to-image-lite |
0.06元/張 |
通義萬相-Cosplay動漫人物生成 |
wanx-style-cosplay-v1 |
公測,免費額度300張 |
通義萬相-AnyText圖文融合 |
wanx-anytext-v1 |
公測,免費額度300張 |


- 已開通服務(wù)并獲得API-KEY:API-KEY的獲取與配置。
- 已安裝最新版SDK:安裝DashScope SDK。






達摩院成立于2017年10月,致力于探索科技未知,以人類愿景為驅(qū)動力,面向未來開展基礎(chǔ)科學(xué)和創(chuàng)新性技術(shù)研究。希望打通應(yīng)用基礎(chǔ)研究和產(chǎn)業(yè)應(yīng)用,探索技術(shù)產(chǎn)品化、產(chǎn)品市場化的轉(zhuǎn)換路徑。
達摩院在數(shù)字技術(shù)領(lǐng)域取得了一系列技術(shù)突破并實現(xiàn)規(guī)模化應(yīng)用,構(gòu)建了全方位的人工智能基礎(chǔ)能力,推出了業(yè)界領(lǐng)先的通義系列大模型,孵化出平頭哥半導(dǎo)體公司等。接下來,達摩院將繼續(xù)聚焦中長期科學(xué)技術(shù)研究,重點布局人工智能、集成電路等前沿領(lǐng)域。
發(fā)展歷程
- 2023年2月,天眼查App顯示,阿里巴巴達摩院(杭州)科技有限公司發(fā)生工商變更,注冊資本由1000萬人民幣增至3億人民幣,增幅2900%。
- 2023年6月,阿里巴巴達摩院(杭州)科技有限公司的“達摩院開放域自然對話合成算法”備案通過,應(yīng)用于對話生成場景,服務(wù)于智能對話類的企業(yè)端客戶,利用對話意圖理解、對話內(nèi)容生成等技術(shù),通過API提供對話生成功能,備案號為網(wǎng)信算備330110507206401230019號;“達摩院圖像合成算法”備案通過,應(yīng)用于圖像生成場景,服務(wù)于圖像合成類的企業(yè)端客戶,通過API提供文字信息轉(zhuǎn)化為圖像信息的功能,備案號為網(wǎng)信算備330110507206401230027號;“達摩院交互式多能型合成算法”備案通過,應(yīng)用于開放域多模態(tài)內(nèi)容生成場景,服務(wù)于問答、咨詢類的企業(yè)端客戶,通過API提供根據(jù)用戶輸入生成多模態(tài)信息的功能,備案號為網(wǎng)信算備330110507206401230035號。
- 2023年7月,阿里巴巴達摩院(杭州)科技有限公司發(fā)生工商變更,周明卸任法定代表人、執(zhí)行董事兼總經(jīng)理,由張建鋒接任。
- 2023年8月,該公司達摩院語音合成算法、達摩院虛擬試衣合成算法、達摩院人臉融合合成算法備案通過。
- 2024年2月,阿里巴巴達摩院(杭州)科技有限公司的“達摩院服飾上身合成算法”備案通過,應(yīng)用于圖像生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶上傳的服飾參考圖和模特圖,將服飾圖里的服飾融合到模特身上,生成對應(yīng)服飾商品的廣告圖,備案號為網(wǎng)信算備330110507206401240055號。
- 2024年4月,該公司達摩院單圖生成3D合成算法備案通過,主要應(yīng)用于圖像生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶輸入的需要被3D生成的單張單體物體的圖片,生成該物體的任意視角下的圖像,達到利用單張圖像生成3D模型的效果。備案號為網(wǎng)信算備330110507206401240063號。
- 2024年4月,該公司達摩院人物姿態(tài)編輯合成算法備案通過,主要應(yīng)用于圖像生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶輸入的骨架圖和人物圖,生成人物姿態(tài)編輯后的結(jié)果圖像。備案號為網(wǎng)信算備330110507206401240071號。
- 2024年6月,阿里巴巴達摩院(杭州)科技有限公司達摩院人物舞蹈視頻合成算法備案通過,主要功能是應(yīng)用于視頻生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶輸入的人物參考圖和所選的預(yù)設(shè)姿態(tài)序列,生成指定姿態(tài)序列下的人物舞蹈視頻。備案號為330110507206401240089號。


-
朗新科技合作案例: 朗新科技接入百煉大模型服務(wù)平臺后,對通義千問基礎(chǔ)模型能力進行場景基模效果驗證,并進行了電力行業(yè)問答數(shù)據(jù)效果調(diào)優(yōu)、智能問數(shù)場景中NL2SQL模型微調(diào)、plugin階段參數(shù)API處理增強優(yōu)化。通過通義千問電力行業(yè)知識政策問答、電力賬單解讀、數(shù)據(jù)問答等場景中實現(xiàn)更智能化的用戶服務(wù)新模式。
-
阿里云“伙伴千問計劃”: 阿里云發(fā)布了“通義千問伙伴計劃”階段性成果,與朗新、亞信、數(shù)字政通、藍凌、千方等60余家伙伴共同驗證了“通義千問”大模型的30余個行業(yè)應(yīng)用場景,涵蓋協(xié)同辦公、文化旅游、財務(wù)ERP、電力、政務(wù)、醫(yī)保、交通、制造、金融、軟件開發(fā)等行業(yè),涉及智能問答、文章摘要、文案寫作、代碼輔助、知識庫升級等場景。
-
藍凌軟件合作案例: 藍凌軟件對“通義千問”大模型在知識問答場景的應(yīng)用進行了探索。相較于傳統(tǒng)的數(shù)據(jù)收集與訓(xùn)練方法,其訓(xùn)練效率提高了十倍;而在企業(yè)搜索引擎場景中,與傳統(tǒng)詞搜索相比,搜索效率也提高了3倍以上。
-
中國一汽、新東方、長安汽車合作案例: 中國一汽、新東方、長安汽車等也宣布了與通義大模型的合作成果。
-
中國科學(xué)院國家天文臺合作案例: 中國科學(xué)院國家天文臺人工智能組基于通義千問開發(fā)了新一代天文大模型“星語3.0”,這是大模型首次應(yīng)用于天文觀測領(lǐng)域。
-
陜煤建新煤礦合作案例: 陜煤建新煤礦等十余座礦山推出由通義支持的新型礦山重大風(fēng)險識別處置系統(tǒng),成為大模型在礦山場景的首次規(guī)模化落地。