通義萬相

通義萬相

專用API
【更新時間: 2024.08.12】 通義萬相-文本生成圖像是基于自研的Composer組合生成框架的AI繪畫創(chuàng)作大模型,能夠根據(jù)用戶輸入的文字內(nèi)容,生成符合語義描述的多樣化風(fēng)格的圖像。通過知識重組與可變維度擴散模型,加速收斂并提升最終生成圖片。
瀏覽次數(shù)
186
采購人數(shù)
0
試用次數(shù)
1
! SLA: N/A
! 響應(yīng): N/A
! 適用于個人&企業(yè)
試用
收藏
×
完成
取消
×
書簽名稱
確定
<
產(chǎn)品介紹
>

什么是通義萬相?

通義萬相-文本生成圖像是基于自研的Composer組合生成框架的AI繪畫創(chuàng)作大模型,能夠根據(jù)用戶輸入的文字內(nèi)容,生成符合語義描述的多樣化風(fēng)格的圖像。通過知識重組與可變維度擴散模型,加速收斂并提升最終生成圖片的效果,布局自然、細節(jié)豐富、畫面細膩、結(jié)果逼真。AI深度理解中英文文本語義,讓文字秒變精致AI畫作。

 

什么是通義萬相接口?

由服務(wù)使用方的應(yīng)用程序發(fā)起,以Restful風(fēng)格為主、通過公網(wǎng)HTTP協(xié)議調(diào)用通義萬相,從而實現(xiàn)程序的自動化交互,提高服務(wù)效率。

通義萬相有哪些核心功能?

  1. 文本生成圖像:用戶可以輸入文字描述,通義萬相會根據(jù)這些描述生成不同風(fēng)格的創(chuàng)意圖像,如山水畫、古代游船等。用戶還可以對生成的圖像進行點贊、不滿意、生成相似圖、下載原圖和收藏等操作。

  2. 相似圖像生成:用戶上傳任意圖片后,通義萬相可以進行創(chuàng)意發(fā)散,生成內(nèi)容、風(fēng)格相似的AI畫作。

  3. 圖像風(fēng)格遷移:用戶上傳原圖和風(fēng)格圖后,通義萬相能夠自動將原圖處理為指定的風(fēng)格圖。

  4. 應(yīng)用廣場(虛擬模特):在應(yīng)用廣場中,用戶可以上傳圖片并替換模特及背景,創(chuàng)建個性化商品展示圖

通義萬相的核心優(yōu)勢是什么?

  1. 卓越的性能與可靠性:通義萬相模型服務(wù)以其卓越的性能和穩(wěn)定性著稱,能夠生成高質(zhì)量的圖像,即使在高并發(fā)和大流量環(huán)境下也能保持不低于99%的可用性。

  2. 簡易的集成與使用體驗:通義萬相模型服務(wù)提供的API接口設(shè)計簡潔明了,極大地簡化了集成過程。即便是缺乏深度技術(shù)知識的用戶,也能夠迅速掌握如何利用通義萬相的能力。

  3. 多元化應(yīng)用場景拓展:通義萬相模型服務(wù)的多功能性使其成為跨領(lǐng)域的理想選擇。從將抽象概念轉(zhuǎn)化為具體圖像,到個性化涂鴉、人像藝術(shù)化、乃至定制化的人物肖像生成,通義萬相為用戶解鎖了無限創(chuàng)意空間。

  4. 創(chuàng)新功能愿景:通義萬相展現(xiàn)了強大的創(chuàng)新能力,例如在文生視頻領(lǐng)域,它最出色的特點就是“最聽話”,基本能很好地理解給到的長文本、復(fù)雜提示詞,把想要的關(guān)鍵要素都完整地表達出來

在哪些場景會用到通義萬相?

1. 廣告與營銷物料生成:文生圖能夠即時響應(yīng)廣告文案,生成符合品牌調(diào)性、產(chǎn)品特性和營銷策略的視覺內(nèi)容,節(jié)省了傳統(tǒng)拍攝與后期制作的成本,廣告內(nèi)容根據(jù)實時熱點迅速調(diào)整,實現(xiàn)高度定制化和敏捷營銷。

2. 教育與培訓(xùn)資源制作:教育工作者和培訓(xùn)師利用文生圖模型來創(chuàng)建生動、直觀的教學(xué)素材,有助于提升教學(xué)內(nèi)容的吸引力和理解度,定制化的圖像資源還能用于制作互動課件、電子教科書,豐富教育資源庫。

3. 新聞與媒體內(nèi)容生產(chǎn):新聞機構(gòu)和內(nèi)容平臺采用文生圖技術(shù)來增強報道的視覺呈現(xiàn),即時生成的視覺內(nèi)容不僅能吸引讀者注意力,提高閱讀體驗,還能確保新聞報道的時效性和準(zhǔn)確性。

4. 游戲與娛樂內(nèi)容開發(fā):游戲開發(fā)者借助文生圖大模型來快速生成游戲內(nèi)的角色、道具、環(huán)境元素等美術(shù)資源,用于動態(tài)生成游戲NPC(非玩家角色)外觀或定制化的玩家角色,增加游戲世界的多樣性和沉浸感。

<
產(chǎn)品價格
>

模型服務(wù)

模型名稱

計費單價

通義萬相-文本生成圖像

wanx-v1

0.16元/張

通義萬相-人像風(fēng)格重繪

wanx-style-repaint-v1

0.12元/張

通義萬相-圖像背景生成

wanx-background-generation-v2

0.08元/張

通義萬相-涂鴉作畫

wanx-sketch-to-image-lite

0.06元/張

通義萬相-Cosplay動漫人物生成

wanx-style-cosplay-v1

公測,免費額度300張

通義萬相-AnyText圖文融合

wanx-anytext-v1

公測,免費額度300張

<
使用指南
>
<
產(chǎn)品問答
>
?
通義萬相的圖像生成質(zhì)量如何?
通義萬相的圖像生成質(zhì)量非常高,可以達到與真實圖像相媲美的水平。模型具有強大的語義理解能力,能夠根據(jù)用戶輸入的文本提示生成符合用戶意圖的圖像
?
使用通義萬相時遇到API調(diào)用報錯怎么辦?
確認(rèn)API密鑰和訪問權(quán)限配置正確,檢查網(wǎng)絡(luò)連接是否穩(wěn)定,并參考官方文檔和示例代碼,確保調(diào)用參數(shù)和方法正確。
?
資源部署失敗應(yīng)如何解決?
確認(rèn)云資源配置符合要求,如VPC、ECS和OSS等,查看部署日志和錯誤信息,定位問題原因并參考文檔解決。
?
通義萬相服務(wù)響應(yīng)慢有什么解決方案?
檢查網(wǎng)絡(luò)連接和服務(wù)器負(fù)載情況,優(yōu)化API調(diào)用參數(shù),或聯(lián)系阿里云技術(shù)支持尋求幫助。
?
通義萬相有哪些技術(shù)優(yōu)勢?
穩(wěn)定性與高可用性:通義萬相保證了高并發(fā)下的穩(wěn)定響應(yīng),可用性達到99%以上。 API友好接入:提供了標(biāo)準(zhǔn)化的HTTP API,使開發(fā)人員能夠輕松集成AI繪畫功能。 知識重組&可變維擴散模型:基于自研的Composer組合生成框架的AI繪畫創(chuàng)作大模型,通過知識重組與可變維度擴散模型,生成符合語義描述的多樣化風(fēng)格的圖像。
?
通義萬相是否支持視頻生成?
是的,通義萬相在2024年9月19日發(fā)布了全新視頻生成模型,支持文生視頻和圖生視頻,最長能夠生成5秒的視頻,每秒30幀,分辨率為720P
?
通義萬相的用戶體驗如何?
應(yīng)用程序的用戶界面設(shè)計簡潔明了,易于上手。但是,生成后的作品缺少直接的對比和編輯功能,對于追求完美作品的用戶來說,這可能是個需要改進的地方
?
通義萬相在AI繪畫領(lǐng)域的表現(xiàn)如何?
通義萬相在AI繪畫領(lǐng)域展現(xiàn)了高度創(chuàng)新,多樣化的創(chuàng)作工具和靈活的輸出選項值得稱贊。
<
關(guān)于我們
>
通義千問是由阿里云自主研發(fā)的大語言模型,用于理解和分析用戶輸入的自然語言,在不同領(lǐng)域和任務(wù)為用戶提供服務(wù)和幫助。您可以通過提供盡可能清晰詳細的指令,來獲取符合您預(yù)期的結(jié)果。通義聽悟API服務(wù),在語音識別、翻譯和發(fā)言人識別的基礎(chǔ)上,提煉全文摘要、章節(jié)速覽、發(fā)言總結(jié)、待辦事項、PPT、問答、關(guān)鍵詞等內(nèi)容,對人與人交流的音視頻進行分析與精簡,幫助使用者快速了解音視頻主要內(nèi)容。
聯(lián)系信息
服務(wù)時間: 00:00--24:00
電話號碼: 86 571 8502 2600
郵箱: tingwu_contact@service.alibaba.com

達摩院成立于2017年10月,致力于探索科技未知,以人類愿景為驅(qū)動力,面向未來開展基礎(chǔ)科學(xué)和創(chuàng)新性技術(shù)研究。希望打通應(yīng)用基礎(chǔ)研究和產(chǎn)業(yè)應(yīng)用,探索技術(shù)產(chǎn)品化、產(chǎn)品市場化的轉(zhuǎn)換路徑。

 

達摩院在數(shù)字技術(shù)領(lǐng)域取得了一系列技術(shù)突破并實現(xiàn)規(guī)模化應(yīng)用,構(gòu)建了全方位的人工智能基礎(chǔ)能力,推出了業(yè)界領(lǐng)先的通義系列大模型,孵化出平頭哥半導(dǎo)體公司等。接下來,達摩院將繼續(xù)聚焦中長期科學(xué)技術(shù)研究,重點布局人工智能、集成電路等前沿領(lǐng)域。

 

 

發(fā)展歷程

  • 2023年2月,天眼查App顯示,阿里巴巴達摩院(杭州)科技有限公司發(fā)生工商變更,注冊資本由1000萬人民幣增至3億人民幣,增幅2900%。
  • 2023年6月,阿里巴巴達摩院(杭州)科技有限公司的“達摩院開放域自然對話合成算法”備案通過,應(yīng)用于對話生成場景,服務(wù)于智能對話類的企業(yè)端客戶,利用對話意圖理解、對話內(nèi)容生成等技術(shù),通過API提供對話生成功能,備案號為網(wǎng)信算備330110507206401230019號;“達摩院圖像合成算法”備案通過,應(yīng)用于圖像生成場景,服務(wù)于圖像合成類的企業(yè)端客戶,通過API提供文字信息轉(zhuǎn)化為圖像信息的功能,備案號為網(wǎng)信算備330110507206401230027號;“達摩院交互式多能型合成算法”備案通過,應(yīng)用于開放域多模態(tài)內(nèi)容生成場景,服務(wù)于問答、咨詢類的企業(yè)端客戶,通過API提供根據(jù)用戶輸入生成多模態(tài)信息的功能,備案號為網(wǎng)信算備330110507206401230035號。
  • 2023年7月,阿里巴巴達摩院(杭州)科技有限公司發(fā)生工商變更,周明卸任法定代表人、執(zhí)行董事兼總經(jīng)理,由張建鋒接任。
  • 2023年8月,該公司達摩院語音合成算法、達摩院虛擬試衣合成算法、達摩院人臉融合合成算法備案通過。
  • 2024年2月,阿里巴巴達摩院(杭州)科技有限公司的“達摩院服飾上身合成算法”備案通過,應(yīng)用于圖像生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶上傳的服飾參考圖和模特圖,將服飾圖里的服飾融合到模特身上,生成對應(yīng)服飾商品的廣告圖,備案號為網(wǎng)信算備330110507206401240055號。
  • 2024年4月,該公司達摩院單圖生成3D合成算法備案通過,主要應(yīng)用于圖像生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶輸入的需要被3D生成的單張單體物體的圖片,生成該物體的任意視角下的圖像,達到利用單張圖像生成3D模型的效果。備案號為網(wǎng)信算備330110507206401240063號。
  • 2024年4月,該公司達摩院人物姿態(tài)編輯合成算法備案通過,主要應(yīng)用于圖像生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶輸入的骨架圖和人物圖,生成人物姿態(tài)編輯后的結(jié)果圖像。備案號為網(wǎng)信算備330110507206401240071號。
  • 2024年6月,阿里巴巴達摩院(杭州)科技有限公司達摩院人物舞蹈視頻合成算法備案通過,主要功能是應(yīng)用于視頻生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶輸入的人物參考圖和所選的預(yù)設(shè)姿態(tài)序列,生成指定姿態(tài)序列下的人物舞蹈視頻。備案號為330110507206401240089號。
<
最可能同場景使用的其他API
>
API接口列表
<
產(chǎn)品價格
>

模型服務(wù)

模型名稱

計費單價

通義萬相-文本生成圖像

wanx-v1

0.16元/張

通義萬相-人像風(fēng)格重繪

wanx-style-repaint-v1

0.12元/張

通義萬相-圖像背景生成

wanx-background-generation-v2

0.08元/張

通義萬相-涂鴉作畫

wanx-sketch-to-image-lite

0.06元/張

通義萬相-Cosplay動漫人物生成

wanx-style-cosplay-v1

公測,免費額度300張

通義萬相-AnyText圖文融合

wanx-anytext-v1

公測,免費額度300張

<
使用指南
>
<
依賴服務(wù)
>
<
產(chǎn)品問答
>
?
通義萬相的圖像生成質(zhì)量如何?
通義萬相的圖像生成質(zhì)量非常高,可以達到與真實圖像相媲美的水平。模型具有強大的語義理解能力,能夠根據(jù)用戶輸入的文本提示生成符合用戶意圖的圖像
?
使用通義萬相時遇到API調(diào)用報錯怎么辦?
確認(rèn)API密鑰和訪問權(quán)限配置正確,檢查網(wǎng)絡(luò)連接是否穩(wěn)定,并參考官方文檔和示例代碼,確保調(diào)用參數(shù)和方法正確。
?
資源部署失敗應(yīng)如何解決?
確認(rèn)云資源配置符合要求,如VPC、ECS和OSS等,查看部署日志和錯誤信息,定位問題原因并參考文檔解決。
?
通義萬相服務(wù)響應(yīng)慢有什么解決方案?
檢查網(wǎng)絡(luò)連接和服務(wù)器負(fù)載情況,優(yōu)化API調(diào)用參數(shù),或聯(lián)系阿里云技術(shù)支持尋求幫助。
?
通義萬相有哪些技術(shù)優(yōu)勢?
穩(wěn)定性與高可用性:通義萬相保證了高并發(fā)下的穩(wěn)定響應(yīng),可用性達到99%以上。 API友好接入:提供了標(biāo)準(zhǔn)化的HTTP API,使開發(fā)人員能夠輕松集成AI繪畫功能。 知識重組&可變維擴散模型:基于自研的Composer組合生成框架的AI繪畫創(chuàng)作大模型,通過知識重組與可變維度擴散模型,生成符合語義描述的多樣化風(fēng)格的圖像。
?
通義萬相是否支持視頻生成?
是的,通義萬相在2024年9月19日發(fā)布了全新視頻生成模型,支持文生視頻和圖生視頻,最長能夠生成5秒的視頻,每秒30幀,分辨率為720P
?
通義萬相的用戶體驗如何?
應(yīng)用程序的用戶界面設(shè)計簡潔明了,易于上手。但是,生成后的作品缺少直接的對比和編輯功能,對于追求完美作品的用戶來說,這可能是個需要改進的地方
?
通義萬相在AI繪畫領(lǐng)域的表現(xiàn)如何?
通義萬相在AI繪畫領(lǐng)域展現(xiàn)了高度創(chuàng)新,多樣化的創(chuàng)作工具和靈活的輸出選項值得稱贊。
<
關(guān)于我們
>
通義千問是由阿里云自主研發(fā)的大語言模型,用于理解和分析用戶輸入的自然語言,在不同領(lǐng)域和任務(wù)為用戶提供服務(wù)和幫助。您可以通過提供盡可能清晰詳細的指令,來獲取符合您預(yù)期的結(jié)果。通義聽悟API服務(wù),在語音識別、翻譯和發(fā)言人識別的基礎(chǔ)上,提煉全文摘要、章節(jié)速覽、發(fā)言總結(jié)、待辦事項、PPT、問答、關(guān)鍵詞等內(nèi)容,對人與人交流的音視頻進行分析與精簡,幫助使用者快速了解音視頻主要內(nèi)容。
聯(lián)系信息
服務(wù)時間: 00:00--24:00
電話號碼: 86 571 8502 2600
郵箱: tingwu_contact@service.alibaba.com

達摩院成立于2017年10月,致力于探索科技未知,以人類愿景為驅(qū)動力,面向未來開展基礎(chǔ)科學(xué)和創(chuàng)新性技術(shù)研究。希望打通應(yīng)用基礎(chǔ)研究和產(chǎn)業(yè)應(yīng)用,探索技術(shù)產(chǎn)品化、產(chǎn)品市場化的轉(zhuǎn)換路徑。

 

達摩院在數(shù)字技術(shù)領(lǐng)域取得了一系列技術(shù)突破并實現(xiàn)規(guī)模化應(yīng)用,構(gòu)建了全方位的人工智能基礎(chǔ)能力,推出了業(yè)界領(lǐng)先的通義系列大模型,孵化出平頭哥半導(dǎo)體公司等。接下來,達摩院將繼續(xù)聚焦中長期科學(xué)技術(shù)研究,重點布局人工智能、集成電路等前沿領(lǐng)域。

 

 

發(fā)展歷程

  • 2023年2月,天眼查App顯示,阿里巴巴達摩院(杭州)科技有限公司發(fā)生工商變更,注冊資本由1000萬人民幣增至3億人民幣,增幅2900%。
  • 2023年6月,阿里巴巴達摩院(杭州)科技有限公司的“達摩院開放域自然對話合成算法”備案通過,應(yīng)用于對話生成場景,服務(wù)于智能對話類的企業(yè)端客戶,利用對話意圖理解、對話內(nèi)容生成等技術(shù),通過API提供對話生成功能,備案號為網(wǎng)信算備330110507206401230019號;“達摩院圖像合成算法”備案通過,應(yīng)用于圖像生成場景,服務(wù)于圖像合成類的企業(yè)端客戶,通過API提供文字信息轉(zhuǎn)化為圖像信息的功能,備案號為網(wǎng)信算備330110507206401230027號;“達摩院交互式多能型合成算法”備案通過,應(yīng)用于開放域多模態(tài)內(nèi)容生成場景,服務(wù)于問答、咨詢類的企業(yè)端客戶,通過API提供根據(jù)用戶輸入生成多模態(tài)信息的功能,備案號為網(wǎng)信算備330110507206401230035號。
  • 2023年7月,阿里巴巴達摩院(杭州)科技有限公司發(fā)生工商變更,周明卸任法定代表人、執(zhí)行董事兼總經(jīng)理,由張建鋒接任。
  • 2023年8月,該公司達摩院語音合成算法、達摩院虛擬試衣合成算法、達摩院人臉融合合成算法備案通過。
  • 2024年2月,阿里巴巴達摩院(杭州)科技有限公司的“達摩院服飾上身合成算法”備案通過,應(yīng)用于圖像生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶上傳的服飾參考圖和模特圖,將服飾圖里的服飾融合到模特身上,生成對應(yīng)服飾商品的廣告圖,備案號為網(wǎng)信算備330110507206401240055號。
  • 2024年4月,該公司達摩院單圖生成3D合成算法備案通過,主要應(yīng)用于圖像生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶輸入的需要被3D生成的單張單體物體的圖片,生成該物體的任意視角下的圖像,達到利用單張圖像生成3D模型的效果。備案號為網(wǎng)信算備330110507206401240063號。
  • 2024年4月,該公司達摩院人物姿態(tài)編輯合成算法備案通過,主要應(yīng)用于圖像生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶輸入的骨架圖和人物圖,生成人物姿態(tài)編輯后的結(jié)果圖像。備案號為網(wǎng)信算備330110507206401240071號。
  • 2024年6月,阿里巴巴達摩院(杭州)科技有限公司達摩院人物舞蹈視頻合成算法備案通過,主要功能是應(yīng)用于視頻生成場景,服務(wù)于企業(yè)端客戶,根據(jù)用戶輸入的人物參考圖和所選的預(yù)設(shè)姿態(tài)序列,生成指定姿態(tài)序列下的人物舞蹈視頻。備案號為330110507206401240089號。
<
合作案例
>
  1. 朗新科技合作案例: 朗新科技接入百煉大模型服務(wù)平臺后,對通義千問基礎(chǔ)模型能力進行場景基模效果驗證,并進行了電力行業(yè)問答數(shù)據(jù)效果調(diào)優(yōu)、智能問數(shù)場景中NL2SQL模型微調(diào)、plugin階段參數(shù)API處理增強優(yōu)化。通過通義千問電力行業(yè)知識政策問答、電力賬單解讀、數(shù)據(jù)問答等場景中實現(xiàn)更智能化的用戶服務(wù)新模式。

  2. 阿里云“伙伴千問計劃”: 阿里云發(fā)布了“通義千問伙伴計劃”階段性成果,與朗新、亞信、數(shù)字政通、藍凌、千方等60余家伙伴共同驗證了“通義千問”大模型的30余個行業(yè)應(yīng)用場景,涵蓋協(xié)同辦公、文化旅游、財務(wù)ERP、電力、政務(wù)、醫(yī)保、交通、制造、金融、軟件開發(fā)等行業(yè),涉及智能問答、文章摘要、文案寫作、代碼輔助、知識庫升級等場景。

  3. 藍凌軟件合作案例: 藍凌軟件對“通義千問”大模型在知識問答場景的應(yīng)用進行了探索。相較于傳統(tǒng)的數(shù)據(jù)收集與訓(xùn)練方法,其訓(xùn)練效率提高了十倍;而在企業(yè)搜索引擎場景中,與傳統(tǒng)詞搜索相比,搜索效率也提高了3倍以上。

  4. 中國一汽、新東方、長安汽車合作案例: 中國一汽、新東方、長安汽車等也宣布了與通義大模型的合作成果。

  5. 中國科學(xué)院國家天文臺合作案例: 中國科學(xué)院國家天文臺人工智能組基于通義千問開發(fā)了新一代天文大模型“星語3.0”,這是大模型首次應(yīng)用于天文觀測領(lǐng)域。

  6. 陜煤建新煤礦合作案例: 陜煤建新煤礦等十余座礦山推出由通義支持的新型礦山重大風(fēng)險識別處置系統(tǒng),成為大模型在礦山場景的首次規(guī)模化落地。

<
最可能同場景使用的其他API
>