話不多說(shuō),直接上教程

1、環(huán)境準(zhǔn)備

1.1、新建IOS工程

打開Xcode之后,選擇創(chuàng)建新工程就會(huì)進(jìn)入此頁(yè)面,然后選擇IOS下面的APP,填寫基礎(chǔ)信息即可完成

1.2、APP開發(fā)提示詞

使用cursor打開創(chuàng)建好的工程中的VoiceNote目錄,我們所有的代碼文件都需要在這個(gè)下面進(jìn)行開發(fā)

提示詞模版

你是一個(gè)出色的iOS工程師,我們目前新建了一個(gè) iOS app項(xiàng)目,叫VoiceMemo,你現(xiàn)在正在這個(gè)項(xiàng)目的根目錄,請(qǐng)幫助我完成這個(gè)app的開發(fā)。

## App功能說(shuō)明

1、錄音功能:用戶可以通過(guò)點(diǎn)擊界面底部的錄音icon,將開啟錄音;
2、錄音轉(zhuǎn)文字:錄音結(jié)束后請(qǐng)通過(guò)聲音轉(zhuǎn)文字AI將用戶的聲音轉(zhuǎn)化為文字,并呈現(xiàn)在界面上;
3、文字潤(rùn)色:將聲音轉(zhuǎn)文字AI轉(zhuǎn)錄的文字發(fā)送給另一個(gè)文本處理類AI,這個(gè)會(huì)潤(rùn)色加工直接轉(zhuǎn)錄的文本,減少錯(cuò)別字,形成更流暢的文本;并提出關(guān)于這個(gè)話題的下一步思考方向,并以“#標(biāo)簽”的格式提供三種相關(guān)標(biāo)簽。

## App界面說(shuō)明

1、首頁(yè):提供錄音入口,并展示錄音完成后AI轉(zhuǎn)錄的文本和AI潤(rùn)色后的文本;
2、歷史:歷史界面保存用戶每一次錄音的內(nèi)容,包含錄音文件、AI轉(zhuǎn)錄的文本、AI潤(rùn)色后的文本,每個(gè)歷史記錄都用一個(gè)組塊展示,按時(shí)間倒序排列。
3、我的:這個(gè)界面的功能待定。

## 相關(guān)信息

1、錄音轉(zhuǎn)文字API文檔:https://docs.siliconflow.cn/api-reference/audio/create-audio-transcriptions
2、文字潤(rùn)色處理API文檔:https://docs.siliconflow.cn/api-reference/chat-completions/chat-completions
3、API key:API密鑰[https://cloud.siliconflow.cn/models]

現(xiàn)在請(qǐng)作為產(chǎn)品經(jīng)理,先寫一個(gè)readme文檔并保存在根目錄,闡述你對(duì)我的需求的理解,以及實(shí)現(xiàn)方式,下一步計(jì)劃等,然后開始編程,設(shè)計(jì)這三個(gè)界面和功能。

來(lái)源:花生進(jìn)化論

**PS:鏈接需要單獨(dú)復(fù)制然后粘貼到cursor上,它才會(huì)去分析鏈接里面的文檔信息**

這里的API密鑰需要換成你自己的,下面是獲取操作

2、開發(fā)APP

在打開的工程中輸入上面提供的提示詞然后可以先從項(xiàng)目基礎(chǔ)架構(gòu)和 TabBar 控制器開始搭建

很好,然后先創(chuàng)建項(xiàng)目基礎(chǔ)架構(gòu)和 TabBar 控制器

接下來(lái)實(shí)現(xiàn)錄音功能

好的,接下來(lái)開始實(shí)現(xiàn)錄音功能,需要實(shí)現(xiàn)的功能如下:
1、創(chuàng)建錄音管理器類
2、設(shè)計(jì)首頁(yè)的錄音UI
3、實(shí)現(xiàn)錄音的核心功能

接下來(lái)實(shí)現(xiàn)語(yǔ)音轉(zhuǎn)文字的功能

很好,接下來(lái)開始實(shí)現(xiàn)AI語(yǔ)音轉(zhuǎn)文字功能,接口文檔是https://docs.siliconflow.cn/api-reference/audio/create-audio-transcriptions

接下來(lái)實(shí)現(xiàn)文本潤(rùn)色功能

很好,接下來(lái)開始實(shí)現(xiàn)文本潤(rùn)色功能,接口文檔是https://docs.siliconflow.cn/api-reference/chat-completions/chat-completions

接下來(lái)實(shí)現(xiàn)歷史記錄功能

很好,那接下來(lái)開始實(shí)現(xiàn)歷史記錄功能

這樣我們的基本功能就實(shí)現(xiàn)了,我們這時(shí)候可以在Xcode中嘗試編譯項(xiàng)目,看是否OK

看樣子是有錯(cuò)誤,那我們就把錯(cuò)誤信息往cursor里丟,讓它分析和修復(fù)

這里我們?nèi)绻皇煜code操作,可以嘗試讓cursor生成看看效果,但好像還是有錯(cuò)誤,不過(guò)只剩下一個(gè)了,我們可以繼續(xù)將錯(cuò)誤信息丟給cursor分析

cursor開始分析然后修改模型文件

這里需要?jiǎng)h除文件,那我們可以直接詢問(wèn)cursor讓它給出刪除命令

但是還是有錯(cuò)誤,但不是之前的了,這里應(yīng)該類型不匹配,不過(guò)不要緊,繼續(xù)讓cursor分析

還是存在問(wèn)題,那我們可以使用cmd+k在指定的代碼中進(jìn)行單獨(dú)詢問(wèn)

這次就構(gòu)建成功了,接下來(lái)測(cè)試其效果

顯示的是默認(rèn)的hello world界面,還需要進(jìn)行修復(fù),輸入下面提示詞,讓cursor處理

運(yùn)行時(shí)發(fā)生錯(cuò)誤,且界面是工程初始的hello world界面:
Error creating the CFMessagePort needed to communicate with PPT

接下來(lái)看實(shí)際效果

這里顯示轉(zhuǎn)寫有問(wèn)題,后臺(tái)也有錯(cuò)誤信息,直接丟給cursor去分析修復(fù)

這里其實(shí)還需要將錯(cuò)誤信息發(fā)給cursor

說(shuō)明我們接口實(shí)現(xiàn)有問(wèn)題,

服務(wù)器錯(cuò)誤(404):未知錯(cuò)誤,請(qǐng)重新分析語(yǔ)音轉(zhuǎn)文字接口文檔 https://docs.siliconflow.cn/api-reference/audio/create-audio-transcriptions
**PS:同樣的,鏈接需要手動(dòng)復(fù)制**

這下我們知道原因了,是因?yàn)橹С謒p3格式,我們繼續(xù)修復(fù)

可以看到轉(zhuǎn)文字是已經(jīng)成功了,但是文本優(yōu)化是失敗了,我們繼續(xù)分析

還是一樣,有問(wèn)題把信息丟給Cursor分析即可

這次的執(zhí)行結(jié)果可以看出來(lái)是沒(méi)問(wèn)題了,效果也不錯(cuò)

基本功能我們已經(jīng)實(shí)現(xiàn)了,接下來(lái)我們實(shí)現(xiàn)一個(gè)進(jìn)階功能,將文本同步到筆記軟件,flomo

在當(dāng)前的基礎(chǔ)上,添加一個(gè)功能可以將輸出的文字信息上傳到flomo筆記上面,接口的請(qǐng)求方式如下所示:

POST https://flomoapp.com/iwh/MjEzMTIxOQ/5b745db2e2a6746eccf7a5ae85e2adce/
Content-type: application/json
{
"content": "Hello, #flomo https://flomoapp.com"
}

最后我們?cè)賹?shí)現(xiàn)一個(gè)功能,因?yàn)檫@里它是把鏈接寫死的,但是我們的APP如果發(fā)布出去的話,別人用的時(shí)候不就是把筆記同步到我們自己的賬號(hào)了嗎,所以需要支持自定義同步鏈接

然后再實(shí)現(xiàn)一個(gè)功能,這個(gè)同步的請(qǐng)求鏈接支持用戶輸入,不要設(shè)計(jì)為硬編碼

這下就大功告成了,我們的語(yǔ)音筆記APP就開發(fā)完畢了。

3、總結(jié)

通過(guò)這次從零開始使用AI開發(fā)語(yǔ)音筆記APP的經(jīng)歷,我深刻體會(huì)到現(xiàn)在的AI工具確實(shí)讓編程變得更加平易近人。無(wú)論你是產(chǎn)品經(jīng)理還是編程新手,只要有清晰的產(chǎn)品思路,再加上AI的幫助,都能夠?qū)⑾敕ㄞD(zhuǎn)化為現(xiàn)實(shí)。這不僅僅是一個(gè)APP的誕生故事,更是AI時(shí)代賦予每個(gè)人創(chuàng)造力的最好證明。

文章轉(zhuǎn)載自: 看了小貓補(bǔ)光燈作者的視頻,我用AI做出了人生第一款筆記APP

上一篇:

街口支付在大陸的使用指南:開啟跨境支付新體驗(yàn)

下一篇:

Cursor 的開源平替產(chǎn)品 Cline介紹
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊(cè)

多API并行試用

數(shù)據(jù)驅(qū)動(dòng)選型,提升決策效率

查看全部API→
??

熱門場(chǎng)景實(shí)測(cè),選對(duì)API

#AI文本生成大模型API

對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)

#AI深度推理大模型API

對(duì)比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)