AI播客工具2年超百萬用戶,吳恩達投了3輪

創業邦 2024-05-01 11:24:40

作者丨臨風

編輯丨海腰

圖源丨圖蟲創意

播客創作者逐年增多。

據Spotify,2023年僅其一個平台上就有超500萬個播客節目,活躍的播客總數在300萬-400萬之間,涵蓋各種類型。其中,有不少是由文轉語音的AI完成的播客,聲音沒有Siri或小愛同學的人工機械味兒,有時甚至能“以假亂真”。

如今,亞美尼亞公司Podcastle亮了亮招牌技能,它能讓用戶克隆自己的聲音做成語音“皮膚”。而且,該平台內還有30余款AI語音“皮膚”可供用戶選擇,包含多種語言(含方言)。

Podcastle成立于2020年,它爲播客創作者搭建AI工具平台,集成了語音克隆工具Revoic,降噪工具Magic Dust AI和團隊協作功能,首先在美國打開市場完成用戶積累。

(圖源:Podcastle)

Podcastle在公告中稱,他們迎合了播客創作者、個體商戶、營銷員和教育工作者的內容創作需求,創作者社區用戶增長迅速,從2021年的15萬人增長至超100萬。

創始人Arto Yeritsyan是亞美尼亞企業家,畢業于埃裏溫國立工程大學,畢業于斯坦福商學院。他曾是PicsArt的工程副總裁和Be2的技術主管。當前,其領導團隊主要來自Canva、Prezi、Uber和Facebook。

今年2月,他們最新一輪A輪融資1350萬美元,由Mosaic Ventures領投,RTP、P9、Sierra、吳恩達的 AI Fund以及 Squarespace和Moonbug Media的首席執行官參投,其中Sierra、AI Fund連投3輪。

創建自己的語音“皮膚”

Podcast Host調研了2500名播客創作者,有32%的人表示播客的編輯和制作是最大的擔憂。

Podcastle公司CEO Arto Yeritsyan在SpeechTech發表觀點,播客有兩項重大技術的飛躍,一是文轉語音技術讓創作者無需說話即可制作音頻,二是創建自己的克隆聲音免去重複錄制。而這兩點,都可以靠人工智能工具實現,達成更高效率的創作。

借此技術趨勢,Podcastle從一個擴展程序,在2022年進軍視頻播客領域,目前發展爲AI套件工具的平台。用戶在平台內可完成錄制、音頻編輯的全流程。該平台專注于長篇內容創作,並通過提供實時協作和人工智能功能來區別于競爭對手。

(圖源:Podcastle)

它集成了語音克隆、降噪、文轉語音TTS等工具,都需付費。其中降噪增強功能Magic Dust AI被測評博主推薦多次,該功能稱可“一鍵”消除背景噪音、均衡音頻電流,將低質錄音轉換到錄音室級別。

從示例音頻效果來看,其將原設備錄制中存在的風聲、電流聲清除,留下人聲後增加了音質。

另一項功能Revoic,人工智能生成聲音。用戶可以克隆自己聲音的數字副本。用戶需要錄制70個自己閱讀的句子提交語音樣本,啓動Revoice後24小時內可獲得模仿真實聲音的語音模板。

人工智能分析已錄制的語音樣本,學習人類的語調、口音和細節創建數字副本。它就像一個語音“皮膚”一樣,克隆後便能應用在各種場景之中。

Arto認爲,Revoic意味著播客創作者們可以更少地依賴棚內環境和專業錄音設備獲得高質量效果。

The Verge作者David Pierce使用了The Office的《Dwight's Perfect Crime》的片段文本,並將用他自己的聲音在Podcastle克隆了AI語音,比較了幾個語音平台的生成效果。

從效果來看,ElevenLabs的生成效果最真實,帶有語音主人的個人情緒,其次是Podcastle,接近人類真實聲音,感情表達稍弱。

博主Feisworld測試了Revoic,人類原聲和AI語音模板能聽出明顯區別,AI版的聲音音色接近原音、吐詞清楚,但稍顯機械化,更像在逐字逐句閱讀原文,人類原聲則有語調起伏、铿锵有力。

Fei表示,“我不會將AI語音視爲要替代我的工具,但我認爲這在其他任務上是有益的,如閱讀較難的科學或哲學文章,以及廣告語。”她也指出問題,“如果是AI生成的語音,能改變語調將會是很棒的,但目前(2023年)我沒在Podcastle看到改變語氣的選項/方法。”

Podcastle語音克隆Revoic的確有適應的場景,當播客創作者制作長視頻/音頻需要錄制大量旁白、畫外音及特殊語言/方言,就可以適當使用這項功能。

除這兩項功能外,Podcastle與多數AI平台一樣,有處理音頻的基礎功能,包括語音轉錄文本、TTS文本轉語音、AI靜音消除(自動刪除較長停頓)、廢話檢測(自動刪除“嗯”、“你知道”等詞彙)。

平台內有30種TTS模板音色(語音皮膚)可選擇,也包含7000首免版權音樂供創作者使用。用戶可以輸入文字制作單人播客,也可以按段落選擇適配的皮膚,來模擬多人場景。

(來源:Podcastle)

平台啓用雲錄制,如果是遠程播客內容遇到斷網情況,也可即時保存內容。同時,涉及多人播客時,可使用Podcastle的團隊協作實時編輯。

當前,不止Podcastle一家在用AI賦能播客。Riverside主打快速音頻剪輯,Descript集成的SquadCast提質提效,Listener.Fm用人工智能做節目注釋、標題和說明。Reddit用戶使用了系列AI播客工具後評價,Podcastle界面最簡單,平台和錯誤率相較低些,加之其訂閱價格較爲親切,11.99美元/月(Descript12美元/月),吸引不少創作者試用。

(圖源:Podcastle)

到2023年底,Podcastle表示平台內已有超過1200萬個播客劇集和內容。

2年增長至百萬用戶

Podcastle良好的産品運營、用戶增長與創始人兼CEO Arto Yeritsyan有關。前同事Tammy評價:“他具備成爲一位成功企業家必須的條件,技術、産品知識、人際交往和商業頭腦。”

他的確技能滿滿。Arto領英列出的技能有50項,涵蓋軟件、編程、執行管理等方方面面,在2020年被Hive Ventures評爲30under30亞美尼亞科技人才。

(圖源:Arto Yeritsyan領英)

Arto出生在亞美尼亞的首都、經濟中心埃裏溫,畢業于亞美尼亞國立工程大學,又去斯坦福大學商學院進修了1年。畢業後Arto在亞美尼亞排名靠前的科技公司Be2擔任工程師,2年時間就成了技術主管。

那時作爲打工人,Arto堅信,“如果我表現得最好,我就會得到認可。”前同事在推薦信裏給Arto貼好了標簽:“頭腦清晰”、“認知明確”。後來,他抓住機會進了亞美尼亞最大的獨角獸公司PicsArt幹了七八年,從産品開發總監一路晉升到工程副總裁,成爲管理300人工程團隊的關鍵人物。Arto在離開後還爲PicsArt當了2年顧問。

到了2020年前後,很多創業者開始對人工智能感興趣,Arto也一樣。他在上學的時候有閱讀障礙,許多知識需要靠聽覺吸收。在他看來,音頻是最簡單、最直接的溝通方式。

而播客是音頻形式呈現的深度訪談,又不同于單向知識灌輸的講課,它以聊天互動輸出深度觀點和獨到拆解。

所以,在PicsArt工作期間,他萌生了做播客工具的想法。他是公司高管,每天忙得似陀螺,設想過用一個簡單的插件用播客的形式給他消化文章、博客。同年6月,他和朋友們創立Podcastle摸索著創業。

在去PicsArt之前,他也作爲Coding Records的聯合創始人開過公司。從打工人到管理者,Arto在職業生涯裏逐漸積累了識人、用人的經驗。因此,他爲後來Podcastle招募了3位志同道合的創始成員。Polixis原首席軟件開發工程師Aram,從博物館營銷員成爲WIC董事的Arsen,Webb Fontaine産品老將Vardan。

(圖源:Arto Yeritsyan領英,依次爲Arsen、Arsen、Vardan、Aram)

不過,他們四人之前都未深入了解過播客,所以他們一開始就踩了個坑。起初,Podcastle主打文本轉音頻的功能,如Arto當初設想的推出Chrome擴展程序,幾秒鍾將任何文章轉爲播客,獲得了第一批用戶,但卻很難再邁出下一步吸引專業播客人士。

“我們只考慮到了語音內容的消費,沒有考慮到播客創作者的需求。”2022年,Arto決定關停插件,惡補了播客內容創建和編輯的帖子後,投入全部資源發展數字創作和音頻增強,研發創作者的編輯和轉錄套件工具。這時他們的目標才真正定下來,要打造一體化平台,讓初學者和專業人士在AI的幫助下簡單獲得高品質音頻。

(圖源:Podcastle)

他們調整了産品設計,開發音頻編輯功能,例如多軌錄音、自動均衡、聲音動態淡入/淡出。用戶可在平台內錄制至多10人參與的個人或群組播客,並在2023年9月推出了實時播客協作功能。

除了滿足專業人群對音質的剛需,Arto的目標受衆也包括無經驗的業余播客人。“每個人心裏都有故事,但他們沒有專業化設備,不知道怎麽讀出來,以及如何保留聽衆。但任何人都應該有自信、有能力發出自己的聲音。”

要解決這一問題,Arto就讓播客從消費到創作、全鏈條自動化起來,連發聲這一環節都給包攬了。他透露,給用戶提供豐富的“聲音皮膚”,是Podcastle實現盈利的策略之一。Podcastle的文轉語音除了系統提供30多種的固定聲線,後又開發了Revoice與額外的聲線提供付費訂閱。並且,Podcastle的官網博客中集合了大量播客經驗貼,推薦工具貼以及案例分享。

爲真正做到“一條龍服務”,Podcastle的托管平台爲創作者用戶提供播客RSS源,確保用戶維持聽衆粘性。對訂閱用戶而言,他們可以每月錄制20小時4k視頻播客,平台可做簡單的背景模糊處理。

Podcastle在2021年底積累下約20萬用戶,經過2022年産品調整後,迎來快速的用戶增長,到2023年底其社區中已有超100萬用戶。

戰爭背景下融資起步

亞美尼亞的流媒體環境不佳,人們很少談論社會問題,或是用英語做公開評價。

Arto選擇在美國推出Podcastle。他發現,美國的青年群體獲取資訊的方式不局限于傳統媒體,而是從他們信任的播客或其他來源獲取多方面信息,使得這裏有更好的播客創作環境,“他們欣賞並理解有條理的討論,而且不局限于某一陣營。”

爲了吸引用戶,Arto在Podcastle開始的2年爲文轉語音、語言轉錄保持免費方案。長期的免費方案需要資金支持,Arto必須籌款。

他和朋友們一切准備就緒,Arto也通過工作積累了多國行業人脈。然而,彼時亞美尼亞處于戰爭和和平之間,加上疫情爆發導致經濟的大面積蕭條。這讓亞美尼亞公司獲資艱難,Arto與50位投資者數次對話交談,其中僅有2-3個起作用。

Arto在Rearrange的訪談中透露,全球日益內卷的創業潮中,他在亞美尼亞看到了相反的商業生態。“創業公司的高管或創始人都在盡可能最大化他們的影響力,試圖幫助其他人。”

PicsArt,這只在亞美尼亞發展強勁的獨角獸給了國內其他科技初創公司很大的籌款底氣。一是亞美尼亞有很多優秀的科技人才,PicsArt讓其跻身國際科技舞台成爲可能。二是PicsArt致力于做全世界用戶都喜愛的産品,並在努力獲得資金。

Arto表示:“在我們國家,多數公司都是互幫互助,對其他公司的成功感到興奮。這很難得,他們(PicsArt、Krisp等)會讓很多來自硅谷的投資者了解亞美尼亞。”他感慨,亞美尼亞雖小,卻能通過合作共同去更大的世界發揮作用。

2020年底,在第一次實現用戶的有機增長後,Podcastle獲得了美國VC Sierra Ventures領投的175萬美元。

Podcastle是Sierra Ventures投的第二家播客公司,另一家是當時估值超35億美元的喜馬拉雅FM。他們是在投資Krisp時在亞美尼亞意外注意到了Podcastle,“Krisp在1年之內從0美元增長成400萬美元ARR的公司,鑒于Podcastle也是亞美尼亞的,相信他們也可以用人才和項目建立起有資本效率的企業。”

值得一提的是,早在這輪融資中,Podcastle就獲得了吳恩達的AI Fund投資。

Arto在跟投資者聊時從不避諱談論他們國家正處于戰爭之中,這讓多數原本對他項目感興趣的資方即刻收聲。但AI Fund沒被嚇跑,“他們很感興趣,並且相信我們可以獨立成長。”

最新一輪領投方Mosaic的聯合創始人Simon Levene也很看好他們,“Arto他們打造的産品呈現有機增長的趨勢,這種增長在未來幾年會加速。”

聽播客的人也逐年增多。The Infinite Dial報告顯示,6成以上(12歲以上)美國人是播客聽衆,這個數據在2022年初躥到了73%。Demand Sage也有數據表示,全球播客受衆將在2024年達到5.049億。

目前,在Arto看來,播客行業最大的趨勢走向有兩個,最大的方向是音質提升,用AI工具將任何音頻生成“僞高質量音頻”,另一個大方向是市場營銷,高仿真的AI語音能協助大量廣告切片的分發,幫助企業分享和引流。

Podcastle的公告顯示,獲投後除了加速AI工具的開發,還需擴大産品範圍。爲此Arto又招攬了不少人才。前段時間,Canva前副總裁Allan上任首席商務官,加入領導團隊的還有來自Prezi、Uber、Facebook的老員工。

0 阅读:21

創業邦

簡介:關注創新經濟及其推動者。