拒絕機械感！30秒生成商用級歌曲，「歌歌AI」完成新一輪融資|36氪首發

作者 | 鄧詠儀

編輯 | 蘇建勳

在鍵盤上敲出短短一行命令：請給我寫一首充滿喜悅/悲傷/的歌，等待片刻，一首完整的、甚至帶有人聲、歌詞的”歌曲“就已經完成——進入2024年，Suno等産品帶來的熱度還沒散去，如今國內已經有不少瞄准AI音樂領域的産品，如雨後春筍般出現。

36氪此前報道的「歌歌AI」是其中的一員。這家公司近期獲得新一輪數百萬元投資，投資方爲錫創投。

音律閃動成立于2022年8月，瞄准AI生成音樂方向，其主要産品爲「歌歌AI」app。

音律閃動CTO王樞沛告訴36氪，音律閃動的團隊爲來自互聯網大廠的技術專家，以及在音樂産業中的資深制作人。在生成式AI出現前，團隊就已經有通過AI技術來探究在音樂領域中的應用——早在2016年，團隊成員就開始開發AI寫歌産品，並有項目創業經驗。

真正促使團隊創業的，是在2022年左右看到以Transformer架構爲主的技術突破，“我們認爲，這個技術能夠真正改變音樂産業。”王樞沛表示。因此，從2023年成立開始，音律閃動就開始從底層模型開始訓練，在經曆2023年的小程序版試運營後，在4月完成了獨立的app開發，近期剛剛上線。

“讓所有人都成爲音樂人”是歌歌AI的目標，從産品形態來看，歌歌AI是一款面向所有愛音樂的用戶的AI寫歌軟件。使用方法也非常“傻瓜式”，容易上手——

用戶進入app界面，即可看到三種模式：自由模式、驚喜模式、純音樂模式，通過對話和“AI制作人”溝通，生成自己想要的音樂。

在自由模式下，用戶可以輸入簡單一句話的Prompt，讓AI生成擁有具體主題、完整旋律和人聲的歌曲。

比如，36氪就以自由和勇氣爲主題，請AI幫忙寫一首歌曲，不到1分鍾內，歌歌AI就生成了一首時長爲2分20秒的《希望之歌》，並且帶有完整填詞。

來源：歌歌AI

整首歌擁有比較和諧的旋律和編曲，並且旋律變換也相對豐富。不過在填詞上，還是有個別詞句會不通，或者斷句尚有問題，但用戶可以通過手動調整來完成歌詞修改。哪怕不懂樂理，還可以通過簡單點選操作，來調整每個字的音高。

來源：歌歌AI

“除了修改歌詞和旋律，還有包括AI演唱的這個聲音，用戶也可以在選擇付費後進行修改，替換成自己的聲音。”王樞沛表示。

對于要求更高的用戶，歌歌AI還提供了更專業的“驚喜模式”，能夠生成滿足商業級場景的歌曲。

在這一模式下，用戶能夠對音樂風格、具體的配器提出更多要求。AI能夠生成更完整的旋律，會有完整的主歌、副歌、橋梁等結構。

並且，人聲的變換也更加豐富——無論是顫音、旋律的高低變換過度都更自然，聽起來更接近自然人聲演唱的狀態，“AI感”減少很多。

在所有模式下，歌歌AI都基于一定的免費積分，用戶可以消耗積分以生成音樂。一旦用戶對AI生成的demo比較滿意，希望“擴寫”，就能在對話框裏和“AI制作人”對話，以修改風格等等，同時付費來讓AI生成更完整的歌曲。目前的三檔付費價格分別爲包月18元、48元、98元。

音律閃動COO王樞沛對36氪表示，驚喜模式使用的是端到端的大模型技術，爲了保證音樂效果質量更高，暫時不支持具體的歌詞和人聲修改，這也是與市面上大部分AI生成音樂産品相比，歌歌AI的優勢所在。

“AI文字、圖片生成現在都有開源框架，技術層面是比較開放的，但從AI生成音樂賽道整體來看，技術路線是比較封閉的，各家都有自己的訓練技術差異。”王樞沛表示。

總體來說，上一代將AI技術應用到音樂中的嘗試，普遍能做到的程度是，先生成MIDI音樂，即簡單將旋律數字化，形成較爲單調、機器感的單旋律。

在上一代AI技術逐步成熟之後，AI生成音樂進入到了用小模型、專家系統訓練的階段。簡單而言，一種方式是通過人工標注大量的音樂片段，分“科目”訓練模型，比如旋律、歌詞、編曲等，都有單獨的小模型。等到這些模型能夠産出比較成熟的片段之後，再“拼接”起來，形成完整旋律。但這種方法的缺點是，由于各個元素是割裂的，拼接之後的機器感難以消除，也很難達到和諧的效果。

而從AI生成音樂的訓練上，爲了保證歌曲能做到質量更高、更自然，歌歌AI對標海外産品，選擇了端到端的大模型路線，即音樂數據不需要經過特別細致的處理，就輸入到模型中進行訓練。這樣能夠生成比較完整、統一的旋律。

歌歌AI的另一個亮點在于，並不局限于“用AI寫歌”的定位上，而是希望能夠基于生成式AI技術，真正讓音樂創作、分發方式的鏈條發生根本性變化。

音律閃動團隊認爲，目前音樂平台的推薦音樂內容千篇一律，並且推薦內容頁不真正切合需求。“全國現在每天大概産生新産生約十幾萬首歌，但生成式AI技術能夠讓這個數字變成成百上千萬。”王樞沛表示，AI技術的普及，也會讓人們生成更個性化的音樂，成爲打破現在音樂巨頭壟斷的機遇。

除了歌曲生成等基本功能外，歌歌AI也拓展了多個板塊，涉及生成和分發。

比如，用戶通過AI模型錄入自己聲音並生成歌曲，可選擇不同風格和曲風，甚至發行全網。

歌歌AI近期也正在與國內主要音樂平台洽談對接，以後希望做到的效果是，用戶生成音樂後可以做到自動修音、AI混音處理，最後——全網一鍵發行，用戶能夠通過自己生成的AI音樂，獲得版稅。

並且，和短視頻的結合也是重要的傳播節點。當前，歌歌AI已經能夠支持下載帶有AI音樂的小視頻，未來也會拓展到AI生成視頻、直播場景。

本輪融資後，歌歌AI團隊也會繼續加速産品叠代，並且投入到市場增長方面。

團隊方面，目前歌歌AI團隊不到10人，CEO龍勇擁有20年音樂制作經驗，曾是中國好聲音、中國有嘻哈、TME官方合作夥伴，有豐富制作運營音樂和版權經驗；COO王樞沛是浙江大學工學/ 美國伯克利音樂學院音樂制作和吉他表演雙專業學士；CTO張文鉑爲「我要寫歌」APP創始人。

文采家

拒絕機械感！30秒生成商用級歌曲，「歌歌AI」完成新一輪融資|36氪首發

36氪