最後更新時間:2024 – 2 – 6 by ChuChu
在今年(2023)一月份, Google 推出了一個 AI 生成音樂的工具 MusicLM ,這個 MusicLM是什麼呢?簡單來說就是你可以輸入一些文字,像是「晚宴上的爵士樂」,MusicLM 就會幫你創作出符合的音樂, AI 已經逐漸讓我們的生活發生了改變,甚至連音樂都可以透過 AI 來創造。
Google MusicLM是什麼?
MusicLM 是 Google 推出的 AI 音樂工具 MusicLM ,也是一個新的實驗性人工智慧工具,可以將文字敘述轉化成音樂,而且除了文字外,連圖片也可以幫你轉成音樂。
這個 MusicLM 可以在哪裡找到呢?目前有推出網頁版,不過目前尚未可以開始使用功能,目前可以先登入帳號,進到等待名單當中,當推出時可以優先使用這個AI應用功能。
在 MusicLM 裡,你可以輸入一些文字來開始你的創作,這些文字裡面你可以提到風格,想要古典、電子或是爵士樂,再加上想要的氛圍或情感,所以可以寫出這樣的文字「派對上的電子樂」,就可以運用 AI 創造符合的音樂。
MusicLM 使用了強大的聲音演算法去訓練這些音樂資料,讓音樂創作者輸入文字、聲音、旋律,假設你唱出了一段聲音, MusicLM 也會依據這段聲音,使用不同樂器來產出這段音樂,在以下 Google 的影片可以看到。
不過這套系統也備受挑戰,有些學者指出,這樣的 AI 音樂創作工具,將資料庫中受版權保護的音樂素材,合成新的歌曲,這會不會受到道德的一些挑戰?
不過 Google 表示,他們一直在與音樂家做密切的合作,舉辦研討會探討這個議題,其中目前的結論是在 MusicLM 裡面不會產生特定藝術家或人聲的音樂,所以可以隨心所欲的創作。
豬豬也目前也登入到 AI Test Kitchen 裡,加入了等候名單,等到功能推出後,想要來玩玩看這套工具。
MusicLM功能有哪些?
再來我們可以仔細探討 MusicLM 可以使用什麼樣的方式產出音樂,或許你可以從這邊找到一些做影片的素材,幫助你得到意想不到的音樂素材,也可以到官方文件裡試聽看看這些範例,其實還蠻有趣的。
用文字生成音樂
這個功能你可以把你想要製作的音樂,用豐富的文字作敘述,在圖中的範例你可以看到他把想要製作的音樂文字化,目前官方上都是用英文來創造音樂,我把圖片上的翻成中文給大家參考,可以把想創作的音樂變成以下說明:
- 街機遊戲的主要配樂:這段音樂節奏明快且歡樂,具有電吉他的重複即興片段,這段音樂重複且好記憶,附加一些像是鈸聲、鼓聲這些意想不到的聲音。
- 雷鬼音樂和電子舞曲的結合,具有空間感、超凡脫俗的聲音,這段音樂設計起來,目的在創造一個驚奇和敬畏的感覺,收聽這段音樂同時也能跳舞。
- 演奏一段具有上升音調的音樂,具有大量的琶音,並由打擊、低音線和柔和的鼓聲了合成。這首歌充滿了合成聲音,營造出一個舒緩和冒險的氣氛,適合在音樂節上在兩首歌之間做為暖身作用。
- 一首慢節奏,是貝斯和鼓主導的雷鬼歌曲,具有持續的電吉他聲音,帶有鈴聲的高音手鼓,聲音帶有著悠閒的感覺,非常有表現力。
在文字裡面你可以描述一些樂器、氣氛、節奏,用這些元素組成一段話,就可以製造出你想要的音樂,這邊生成的曲子是30秒鐘。
用文字生成長版曲子
在這個部分你可以說明想要哪一種類型的音樂, MusicLM 就會生成 5 分鐘的長版曲目,在官方頁面以高科技舞曲旋律( melodic techno )、搖擺樂( swing )、放鬆爵士樂( relaxing jazz )作為範例,因此只要你想要的曲風,簡單的輸入一兩個單字就可以開始創作了。
故事生成模式
在這個模式中,你可以分別指定每一段時間所要出現的曲風,透過一系列的文字來編制一首故事性的曲目,譬如說你可以在每一段時間內,輸入一段文字,這些文字可以是音樂曲風、也可以是一個狀態,MusicLM會根據這些文字,編制成一首樂曲。
範例一:狀態
- 冥想時刻( 0:00 – 0:15 )
- 起床時刻( 0:15 – 0:30 )
- 跑步時刻( 0:30 – 0:45 )
- 衝刺時刻( 0:45 – 0:60 )
範例二:曲風 + 狀態
- 電子遊戲中播放的電子歌曲( 0:00 – 0:15 )
- 在河邊的冥想音樂( 0:15 – 0:30 )
- 火( 0:30 – 0:45 )
- 煙火( 0:45 – 0:60 )
範例三:曲風或樂器
- 爵士樂( 0:00 – 0:15 )
- 流行樂( 0:15 – 0:30 )
- 搖滾樂( 0:30 – 0:45 )
- 重金屬歌曲( 0:45 – 1:00 )
- 饒舌樂( 1:00 – 1:15 )
- 小提琴弦樂四重奏( 1:15 – 1:30 )
- 有股的史詩配樂( 1:30 – 1:45 )
- 用傳統樂器演奏的蘇格蘭民謠( 1:45 – 2:00 )
可以看到官方的範例以 15 秒為一個單位做一段文字說明,創作 1-2 分鐘的音樂,用不同的曲風或樂曲來互相搭配,而且完全不同的曲風也可以互相搭配,像範例三裡有重金屬也有搖滾樂,可以創作出多樣化的風格。
文字和旋律模式
這個模式我覺得非常的酷,你可以先提供你想要變化的曲目,像是範例中提供 Bella ciao 、 Mozart symph25 、ode to joy 這些知名的樂曲,然後你可以用文字說明想要的演奏方式,像是鋼琴獨奏( piano solo )、無伴奏合唱( a cappella chorus) 、 爵士薩克斯風( jazz with saxophone )…等演奏方式。
MusicLM 會自動用這些演奏方式,演奏這些曲目,你就可以聽到同一種曲目下,有好多種演奏方式,一次擁有不同的呈現方式,不管是人聲或是樂器。
用畫作生成音樂
在這個部分,你可以找一些知名的畫作,在這些畫作裡在網路上會提供一些說明,MusicLM會用這些說明創作出30秒鐘的音樂,根據這些畫作的氛圍,創作出合適的音樂,你也可以透過音樂,感受到這幅畫想要呈現的感覺,是滂薄的、還是動感的,甚至是驚恐的。
用文字生成10秒音樂
提供一些非常簡單的文字敘述,像是樂器、節奏、地點、年代…等敘述,就可以做出十秒鐘的音樂,而且這些類別非常的廣泛,在短影音越來越興起的時代下,我覺得這個功能可以幫助創作者快速的創作出短影音的音樂。
官方範例上有以下文字可以參考:
- 樂器( 吉他、大提琴、電吉他、長笛 )
- 流派( 8-bit 、大節拍、氣氛音樂 、90年代柏林電子音樂)
- 音樂等級(初學鋼琴演奏、中級鋼琴演奏、專業鋼琴演奏、瘋狂快速的專業鋼琴演奏)
- 地點(加勒比海的海灘、越獄、健身房、歌劇院)
- 時代(50年代的俱樂部、60年代的俱樂部、70年代的俱樂部、80年代的俱樂部)
- 手風琴獨奏(手風琴重金屬、手風琴電子樂、手風琴鋼琴樂、手風琴饒舌樂)
版本多樣化
在 MusicLM 裡,提供多樣化的版本,也就是相同的文字下,可以產出不一樣版本的音樂,增加音樂創作的多樣性,像範本中的文字為「運動勵志音樂」, 在同樣的條件下,MusicLM 提供了六種版本的音樂,而且每一種的都可以聽出來有不同感覺。
如果在相同條件,語意上也是相同的話,雖然音樂風格會漸漸類似,但是你可以聽得出輕重不同,或是使用的樂器不同。
MusicLM 特色
在研究完MusicLM的文件後,可以了解到 AI 逐漸滲透到你我生活中,以後可以透過這些功能隨心所欲的創作,就算你不是音樂家,但是你知道曲風、氣氛、樂器…等文字敘述,就可以組合起來成為一首歌。
MusicLM是什麼樣的AI音樂功能呢?簡單來說就是用單字、一句話、分段話的文字來創作音樂作品。
從這些範例當中可以發現 MusicLM 有以下特色:
- 可以透過短文字創造音樂:輸入樂器、風格、場合等單字,就可以創作符合該單字的音樂。
- 可以透過一句話創作:可以用一句話說明節奏的樣式、背景音樂或是用什麼樂器彈奏來生成音樂。
- 針對不同時間設定不同音樂:在長樂曲的功能下,可以設定不同時間點的曲風、狀態,創建完整的曲子。
- 用畫作生成音樂:可以根據經典的畫作,生成符合背景時空下的音樂。
- 生成10秒鐘短樂曲:只要輸入簡短的單字如:樂器、節奏、等級…等,就可以創造出十秒音樂。
- 版本的多樣性:在同樣的文字敘述下,可以呈現多樣化的演奏模式、聲音呈現模式。
結論
目前 MusicLM 只有推出文字的介紹和範例的呈現,還沒有辦法實際測試整個使用起來的感覺,不過在文件敘述可以看出功能感覺非常的直覺,只要你懂一點曲風、樂器和年代,就可以用文字敘述的方式創造一首歌,對於一般想要嘗試創作的人,可以把作曲這件事變得更輕鬆。
不過實際聽這些範例音樂下來,可以發現音樂聽起來比較沒有那麼立體,反而比較扁平化,或是有些音樂有一點失真的感覺,音樂也比較偏電子的感覺,可能是音樂AI創作的音樂還沒有像人類這樣,具有情感豐富的元素在裡面。
現在還沒正式推出 MusicLM 的功能,可以先註冊加入等候清單,等到功能推出,就會透過 Email 推播,到時候就可以趕快來試試看 Google 新推出的 AI music 功能啦!
延伸閱讀:
如何加入Google MusicLM等候名單,用AI創造音樂
如何用Spotify搜尋音樂?收聽自己喜歡的歌曲,6個小技巧分享給你
7大Spotify播放清單使用小技巧,輕鬆播放你的音樂
7大工作背景音樂清單推薦,百萬人收聽播放清單,讀書工作都適用