使用colab實現AI翻唱

乌梅子酱

孙燕姿AI

！！！說明：

本教程僅為 AI 學習交流
為避免侵權，此項目所有數據和模型需要自行解決
技術本身沒有好壞，但禁止利用技術進行違法犯罪

簡介#

相信這幾天一定被各個視頻平台的「冷門歌手」—— 孫燕姿刷屏了吧，AI 合成了逼真的孫燕姿的聲音，然後去演唱別的歌曲。沒錯，上面那個破音版《烏梅子醬》就是利用此技術實現的，今天我們就來簡單介紹背後的技術，並教大家如何使用 colab 實現翻唱。

項目介紹#

Sovits（So-vits-svc）是由是中國民間歌聲合成愛好者 Rcell 基於 VITS、soft-vc、VISinger2 等一系列項目開發的一款開源免費 AI 語音轉換軟件，可以實現音色的重現，可以簡單理解為一個很厲害的變聲器。

colab 介紹#

為什麼用 colab#

電腦性能良好的朋友完全可以用自己的電腦進行訓練（必須是 N 卡），我的電腦是輕薄本，跑不了這個項目，於是使用谷歌的 colab 進行翻唱演示

什麼是 colab#

簡單理解，colab 就是谷歌為廣大開發人員提供的在線算力平台，像我這樣的平時學習的時候有算力需求，但是個人電腦無法滿足時就可以使用 colab。

colab 可以免費使用，也可以付費使用，免費的性能差一點，付費的按算力計費，但也不算貴。以前我用這個來跑stable diffusion，後來白嫖的人太多了，谷歌就禁止免費用戶用 colab 運行 stable diffusion，所以我也不知道谷歌什麼時候會限制用這個來進行唱歌訓練。

數據與模型準備#

此項目除了 AI 翻唱，也可以讓 AI 複述你的話，就當做一個變聲器使用。大家可以訓練自己的模型，我這裡作為演示，就只教大家如何利用模型進行翻唱，以李榮浩的《烏梅子醬為例》

1. 首先需要準備你想要翻唱的歌曲，因為這個項目只是翻唱，所以需要進行人聲分離，可以使用這個在線工具進行分離操作
2. 將分離好的人聲和背景音樂下載下來，現在只需要用人聲進行翻唱，翻唱完成以後再把人聲和背景音樂結合在一起就可以了
3. 一首歌通常三到四分鐘，顯卡性能往往不足，所以需要將歌聲切片，每段控制在一分鐘以內，然後分別訓練，最後再拼在一起