2024年5月13日 星期一

AI語音

這週末做了一個很有趣的實驗。

自從AI興起以後,不只下圍棋,聊天,還多了很多應用方式,其中有一項特別吸引我的,就是「聲音合成」。

雖然自動生成聲音這件事,本來就不是很新的技術,但我一直覺得離我很遙遠,但這週末一個偶然的機會,接觸到GPT-SoVITS以後,根本驚為天人。

跟其他需要半小時以上聲音素材的訓練模型相比,GPT-SoVITS號稱只要1分鐘的聲音素材就能夠訓練,再搭配Google硬碟,一切突然變得像是網購一樣簡單。

找了手邊朋友聲音的素材嘗試,經過一小時的模型訓練,馬上就產出三個音檔,也順利騙過其他共同朋友。

與投入的素材和生成的時間相比,成果簡直不可思議,不論在語調,語氣或聲線等等都維妙維肖,相當自然。

雖然有被詐騙誤用的可能性,但我想到的是,如果拿爸媽的聲音來訓練,也許有一天他們真的離開了,我們還是能聽見他們的聲音跟我們說話。

或者用孩子還小的時候的聲音訓練,有一天他們長大了,離家了,那個聲音還是能陪伴父母很久。

有了這項技術,彷彿跨越時間空間再也不是問題。畢竟有時為了彌補疑惑,我們願意付出一切,只願能換來熟悉的聲音再一次喊出我們的名字。

沒有留言:

張貼留言