電腦屏幕上的“奶奶”說話了:“我和他(你爸)說,別喝酒,要節約,別打牌?!眳俏榱ɑχ聊缓退闹??!澳棠獭闭Q?,點頭,卻很少回答。
(資料圖)
這是他按照記憶里奶奶的表達方式修改的回答?,F實中的她耳背,習慣用兩三個字說話。
奶奶去世兩個月了,吳伍六會和往常一樣拿起手機撥通她的電話,卻再也無法接通。3月份,他收到老家寄來的遺物后,想到用AI還原奶奶,“這是一個非常冒險,也很瘋狂的事情,但我內心還是想去試試?!?/p>
吳伍六給ChatGPT詳細地描述了奶奶的形象、說話習慣,然后導入奶奶的照片、電話錄音并用AI工具生成動態影像。十幾天后,“奶奶”出現了。對話第一遍時,他很興奮,但還是發現,AI生成的像是一個老道的長者,而不是親人。
以下是與他的對話。
AI復原的奶奶。圖/吳伍六視頻截圖
【1】“我在做一件很瘋狂的事”
九派新聞:為什么想要用AI復原奶奶?
吳伍六:我奶奶是3個月前在老家去世的,過年本來想和她團圓,但我下了高鐵就直接去了醫院,她病危了。我有很多想說的話跟她說,但是奶奶在醫院時已經意識模糊,沒辦法跟我交流。直到她去世,我更感到有點無助,或者說是不知所措。
在奶奶生前,我就習慣了每天中午和她打電話,基本都會聊5到10分鐘。我回上海后,有很長一段時間,中午就重復打那個號碼,電話那頭一直是無人接聽的狀態,那段時間心情還是很低落的。
我有一些很想說的心里話,沒辦法和同事、朋友分享,因為剛開年,他們正處于過年歡樂氣氛下,我也不想和他們聊這種很傷感、難過的事。所以,這段時間我一直很沉默。我不知道該如何去表達和排遣。
九派新聞:當時覺得AI復原能夠實現嗎?
吳伍六:我是做設計的,最早接觸的是AI繪畫,之后我也接觸到AI新出的工具和應用。收到老家寄來的奶奶的遺物之后,我心情很低落,所以我就在想,我能不能用AI這樣的工具去做這件事。因為我看了國外的一些視頻,理論依據上是可行的,但是國內還沒有人去嘗試。
我當時覺得,這樣的嘗試是非常冒險,也很瘋狂的,但是我內心的想法還是去試試。讓我再和奶奶,或者說是虛擬意義上的“奶奶”再溝通一下,哪怕就一分鐘甚至半分鐘都好。
【02】“輸出相似度只有30%”
九派新聞:奶奶的頭像和聲音如何還原?
吳伍六:我找殯儀館的工作人員要了奶奶的遺照,那個照片經過了高清修復。照片還算清楚,背景也干凈,做虛擬頭像的效果還是不錯的。
我奶奶聲音這部分的處理有很大的工作量。但我存有一年半的通話錄音,我電話錄音是自動開啟的。每一條去聽,把有關奶奶的聲音給提取出來,然后利用百度的一個開源平臺去做聲音克隆。
截取的音頻。圖/吳伍六視頻截圖
后面也遇到了一些困難。我提供的是湖北方言,技術識別難度很大。另外,奶奶跟我聊的內容都是一些很家常的話,她的回答有限。
因為奶奶耳背,很多事情我們都聊得簡短,聊得最多的就是:吃了沒有,喝了沒有,或者過得怎么樣,家里怎么樣。她的回答都很單一,基本上都是一些簡短的生活類關心的話,這個樣本數據本身是不豐富的。
九派新聞:chatGPT模仿奶奶的效果如何?
吳伍六:GPT這種大語言模型,確實通用性很強,但是要去做一些個性化定制,還是有局限性的。比如,我給它輸入了一些簡短的信息,關于奶奶的生平背景、語言習慣、生活習慣,但是輸出來的相似度只能達到30%。主要的差別在于,AI感覺更像是扮演一個智慧的長者,它能夠提供很多心理或者行為上的安慰,而且,你問一句話,它能回答很長一段話。但在現實中,我奶奶是一個沒有什么文化的,84歲且反應略顯遲鈍的農村老人,她不太能進行那么長時間的深入交流,她更多的是點頭和微笑。
在視頻對話的過程中,我截取了一些GPT回復的內容,然后再把對話內容輸入到AI合成的軟件中生成音頻。但是我沒有完全按照它給的文本去輸出,還是按照我記憶中奶奶習慣性的回答去做的。目前AI的技術還不能完全理解人類情感,也只是支持標準化的神態,比如抬手、比“耶”這些動作是做不到的。
chatGPT模擬的對話。圖/吳伍六視頻截圖
【3】“反復觀看我會有些傷感”
九派新聞:視頻做了多久?
吳伍六:整個花了兩周。我記得很清楚,當時是凌晨4點,把視頻剪完之后,我想發給朋友或親人,但是我一下子就不知道該發給誰了,所以我就發給了我自己。那天快日出的時候,我看了很多很多遍。
我看第一遍的時候很興奮,非常興奮,覺得我好像做了一件超級瘋狂的事情。有點熱淚盈眶的感覺。
但是當我反復去看這個對話的時候,我又有一點傷感了,因為我又想起了我奶奶。我之前看到遺物的時候會傷感,現在當我和她再次對話的時候又想起了奶奶在醫院的那段離別的場景,小時候的回憶又涌上心頭。其實這種感情是復雜的,悲喜交加的,或者說是既興奮又害怕,又有一點熟悉又陌生。
九派新聞:為什么會害怕?
吳伍六:她是我的奶奶,在一定程度上好像是的,但是也不完全是,這個遺憾通過某種方式去彌補之后,你會有一種失落。好像有一些還未完成的某些東西想要繼續去探索,就像樹洞一樣,這種方式可以作為你最親近人的一個形象去傾聽你的聲音,當你找不到人聊天的時候,有一些心里話不知道跟誰說的時候,她可能是一個舒適的,排遣焦慮和自我安慰的對象。但也只能作為一個短期的鎮痛劑,不可能成為起死回生的靈丹妙藥。
九派新聞:這段視頻親人看過嗎?
吳伍六:我發給過我的親人,他們有點驚訝。特別是我爸,他給我的反饋就是驚訝,然后繼續看下去,又會發現有很多地方還是不相似。就像我剛才提到的那種熟悉而陌生的感覺。AI還是不能夠承接一個完整的,擁有過84年生活經歷和鮮活生命的人。
也就是說,機器是可以學習人的行為、動作、外貌、聲音,而且學的比人還要快,還要精準,但是就算是你讓一個表演老道的演員去演我的奶奶,她也可能演不出那種狀態。更何況讓一個AI表演,難度是非常非常大的。AI無法承載這些記錄了幾十年朝夕相處的,普通但溫暖的時光。
九派新聞記者 馬婕盈
編輯 曾金秋
【爆料】請聯系記者微信:linghaojizhe
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12