AI藝術的前世今生
作者:馬立新(山東師范大學美術學院教授,數(shù)字藝術哲學研究中心主任,博士生導師)
最近,全球刮起一股強勁的AI藝術風潮。究竟什么是AI藝術?它是如何來到這個世界的?又面臨著怎樣的機遇與挑戰(zhàn)?
1、AI藝術關鍵詞
AI藝術是指借助于人工智能技術(artificial intelligence,簡稱AI)生成的藝術作品。它的范圍很廣,包括AI自主生成的作品和人機合作創(chuàng)作的作品,這些作品目前已經(jīng)涵蓋繪畫、音樂、詩歌、電影、舞蹈、雕塑等領域。要了解這種新興、新型的數(shù)字藝術,首先需要了解機器學習、算法、神經(jīng)網(wǎng)絡、深度學習、生成對抗網(wǎng)絡和創(chuàng)新對抗網(wǎng)絡這幾個重要概念。
人類借助于感官和經(jīng)驗來獲取知識,而機器學習是指計算機系統(tǒng)學習勝任某一專門任務的路徑:一種是通過與具體任務完成情況相關的獎懲機制來實現(xiàn),這種機制稱為強化學習;一種是通過飼喂大量標記數(shù)據(jù),首先掌握其中的邏輯,進而實現(xiàn)對相關信息或事物的再現(xiàn),這種機制稱為監(jiān)護學習。例如飼喂一組猴子圖像讓計算機學習識別猴子,當我們將一張照片放在它前面的時候,計算機能精確地判斷這張照片是否與猴子有關。
算法即一個按步驟執(zhí)行的指令序列。它可以簡單到幾行代碼,也可能復雜得像一個百度搜索結果那樣,需要上百萬行才能顯示完全。這些指令告訴計算機做什么,如何解決問題,怎樣運算,如何在屏幕上展示事物等。
神經(jīng)元是傳遞和處理感覺信息的人腦細胞。神經(jīng)網(wǎng)絡則是特指一種計算機算法,它模仿人腦方式處理各種信息,包括多層互相聯(lián)結的神經(jīng)元。神經(jīng)網(wǎng)絡算法不同于常規(guī)計算機編程算法,后者是編程者設計好的一系列供計算機執(zhí)行的程序,而前者則是一種計算機自我決策的運算機制,它不需要人類的任何指令。如卷積神經(jīng)網(wǎng)絡就是一種能夠自主識別圖像上的某一特征或模式的神經(jīng)網(wǎng)絡。
深度學習指的是包含多層聯(lián)結神經(jīng)元的神經(jīng)網(wǎng)絡。它就像人腦一樣,包含的神經(jīng)元層級越多,學習能力就越強。
生成對抗網(wǎng)絡(GAN)指兩個神經(jīng)網(wǎng)絡通過互相競爭,逐步實現(xiàn)一個可預期的結果,其中一個神經(jīng)網(wǎng)絡試圖生成與訓練數(shù)據(jù)不一樣的結果(通常被稱為創(chuàng)造神經(jīng)網(wǎng)絡),比如一張不同于訓練圖像的新照片;另一個神經(jīng)網(wǎng)絡負責識別創(chuàng)造神經(jīng)網(wǎng)絡生成的與訓練數(shù)據(jù)差異很大的結果(通常被稱為識別神經(jīng)網(wǎng)絡),比如創(chuàng)造神經(jīng)網(wǎng)絡預期是生成一張關于狗的新照片,如果輸出了一張貌似房子的圖像,識別神經(jīng)網(wǎng)絡就將其篩選出來,并反饋給創(chuàng)造神經(jīng)網(wǎng)絡,從而確保其朝著預期的創(chuàng)作目標前進。
創(chuàng)新對抗網(wǎng)絡(CAN)以生成對抗網(wǎng)絡為基本框架,但將一定的隨機性嵌入到創(chuàng)造神經(jīng)網(wǎng)絡的結果中,再對這些結果加入適當?shù)拿缹W判斷訓練機制,以期生成更為新穎和震撼的藝術作品。這顯然是模仿人類創(chuàng)造性的一種方式,目的是生成突破現(xiàn)有藝術風格和模式的藝術作品。
2、從貝葉斯推理到AI藝術
當我們談論AI藝術淵藪的時候,就必須首先從AI的歷史談起。AI發(fā)生的先決條件是獲得學習和決策的能力,特別是在信息不充分的情況下做出決策的能力。為此,托馬斯·貝葉斯于1763年開發(fā)了一個使用算數(shù)方法推算事物發(fā)生概率的框架,這就是著名的貝葉斯推理,它成為機器學習的基本邏輯,這是AI藝術進程中最早的一塊里程碑。
1842年,數(shù)學家阿達·洛夫萊斯發(fā)表了第一個可執(zhí)行的算法。洛夫萊斯算法預見到計算機除了運算,還能解決其他復雜的問題,這是一個革命性的預見。百年之后,即1942年,圖靈為智能機器的創(chuàng)造設計了測試指標,即著名的圖靈測驗,這是一種劃時代的思想。1943年,麥卡洛克和皮茨聯(lián)合發(fā)表了《人類神經(jīng)活動中意識的邏輯運算》,為計算機模仿人腦構建神經(jīng)網(wǎng)絡和深度學習鋪平了道路。1950年,科幻作家艾薩克·阿西莫夫創(chuàng)作了關于智能機器的一系列短篇小說,提出了著名的機器人三定律,他的這些頗具前瞻性的思想激發(fā)了整整一代機器人學家。在1956年的達特茅斯大學夏季會議上,約翰·麥卡錫正式構建了“人工智能(AI)”概念。當時關于AI編程機制存在兩條路徑:一條是自上而下的,即用控制人類行為的規(guī)則預先為計算機編程;另一條主張自下而上,即模仿人類神經(jīng)網(wǎng)絡機制。麥卡錫和資深計算機學家明斯基傾向于前者,并略占上風。1959年,阿瑟·塞繆爾提出了“機器學習”的概念,根據(jù)這一概念,他預測一個會學習的跳棋機器人有可能戰(zhàn)勝它的編程者,這一預言被后來的超級計算機“深藍”戰(zhàn)勝國際象棋冠軍卡斯帕羅夫所證實。
對于AI藝術來說,1973年值得永遠銘記。這一年,加州大學教授兼畫家哈羅德·科恩在威尼斯雙年展上展示他與自己的計算機程序“艾倫”(AARON)合作創(chuàng)作的一幅繪畫,這標志著AI藝術的正式誕生。
鑒于AI研發(fā)進展緩慢,羅德尼·布魯克斯認為很可能過去采用的自上而下的研發(fā)路徑是錯誤的,他受到人類神經(jīng)科學進展的啟發(fā),1990年發(fā)表了著名論文《大象不下棋》,認為視覺功能并不需要中央神經(jīng)系統(tǒng)控制。他的這一構想也將一度不被看好的神經(jīng)網(wǎng)絡推向前臺,并極大地推動了包括AI藝術在內(nèi)的各個人工智能領域的進展。
2008年9月,一款語音識別APP出現(xiàn)在蘋果手機上,它的語音識別正確率達到了92%以上,這是AI藝術發(fā)展中所取得的另一個里程碑式的躍進,它為多模態(tài)大語言模型機器人的研發(fā)創(chuàng)造了條件。當學界和業(yè)界都在熱衷于開發(fā)優(yōu)質(zhì)算法的時候,在AI領域嶄露頭角的華人科學家李飛飛清醒地認識到,再好的算法如果沒有大量真實數(shù)據(jù)的支撐都不可能做出準確的決策,于是她提出了一個史無前例的想法——構建圖像數(shù)據(jù)庫,將整個世界都復現(xiàn)出來。她將自己領銜開發(fā)的這個開源性質(zhì)的巨型圖像數(shù)據(jù)庫定義為ImageNet。自此以后,這個數(shù)據(jù)庫成為一線AI科學家競相檢驗算法精度的平臺,它極大地加速了AI藝術的發(fā)展。
在2010年上海世界博覽會上,一款跳舞機器人出現(xiàn)在人們的視野中,其翩翩舞姿引起眾人駐足觀看。2013年,英國金斯密斯學院教授西蒙·科爾頓開發(fā)了一款名為“傻子畫師”的繪畫程序,該程序能夠從報紙上自主提取關鍵詞,并生成與該關鍵詞相關的圖像,顯現(xiàn)出超越圖靈測驗的創(chuàng)造性、靈巧性和想象力。2014年,即圖靈測驗發(fā)表72年之后,聊天機器人“尤金·古茨曼”最終通過了所有測試。2015年1月,莫德文采夫的藝術創(chuàng)作機器人“深夢”正式上線,自此之后,“深夢”成為很多AI藝術家放飛藝術想象的絕佳平臺。波普藝術家泰琳·薩頓上線“深夢”,于2017年創(chuàng)作了首張AI音樂專輯《我是AI》。一年之后,法國著名的藝術家三人聯(lián)盟機構“Obvious”利用神經(jīng)網(wǎng)絡算法生成的藝術作品《埃德蒙德·貝拉米肖像》高價拍賣成功,創(chuàng)造了AI藝術的新紀元。
3、AI藝術家先驅(qū)及其創(chuàng)作主題
數(shù)字技術的快速發(fā)展不僅深刻地塑造著當下的經(jīng)濟業(yè)態(tài),也推動數(shù)字藝術從奇觀美學和互動美學時代迭代進入到AI美學新時代,并催生出一批在AI藝術領域勇于探索和創(chuàng)新的藝術家。
馬里奧·克林格曼就是活躍在這一領域的一位先驅(qū)人物??肆指衤?970年出生于德國慕尼黑。他沒有任何藝術和計算機科學學術背景,但他天生就對計算機和藝術感興趣。13歲的時候,他有了第一臺計算機,自此開始,他無師自通,迷上了編程。高中畢業(yè)后,他進入了廣告行業(yè)。1991到1992年期間,克林格曼獲得一個到總部在倫敦的廣告公司實習的機會,在那里,他第一次接觸到蘋果電腦和專業(yè)繪圖軟件Photoshop3.0,一個成為AI藝術家的夢想由此誕生了。2004年,他使用JAVA語言編程創(chuàng)作了《垛狀模糊》。這是他最早的“計算機生成藝術”。2010年他編寫了一款名為“蜘蛛絲畫板”的小程序,并試著用它創(chuàng)作了一幅同名繪畫。讓他始料未及的是這個小程序竟然迅速獲得了一大批擁躉。從2014年年底開始,他對各種算法、數(shù)據(jù)可視化處理和機器學習技術開展了廣泛的探索,創(chuàng)作了多幅極富創(chuàng)意的作品。2017年以來,他又將最新的生成對抗網(wǎng)絡引入到自己的藝術實踐中,創(chuàng)作了大量以人臉和肖像為標志性形象的AI藝術作品?!爱斈忝鎸σ粋€人的面部的時候,能夠解讀出極其豐富的信息?!彼麑τ谌诵缘倪@種獨特理解成為他AI作品的一個核心主題,而人臉也成為他開展藝術實踐的肥沃土壤。
在將AI技術與舞蹈藝術融合方面,韋恩·麥克格雷格是一位始終走在前列的舞蹈家。他的《實時檔案》項目利用AI模型復現(xiàn)了他長達25年之久的舞蹈作品,借此在舞者和他的作品之間建構了一個現(xiàn)場對話。AI模型對麥克格雷格的舞蹈風格,從精致的細微動作到復雜的移位動作都能精準捕捉到。舞者能夠從中獲得靈感,受到啟發(fā),從而創(chuàng)造出新的舞蹈動作。這正是麥克格雷格對AI技術最感興趣的一點,他認為持續(xù)地創(chuàng)造新穎別致的動作是舞蹈藝術的靈魂,而AI技術能夠幫助他實現(xiàn)這個目標。
莎拉·梅約哈斯是一位橫跨電影、攝影、虛擬現(xiàn)實、表演和雕塑等多個學科領域的AI藝術家。她最引人矚目的AI藝術作品是《云朵》。為呈現(xiàn)這一作品,她在貝爾實驗室原址上主辦了一場大型表演。16個攝影師拍攝了多達10萬張不同角度的玫瑰花瓣照片,構成了一個大型數(shù)據(jù)庫。這些信息旨在構建一個AI算法,用于生成獨樹一幟的花瓣圖像?!对贫洹返牟哒钩蔀橐淮嗡伎己笕祟惉F(xiàn)實和未來人類勞動處境的絕佳機會。梅約哈斯以AI技術為武器,以藝術策展為媒介,將AI藝術探索與人類所面臨的重大現(xiàn)實主題緊密結合,引起了業(yè)界和學界的廣泛關注。
羅比·巴拉特是一顆正在AI藝術領域冉冉升起的新星,也是一位AI藝術奇才。他只有19歲,卻以自己對于神經(jīng)網(wǎng)絡的深刻理解與創(chuàng)造性應用,開拓了AI藝術和傳統(tǒng)藝術的視野。他與法國畫家羅南·巴羅特和加萊里·沃森三人(即上文提及的著名法國三人藝術聯(lián)盟Obvious)共同創(chuàng)作的頗具印象主義風格的《埃德蒙德·貝拉米肖像》,創(chuàng)造了43.25萬美元的拍賣高價,此舉也將AI藝術推向世界舞臺。這一系列頗具創(chuàng)意的AI藝術探索也讓這位年輕人步入資深AI藝術家的行列。
在當下AI藝術創(chuàng)作領域,湯姆·懷特以其對于人工智能和機器感知的深度研究和廣泛探索而聞名。他的一系列AI藝術實驗都聚焦于機器凝視問題上——AI是如何觀察、如何理解和如何表達外部世界的?隨著機器感知越來越多地滲入我們的日常生活之中,這個新世界正在變成我們不得不面對的一個主導領域,懷特正是用他的AI作品來透視和反思這種現(xiàn)象的。為此,他創(chuàng)作了大量抽象作品,AI能夠?qū)@些作品做出正確的分類。然后,他再賦予算法如同我們一樣的自然語言能力,如此一來,我們就能夠知道AI所理解的世界。懷特的這些探索深化了我們對于AI世界的理解。
4、AI的自主創(chuàng)作
AI藝術在發(fā)展中最常遭遇的一個挑戰(zhàn)就是,如何從其生成的巨量作品中挑選出相對而言最有趣味的作品,并將其引向普通社會大眾。對于幾乎所有AI藝術家來說,策展成為他們應對這一挑戰(zhàn)的關鍵一招。
AI藝術家也時常陷入這樣的兩難選擇:作為藝術家的他,總是不自覺地遵從自己的口味來選擇作品,而作為策展人的他,又總要考慮盡可能向觀眾展示AI藝術的全貌。究竟應該如何協(xié)調(diào)這種兩難關系?一般來說,作為一個策展人,他的理想是把他的AI模型放在現(xiàn)場,讓它持續(xù)地生成圖像,并訓練這臺AI模型自己做出選擇;一旦AI模型從中做出了選擇,它就會自動消失。如此一來,這臺AI模型本身就是藝術作品,而其中選出的那些圖像不過是它所創(chuàng)造的一些稍縱即逝的視覺印象。不過,現(xiàn)在的策展還不允許一個藝術家如此超然,因為就目前的AI模型來看,如果只將它放在展覽現(xiàn)場,那么觀眾所面對的大多是噪聲,而且在此情況下生成的圖像大部分都是無趣的。
現(xiàn)實是殘酷的。如果AI藝術能夠繁榮發(fā)展,它就必須走向大眾。因此,在高雅與通俗之間保持一定的平衡就是AI藝術的不二選擇,既不能離世俗太遠,也不能離它太近。這是大多數(shù)AI藝術家的看法。
基于深度學習的AI能否最終實現(xiàn)完全意義上的自主創(chuàng)作?這是當下所有關注AI藝術的人普遍關心的問題。比如,對于上文提及的賦予AI模型一定的策展能力和對作品的自我選擇能力,這難道不是某種AI自主性或主體性的彰顯嗎?很多活躍在AI藝術一線的藝術家都在試圖通過自身的藝術實踐來回應這個問題。克林格曼認為,這個問題從某種程度上可以從人類的傳宗接代邏輯來理解。我們生孩子是保障人類自身的繁衍和不朽。我們賦予AI一定的策展和選擇功能,本質(zhì)上也可以視為一種確保人類不朽的方式。例如,我們無法將自己上傳到計算機上,但我們可以創(chuàng)造某種事物,讓它能夠持續(xù)生產(chǎn)我們想要的某種東西,哪怕我們已經(jīng)離世也不受影響。某種意義上,賦能AI模型一定的策展能力就是一種讓藝術家持續(xù)延長藝術生命的方式。
另一方面,通過賦予AI一定的策展和選擇能力,我們可以看看它究竟能夠做些什么,又是如何去做的。從AI自身的角度看,它或許會因為這些能力而獲得一定的獨立性和自主性??肆指衤?018年創(chuàng)作的AI藝術《靈魂出竅》,就顯現(xiàn)出一抹自主性的陽光。在該程序中,他引入了一個神經(jīng)脈沖機制,它可以通過隨機改變、刪除或交換被訓練的生成對抗網(wǎng)絡的成分,而引起神經(jīng)網(wǎng)絡對于輸入信息的誤讀,并因為這種誤讀而創(chuàng)造出某種富有新意的藝術形象。
另一個頗受爭議的問題是,AI能否對自己的藝術作品做出評價?大多數(shù)AI藝術家都對此持樂觀態(tài)度。從純粹技術角度看,AI總會在某一天達到自我改進和提升算力、自我評價作品質(zhì)量的程度,但這也同時意味著,它將駛?cè)胍粋€我們再也看不到的區(qū)域;它可以理解宇宙,也可以創(chuàng)作一個屬于自己的宇宙,但它也必須創(chuàng)造某種方式讓人類理解它的這些行為。當然,它或許也會在某一天,因為我們跟不上它的速度,而最終對我們失去興趣,但至少目前還不可能發(fā)生這些情況。為解決這些問題,AI科學家們正在研發(fā)某種人腦與機器直接聯(lián)結的界面或機制,以實現(xiàn)對AI理解的理解。
總的來說,活躍在AI創(chuàng)作一線的藝術家都對AI藝術的未來充滿信心。他們堅信,隨著人工智能、深度學習、計算機算力算法和數(shù)據(jù)分析技術的快速發(fā)展,特別是隨著多模態(tài)大語言模型的突破性進展,在不久的將來,AI藝術家能夠創(chuàng)作出較之人類藝術家更有趣的藝術作品。而對于AI算力的快速提升可能引發(fā)的某些安全風險,我們也應提前做好各種應對準備。
版權聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關法律責任。