2022年是生成性人工智能模型(Generative AI Models)成果迭出的一年,也是人工智能生成內容(AI-Generated Content,AIGC)大放異彩之年。從三維模型到演講語音,從照片修復到使用單一模型翻譯200多種語言,由人工智能生成的內容已不再停留于技術報告和論文之中,也不是少數研究人員和技術愛好者的“玩具”,而走入了人們的工作、生活和娛樂。
僅在“人工智能藝術”方面,就有DALL·E2、Midjourney、NightCafe Creator、NovelAI等模型發(fā)布。它們的“作品”登上雜志封面、進入藝術畫廊,成為媒體炒作與公關宣傳的對象,收獲了一批擁躉。由于即便是相似的架構,在不同的訓練數據和具體訓練方式之下,這些模型也顯現出各異的適用范圍,生成性人工智能模型開始展現出某種品牌意義。
以“城市”為關鍵詞,AI生成一張有港口的畫面,似乎在說“以港興城”。
2022年8月,Stable Diffusion模型開源發(fā)布,互聯網上很快開啟了一場AIGC的“狂歡”。在開源社區(qū)的共同努力下,一個人可以不需要具備人工智能方面的技術知識,只需要了解如何安裝使用現成的軟件包,就能獲得細節(jié)豐富的圖像,還可根據已有的圖像和文本要求進行修改。伴隨這一系列變化,“人工智能藝術”真正走近了大眾。
對于AIGC的熱潮,鼓吹者將其稱為數據與內容生產上的重大變革,預告“人類的某些創(chuàng)造性的工作可能會被生成性AI完全取代”,夢想出現所謂“零成本的自動化內容生產”。而批評者們則給予疑慮和擔憂,將內容生產的“創(chuàng)造力”視為人類尊嚴的防線而加以捍衛(wèi)。
也有一些人試圖在兩種觀點之間尋求平衡。他們提出了人機協(xié)同、共同創(chuàng)作的主張。不過,這樣的愿景如何實現,似乎很難說清辨明。其中主要困難或許在于:AIGC本身來源于一個缺乏解釋的技術過程,一般大眾和藝術批評者介入人工智能的運作方式,并沒有人工智能“侵入”日常生活和藝術創(chuàng)作中的方式來得直接而多樣。
AIGC的“魔法”與“咒語”
隨著一批針對“二次元”形象生成的模型接連產生,AIGC在動漫愛好者中受到廣泛歡迎和細致研究。他們形象地將文字提示稱為“咒語”,而從文本描述中生成圖像的過程,已儼然成為一種“賽博魔法”;修補程序bug、整合各類資源、編寫相關教程的開發(fā)者,則被尊為“賽博佛祖”。
“咒語”與“魔法”之言,雖有幾分戲謔,但人工智能繪畫同“魔法”之間的相似卻是顯著的。對于如此大型的語言或圖像模型,沒有人確切知道它們?yōu)楹文馨l(fā)揮作用,也沒有人能夠確切解釋它們所呈現的一些重要特征,如上下文內容相關性、進行語義和邏輯推理的能力,究竟是如何從貌似無關的訓練文本中涌現的。人們所知道的只是對提示文本進行某些修飾和處理,會更可能得到希望的結果。
大型的人工智能模型,即便對專業(yè)技術人員而言,也愈發(fā)呈現為一個難解的“黑箱”。有研究者指出,人工智能模型的不可解釋性,帶來了有關研究本身可復現性的疑慮:一些起關鍵作用的因素,可能仍掩藏在任意決定的數據排列和工程實現的技術技巧中。細節(jié)的技術性分析,通過在同源和有相關性的幾種模型間展開比較,對人工智能模型的各種特性的來源,做出有根據的猜測,提示了一種對人工智能模型構建過程的“譜系學”研究。有理由相信,假以時日,人們就能重新打開人工智能模型的“黑箱”,將它們從“魔法”還原為“科學”。
但實踐中,人們并不能等待有效的系統(tǒng)性解釋產生,而是直接在與人工智能模型的交互中,通過試錯歸納出臨時有效的使用方法。由此,產生了一個新的領域,即“提示工程”(prompt engineering),致力于為人們提供便捷的工具,以定性了解提示文本和模型輸出之間的關系,從而產生出更有效利用模型的定式——即便模型版本的迭代經常會顛覆這些定式的有效性。
2022年11月,OpenAI發(fā)布了名為ChatGPT的人工智能聊天機器人,把這一年的AIGC熱度推向又一個熱潮。作為一個從文本到文本的生成模型,已有人將它與其他種類的生成性模型相結合,通過上下文內(in-context)的訓練,以更直接、自然的語言指令獲得高質量的生成圖像。可以說,“提示工程”本身又得到人工智能加持,從而更接近自然語言的“對話”。
在語言模型加持下,“提示工程”的發(fā)展,可以說,從另一個方面完成了對“魔法”的“祛魅”。當“咒語”不再依賴于小圈子里流傳的經驗總結,而是隱含在人機“對話”的中間過程里,使用那些生成性人工智能模型,就不再是一項專門的技術工作:需要專門學習的程序語言讓位于自然語言,程序的調試為任務描述的修訂所替代,起作用的也不再是技術性的理解——讓Stable Diffusion產生預想的畫面,不需要計算機圖形學上的知識或編寫代碼,也不直接要求將圖像的風格、內容等分解、轉換為某種可計算的形式,盡管它們可能以某種方式隱含在模型的巨量參數之中,并作為一種結構性的因素發(fā)揮作用。
這樣,人們同人工智能模型打交道的方式,實際上擺脫了以往研究者歸納出的計算機的媒介特殊性,轉而以一種更一般的、更接近人與人之間的交互方式。生成性人工智能模型提供給人們的,是一種操作計算機的新方式——在此過程中,面對具體而個別的模型的認識占據了主導地位,取代了具有技術通用性的對程序代碼或運行機制的認識。
從內容的“創(chuàng)作”到藝術的表達
愈加成熟的生成性人工智能模型,讓此前諸多對計算機技術的文化批評面臨失效的危險?!按a”“可計算性”“數學原理”這些與計算機科學息息相關的要素,曾一度構成對計算機相關藝術實踐和計算機技術自身具有的文化效應展開討論的基點。代碼和數學原理固然是人工智能模型得以運行的關鍵,卻不再是人們指示計算機完成具體任務時直接面對的對象。就連那些原本被認為是“不可計算”的問題,也可通過復雜模型的“模擬”而在最終應用上顯得仿佛已得到解決。相當程度上,它們在今天人工智能模型的具體應用中,已不再像以往那樣能夠切中要害。
AIGC憑借外觀上的相似,一再實現人們此前認定為“不可能”的任務。一個伴隨計算機技術發(fā)展反復出現的問題,再度置于公眾輿論的焦點:人工智能會取代人嗎?更具體來說,人工智能是否將會取代人類創(chuàng)作藝術?
兩個世紀以前,攝影術的出現也曾讓繪畫藝術面臨類似危機。但結果上,正是對這一危機的意識,促使后者更快地從對外觀相似的追求中解放出來。時至今日,各式繪畫流派與攝影并行不悖、相得益彰,攝影成為一門藝術,而繪畫也保持著它的生命力。
與此相比,有關AIGC的爭議雖然給出了不同立場,但它們大多基于一個共同預設,也就是將人與人工智能理解為創(chuàng)作某種“替代”關系。其背后更深層的原因則在于,將內容的生產與創(chuàng)作封閉在既有的方式范圍之內,將藝術僅理解為某種“形態(tài)學上的相似”。
藝術是不斷動態(tài)變化的。新的技術手段、新的技巧、新的行事方式,都可能成為藝術的組成部分。提示的編撰、結果的遴選相互迭代,則構成了一組新的技巧——通過文本、圖像與AI模型交互的技巧。它雖然在文化上,尚無法具有可以與既有藝術創(chuàng)作相比擬的地位,但就其中所要求的那種對人工智能的理解、對人工智能模型直覺性的認識和體悟而言,也構成了一個同時獨立于人工智能的技術研發(fā)和已有藝術實踐的新領域。從這個角度說,AIGC與其說將會簡化乃至取代“內容創(chuàng)作”,不如說是為人們的表達額外提供了一種方式。
另一方面,正如藝術家柯蘇斯(Joseph Kosuth)所言:“使用這樣那樣的形式,給予這樣那樣的視覺體驗”,只是一種“最低限度的創(chuàng)造性措施”;“雖然大量外觀相似的物體或圖像可能因為視覺/體驗’解讀’上的相似性而顯得相關(或相連),人們不能因此而聲稱有藝術或概念上的關系?!比斯ぶ悄芄倘豢梢援a生出貌似繪畫的圖像、類同器樂演奏的聲音、形如詩人所作的詩篇,但所有這些產物,并不等于繪畫、音樂或文學。它們同繪畫、音樂、文學如果一定說存在某種聯系,那么,這種聯系就在于,通過提升生成物的質量,來沖擊假借那些藝術門類而進行的程式化的內容生產;將創(chuàng)作的門檻基準提高到藝術的水準,而非單純的心理滿足上;從而,讓真正有價值的部分從洋洋大觀的紛雜“作品”中顯現出來。
可以說,人類的創(chuàng)作如何應對AIGC的“挑戰(zhàn)”,或如何與之實現共存,這一類的問題不只需要人與機器協(xié)作完成某些作品,更不是簡單將人工智能技術與藝術通過一些話語綁定在一起。它們各自保持著一定的獨立性:在一個方面,將人工智能技術轉化、征用為一種新的藝術表達方式;在另一個方面,促使既有的藝術門類實現自我更新。這兩種不同方向的努力,將人們的想象力引向藝術探索的前沿,殊途同歸于對人類藝術版圖的拓展和豐富。
來源:澎湃新聞2023-02-11
作者:朱恬驊,上海社會科學院文學所助理研究員