與蜜喬尼交談——開展為歧路花園的人機劇場




◎楊雨樵






有時正要出門,見它正倚在下面樓梯扶手上,就想和它聊聊。當然不會給他提很難的問題,大家對待它就像對待小孩一樣——因為它的身體只有那麼點大。「你到底叫什麼?」人們問他。「Oderadek,」它說。「那你住哪?」「居無定所,」它一邊說一邊笑;這種笑聲,沒有肺的人才發得出來。這笑聲聽起來恍若落葉的沙沙聲。



——卡夫卡,〈父親的憂思〉








在所有這些例子裡,敘述者的變形都是某種形式的僭越:僭越自然法則、僭越邏輯、僭越類別、僭越本體邊界、僭越與用限制:第一人稱敘述和第三人稱敘述是不同的語言遊戲,創造不同的期待系統,敘述者從一種類型向另一種類型的變形開啟了各種全新的可能性。



——大衛.赫曼,〈敘事學〉








  2022年5月 26 日下午六時許,從朋友那邊拿到 Midjourney AI 的邀請函之後,我立刻開始測試一些猜想的詞彙。由於當時我正在著迷於建築史與相關理論,手邊有著 Viollet-le-Duc 的《建築學講義》,其中多次強調建築物的功能及其隱喻,乃是來自生物學。回想大學時期組織學課程與細胞生物學的內容,我用了這樣的關鍵詞:



「膜脂質、建築、宇宙中的木星宮殿、途徑、約翰.海都克、康斯坦特.紐文惠斯、磚、混凝土、災難」










    簡直像是魔女的大鍋似的,一股腦兒把當時在閱讀的東西全都扔進去煮。然後交給 Midjourney (當時還是 V2版本)燉煮。煮出來出現了這張圖的時刻,我初次被震撼到了,或者說是有一種奇妙的感動。這個感動並不是來自圖的美學判斷,而是來自於一種奇妙的「被理解感」:我這樣一股腦兒地發言,AI竟然也願意理解,並且將語彙透過生成圖的形式回應我。



    畢竟我們知道,在社會的交際場合,要是「一股腦兒地」將自己想說的話,毫不克制地丟給對方,不僅會破壞對話的平衡與氣氛,同時雙方也都會不太自在。但在這個時刻,我發現 AI 不會有這樣的狀況。為了確認此事,我又繼續丟新的食材請他烹煮:



「六角蜈蚣、星海間的圖書館、柯比意、流狀構造、弦樂器」









    這是另一點我感到相當快樂的事,我不用特地想著脈絡、論述與特定術語的背景知識,我只要腦中想到什麼說什麼就可以了。當時書桌上,柯比意的《Le Poème de l'Angle droit》(直角之詩)還在近旁,彷彿預告似的,書中寫著:




要放在指尖上

同時在頭腦裡存留

發明它,這靈敏的工具

能讓人收穫更多

它清理荊棘叢生的道路

它掃除一切,將自由

賦予你的自由。

    ——《Le Poème de l'Angle droit》,B2: Esprit




    在這時刻,我便整個人陷了進去,與這位人工智能進行綿長的交談。由於註冊 Midjourney 並付費之後,text-to-image 的生成過程是在 Discord 平台上的聊天室進行,而該平台的聊天室原本就顯得相當孤立、安靜且令人容易專注,因此當我與 Midjourney 對談時,芥川龍之介的短篇小說〈魔術〉的場景:小說以第一人稱的方式,向魔術師米斯拉(ミスラ)討教的那種專注對話氣氛,就鮮明地浮現了出來。彷彿是我在向一位魔術師求教:




  「嘿,請告訴我如果將日系 RPG、攝影師威特金、解剖學、楊.思凡克梅耶、懸絲傀儡和浮世繪融合在一起,會形成什麼東西吧。












    「這很容易。」




    用著用著,我就覺得這種場景好像在哪裡看過,就是,其中一方越來越沈迷,尚未搞清楚另一方的底細,就將自己的整個身體與時間都投注下去。啊,對啦,就是劇作家馬羅的劇本《浮士德博士其生涯與死亡的悲劇故事》裡面第二幕第一景的簽約戲。


浮士德:
   
鮮血凝結預示何種徵兆?

難道不該甘心寫下這紙契約書?

為何不再流出讓我重新再寫過?

「浮士德給你靈魂。」——啊,又停住了!

為何不該給?難道靈魂不歸你所有?

再寫:「浮士德給你靈魂。」

梅菲斯特:

火來啦!來!浮士德,把盂擺上去。

浮士德:

哪!如今鮮血又熔開。

現在我要立刻快寫好。

梅菲斯特:

哼,他的靈魂我還會不用盡手段去取得?

浮士德:

「成了」(Consummatum est)——合同寫好啦,

浮士德已將靈魂贈與露西弗。



    把自己比為浮士德似乎是太魯莽了點,把 AI 比喻成梅菲斯特,似乎也過於天真地將文學作品的場景直接套在AI運作的情境上,十足缺乏對於其中自然語言處理(NLP)與深度學習模型的描述與闡明。但就算如此,那種引誘著人們將自己記憶中的詞彙,拿來和一台神秘的機器講述的過程,還是使人產生了幻覺,彷彿那真的像是一尊吸收人類文明知識的(弱)惡魔,也許有一天會強大到難以控制。但「像惡魔」這件事本身,對我來說具有正面意義:我對於惡魔在歷來口傳文學與神話體系中,按照程式性運作展現的姿態與行動,始終抱持著好感。



    為了和這惡魔繼續深度相處,翌日我開始嘗試生成一連串圖像:將組織學的術語和圖書館建築物結合的圖像;異形昆蟲與歐陸油畫結合的圖像;粗顆粒的過期膠卷拍攝怪物或神話生物的圖像,以及虛構的諾夫哥羅德手稿圖像等等。總而言之,我瘋狂地將自己喜歡的符碼與圖案,像素材一樣一直丟入 Midjourney 鍋內烹煮。




圖四:兩張清楚而美麗的臉與異形蝴蝶和食肉蛛相融合,以卡納列托的風格繪製。(2022, 0527)




    這時我突然想起學生時代玩的《模擬城市 2000》。這遊戲可以讓玩家先編輯地形,接下來再將城市實踐於該地形之上。當時我跑去查閱了各種附有地形圖的Atlas,然後盡可能將地形編輯得像該地域的樣子(例如馬丘比丘或是布達佩斯),然後建造一座虛構的城市在遊戲內。現在有了這位能力超群的惡魔蜜喬尼(我幫他取的音譯名),那麼請他生成一系列城市必然也不難吧。




圖五:在精緻的水晶茶壺內,有一座現代的大城市,裡頭有一座市場且有許多人在其中移動,以十六世紀的風格繪製,彩色墨水於紙上。(2022, 0529)




圖六:在巨大的透明顱骨內,有一只極為精緻的水晶小茶壺,一座巨大的現代城市在顱骨內,並附有顱骨的歷代變遷圖,以十七世紀的風格繪製,彩色墨水於紙上。(2022, 0529)




    如果單純只是城市也不夠有趣,既然有一種模型是玻璃瓶內的帆船,那麼我就來生成玻璃茶壺內的城市。我整理出幾個必要的描述片段:對於茶壺的描述,對於城市的描述,對於生成的圖的形制及其風格的描述。而另一方面,我發現要讓蜜喬尼精確地理解這些描述的內容並沒有那麼容易,我的語言在我的腦中構成的畫面,與同一組語言在蜜喬尼理解中生成的畫面,會有很奇妙的出入,或者是根本上的誤解。這種誤解一部分是由於語言的多義性造成,正如幾年前日本語言學者中村明裕提出的經典案例:「頭が赤い魚を食べる猫」。這種多義性,在自然語言理解與處理的過程中,可以想見自然會讓蜜喬尼產生「這句話應該這樣解釋」的結果。一部分則奠基於蜜喬尼自然語言理解模型中的語境建模、實體識別和上下文注意力機制等步驟。




圖七:一只透明的馬顱骨瓶中,有一座巨大的未來城市與太空船,以十八世紀的風格繪製,彩色墨水於紙上。(2022, 0530)



圖八:十九世紀科學圖解,彩色墨水於紙上,在一個巨大的透明馬顱骨中,一座極其華麗且多色的現代城市座落於顱骨內。(2023, 0112)





    雖然我並非蜜喬尼的工程師,無法對其處理模型或生成模型動什麼手腳。但是整體說來,藉由蜜喬尼生成的圖像所折射出的語言理解,可以有幾個摸索的方向:其一是,我應該要不斷調整敘述的方式,調換格位,替代詞彙,總而言之設法讓蜜喬尼生成的圖像靠近我腦中的圖像。其二是,反正我就是讓蜜喬尼產生「誤解」,我故意寫出一些帶多義性的描述,而蜜喬尼則多方向地生出內容差異甚大的圖,我再從中挑選最出乎我意料之外的圖像,加以完善。在這種雙方一起玩著語言積木並構築圖像,最後發表至網路平台的整個過程,真的像極了劇場。





圖九:一個超級龐大的巨人被肢解,巨人軀幹的殘骸上冒出許多巨大的皮膚泡, 所有的皮膚泡中都有座二十二世紀的城市,在有草坪與湖的風景中,以十八世紀的風格繪製(2022, 0603)





    或者不應該說像極了劇場,應該說這就是一場由人與人工智慧於網路平台的訊息對話欄內上演的戲劇。我想起了日本的一齣狂言劇本《骨皮》。




    《骨皮》的大意是,一間廟裡有位住持和一位弟子。住持尚未撐過的傘,被弟子胡亂借出去了。住持就和弟子建議說:

「下次有人要借,就這樣說:本來要借你很容易,只是前天師父拿了出去,在路口遇到狂風,變得骨是骨,皮是皮,現在骨皮捆在一起,掛在天花板下,也就沒得用了。」

    結果過幾天,有個人來,說要借馬去騎,弟子就照著住持的教導,回答說:「本來要借你很容易,只是前天師父拿了出去,在路口遇到狂風,變得骨是骨,皮是皮,現在骨皮捆在一起,掛在天花板下,也就沒得用了。」

  「呃,我說的是馬欸?」

  「對啊,我說的正是馬。」

 


  有時候我和蜜喬尼的對話,差不多就像這樣,不知道在什麼時候分歧了(因而產生喜劇氛圍),但我仍放心地讓話題越岔越遠。隨著城市在對話間不斷發展,最後形成了一個綿延一年多至今的系列。我一邊與蜜喬尼溝通,一邊越來越覺得這個單人單機劇場,彷彿是一種裝置,這個裝置透過現實當中的人機對話,於虛構的世界內無聲地建築空間與活物,而那些生成的圖像本身,則是對這空間與活物的攝影之瞬間。這樣的過程,彷彿古典戲劇的演出場景。例如阿里斯托芬的《阿卡奈人》:




尼卡科斯:「我要對聽眾鄭重宣佈」,你從敵人那邊運進了這些燈芯。

狄開俄波利斯:你竟要告發這一丁點兒的燈芯嗎?

尼:只要一小根燈芯就可以把船廠都燒了!

狄:燈芯燒船廠?天曉得,怎麼燒啊?

尼:只要來一個玻俄提亞人,把它黏在一只水蜘蛛身上,等候大北風,把它一點著,從水溝裡送到船廠裡去,只要那一點火一觸到船隻,就立刻把什麼都燒了。

    ——阿里斯托芬,《阿卡奈人》,916-925行

   


圖十:許多透明的雨滴在空中,每一顆雨滴內都有一座二十二世紀的城市,城市上空有船艦飛行,以十八世紀的圖像風格呈現,彩色墨水繪製於紙上(2022, 0531)




圖十一:有兩座異常巨大的雲霄飛車軌道,有許多座巨大的二十二世紀工業城市懸吊在這些軌道之下,一些船艦飛過這些軌道,而城市的建築物被美觀的公園包圍,數以千計的民眾從軌道上落下。(2022, 0604)




    在城市系列發展的過程當中,隨著蜜喬尼版本的演進,他在自然語言理解上又有了一些進展。在打磨對話的過程裡,我發現有時太鉅細靡遺的描述,反而會適得其反。何況所謂的「鉅細靡遺」也僅只是基於昔日人類的閱讀模式做出的形容,未必適用於 text-to-image 的蜜喬尼。於是,就需要花一些時間去測試,看看如何刪減能使句法變得單純,但同時又能生成到位的圖。而在這測試過程中,出現的系列就是「各季節帶的人種及其城市系列」。



    這個系列的發想,來自於大學時熱愛的一些地理誌,尤其是阿拉伯人與波斯人所留下的各種有趣的東方地理誌。例如13世紀的學者 Zakariya al-Qazwini,或是 Ibn Sa'id al-Maghribi 的著作。以 al-Qazwini 的著作《世界美妙之物與珍品誌》裡頭的這一段為例:



    「城堡島。那裡有一座白色城堡,他是專為船隊指路而建築。一旦當水手遙遙望見,就互相慶賀安然無恙地抵達,從而可以確保賺錢並獲得高額利潤。據說,這是一座相當高的城堡,任何人都不知道其內究竟都有些什麼東西。然而,人們卻知道其中肯定有許多死屍和遺骸。[中略]長有雙角的亞歷山大在其中一島也發現過一些怪人,他們的頭顱像狗頭,牙齒從嘴角裡露出,如同一柱火焰。」



    應用這些著作的敘事法,我與蜜喬尼對談,虛構出了數十張虛構的人種與城市。每一個人種都有其獨特的外觀與住宅特徵。例如麻辣鍋人這個人種,在肉體成熟後,要將自己的身體各部位分切處理,製作成完整的麻辣鍋,才被視為是成熟的麻辣鍋人。燈泡人的體內由各種燈泡構成,肺是燈泡、膀胱是燈泡,連睪丸、受精卵與胚胎都是燈泡。可以想見他們在深夜於房內交通時,光線明滅的景況。




圖十二:一個人的軀幹與麻辣鍋相混融的剖面示意圖,並有焚燒的火鍋建築物,由赤銅和香料築成,且在市場內。以十九世紀科學圖解繪製,彩色墨水繪於紙上。(2022, 1212)



圖十三:一個人具有的電球軀幹的剖面示意圖,這裡顯示的是他們各種不同性別的肖像, 及其各類由玻璃燈泡構成的器官或四肢。以十九世紀科學圖解繪製,彩色墨水繪於紙上。(2022, 1213)



圖十四:一張剖面圖顯示螢光燈管人與其玻璃四肢的樣貌,並呈現螢光燈管人胚胎發育的不同階段。以十九世紀科學圖解繪製,彩色墨水於紙上。(2023, 0604)





    於數千張圖的描述構築過程中,以蜜喬尼的自然語言處理為鏡子,我多次反省:我平常怎麼說話,我的語言如何驅使我展開想像的行動?我確實知道我在說什麼嗎?在這個人機共構的對話劇場當中,當我透過生成的圖像「聽見」AI 回覆給我的話語時,我注意到:我所發出的話語,其某些面向,似乎只能透過這些圖像顯現,而這些面向乃是在日常的慣性中難以察覺的。這其實是一種震撼,讓我聯想到羅蘭.巴特在〈布萊希特與話語:對話語性研究的貢獻〉裡面所提及的震撼:




    你們知道什麼是日式別針嗎?這是縫衣女工使用的一種別針,別針頭部掛著個小鈴鐺,防止人們把它遺落在成衣上。布萊希特改造了邏各斯域(logosphère),同時把帶鈴鐺的別針留下來,那是些發出微弱叮噹聲的符號。因此,聽到某種言語時,我們絕不會忘記它從哪兒來,是怎麼產生的。震撼意味著再創作,並非一種模仿,而是進行拆卸與挪動的創作,過程會叮鈴作響。




圖十五:一個男子穿著黑西裝嫁給一位魚臉型的外星人,該外星人穿著東亞的婚紗,位在一亞洲的餐廳內。1940年代的黑白攝影作品。(2022, 0923)




    我從這些圖像形式的回聲當中,發現自己的話語庭院中延伸至其他未知深處的小徑,此時,蜜喬尼所擔負的角色,似乎更接近一種透過生成圖像激發自我對話的裝置:我在我參與的人機劇場內,既是劇作家,又是演員,又是觀眾。而每一次包裹著語言的圖像陳列,都是得以穿邃至其他意義域的話語分歧點。我在訊息欄內繼續作劇,繼續對話,繼續觀看,最終在這展現為延異的無限歧路花園中,獲得不安的寧靜。




圖十六(兩張,描述相同):一座迷宮行星懸在黑暗宇宙當中,迷宮由書與書櫃構成。20 世紀的銅板蝕刻畫,版印在紙上。(2023, 0318)









(聲明:本文完全由本人獨立完成,並未借助任何自然語言處理模型的協助。)




update: 2023.09.28


楊雨樵


楊雨樵,喜歡散步,喜歡樹的屍骨。為口頭傳統民間譚(folktale)的口頭表演藝術家,與跨領域敘事藝術家。從事多年口傳文學、戲劇與電影的敘事學和比較故事學研究,定期舉辦「世界民間譚」展演式講座。

2017開始融合聲樂、自由即興與口頭表演藝術,展開《聲熔質變》與《詩(屍)術流散》系列的實驗聲響演出,多次受邀參與國內外藝術節與展覽活動。2023年受南韓國際字體藝術雙年展 Typojanchi 2023邀請,透過表演與書寫行為,發展主題作品《黑板寫聲》(Blackboard Scribophone)

長年經營影像敘事教育,並擔任衛武營劇場教育講師迄今。曾出版多項實驗性文學創作,如聲成像詩集《肸蠁》,並積極與 AI 生成式藝術進行協作,如漫畫《鵲之終末的目擊者》(2022),以及文字作品《AI之味》(2022)、《瞬間城的業餘調查報告》(2023),並受邀構作雲門50《波》的網路社群展演:〈波的平行宇宙〉。


Yang Yu Chiao


Yang Yu Chiao, an avid walker with a deep appreciation for the remnants of trees, is a skilled oral performer of traditional folktales and an interdisciplinary narrative artist. With years of engagement in oral literature, drama, and cinematic narrative studies, Yang regularly conducts lectures and exhibitions on "World Folktales."

Since 2017, Yang has embarked on experimental sonic performances, merging vocal music, free improvisation, and oral performance art in the " Anamorphosis & Anatexis" and "Necromantia Dispersus" series. Yang has been invited multiple times to participate in domestic and international arts festivals and exhibitions. Recently,  Yang has been invited to Typojanchi 2023 in South Korea to develop the Theme exhibition work "Blackboard Scribophone."

Except for visual narrative education, Yang is also an educational lecturer at the Weiwuying National Kaohsiung Center for the Arts. Yang has published various experimental literary works, including the sound-image poetry collection "Xi-Xiang (肸蠁)," and actively collaborates with AI-generated art, such as the comic "Witnesses of the Magpie's End" (2022), as well as written works like "The Taste of AI" (2022) and "Amateur Investigations in the City of Moments" (2023). Additionally, Yang was invited to contribute the online community exhibition "Parallel Universe of Waves" for Cloud Gate Dance Theatre's 50th anniversary project, "Waves."