借助AI技術(shù),甲骨上殘缺的裂紋逐漸閉合,模糊的文字顯現(xiàn)在眼前……這是一場與三千年前的古人的“對話”,也是一場智力冒險(xiǎn)。每發(fā)現(xiàn)一片新綴合的甲骨背后的文字密碼,為“冒險(xiǎn)者”帶來的喜悅和成就感都是無以倫比的。首都師范大學(xué)文學(xué)院教授莫伯峰就是這樣一位“冒險(xiǎn)者”。
“目前已經(jīng)發(fā)現(xiàn)的不重復(fù)的甲骨文單字已經(jīng)有4000多個(gè),如果你想從事這份研究,認(rèn)識這些字是基礎(chǔ),還要知道每個(gè)字的古代意義?!?月15日,在首都師范大學(xué)甲骨文研究中心的會議室,莫伯峰將自己鐘情的甲骨文研究娓娓道來。
莫伯峰的研究主要圍繞“甲骨刻辭字體分類”展開,即根據(jù)字體把甲骨文細(xì)分為幾十個(gè)類型,這是他在甲骨學(xué)領(lǐng)域的專長。近年來,“人工智能在古文字研究中的應(yīng)用”是他重點(diǎn)關(guān)注的領(lǐng)域。
首都師范大學(xué)甲骨文研究中心教授莫伯峰專注“甲骨刻辭字體分類”研究。 新京報(bào)記者郭延冰 攝
從文學(xué)到古文字,學(xué)術(shù)道路的抉擇與堅(jiān)守
甲骨文是中國殷商時(shí)期刻寫在龜甲和獸骨上的古老文字系統(tǒng),又稱“契文”或“甲骨卜辭”,是迄今發(fā)現(xiàn)最早的成熟漢字,主要用于王室占卜記錄。
從形態(tài)各異的小烏龜擺件到小黑板上隨手寫下的學(xué)術(shù)思考,在莫伯峰的辦公室里,隨處可以看見他對這一神秘文字的熱愛。因?yàn)榧坠俏氖欠浅U滟F的文物,珍藏于世界各地的博物館內(nèi),莫伯峰手頭沒有刻著甲骨文的真跡。在采訪時(shí),他小心翼翼地拿出一個(gè)不到拳頭大小的盒子,里邊珍藏著一片商代骨片,“可惜上面沒有文字”,莫伯峰話語中帶著一絲遺憾。
莫伯峰的學(xué)術(shù)轉(zhuǎn)向,源于對語言“確定性”的追求。本科就讀中央民族大學(xué)文學(xué)與新聞傳播學(xué)院時(shí),他曾沉浸在文學(xué)的詩意中,坦言自己也曾是一個(gè)“文藝青年”,但后來逐漸發(fā)現(xiàn),“文學(xué)的闡釋多元而開放,而語言學(xué)的研究追求唯一正確的答案,這種確定性更讓我著迷?!币虼耍逶谘芯可A段便轉(zhuǎn)向古代漢語,研究漢字構(gòu)形與演變,尤其是“會意字”的形成機(jī)制。
莫伯峰收集了形態(tài)各異的小烏龜擺件。 新京報(bào)記者郭延冰 攝
會意字是漢字六書造字法之一,通過組合兩個(gè)或多個(gè)獨(dú)體字的含義來表達(dá)新意義。莫伯峰用“取”字舉例,它由“耳”和“又”組成,之所以有抓取的含義是源自古代的“戰(zhàn)爭文化”,“古人打仗時(shí)為了記錄戰(zhàn)功,會把敗者的耳朵割下來,‘又’表示一只手,手拿著‘耳’,就構(gòu)成了‘取’這個(gè)字?!蹦宓拇T士論文聚焦《說文解字》中的會意字進(jìn)行研究,卻遭遇了瓶頸:如何確定這些獨(dú)體字的本義?答案指向了更早的文字形態(tài)——甲骨文。
“要理解會意字的構(gòu)形邏輯,必須回到甲骨文時(shí)代?!蹦褰忉尩?,若不了解甲骨文的字形,僅從后世字形推導(dǎo),極易誤解其本義。這一認(rèn)知促使他在博士階段轉(zhuǎn)向甲骨文研究,師從著名古文字學(xué)家黃天樹先生,從此與甲骨文結(jié)下不解之緣。
訪談中,莫伯峰還分享了一個(gè)令他自豪的發(fā)現(xiàn):甲骨文中的“羔”字。傳統(tǒng)觀點(diǎn)認(rèn)為“羔”字表示小羊之義,但他在一片甲骨上首次發(fā)現(xiàn)了甲骨文的“羔”字——從羊從火,表示祭祀用的烤羊之義?!拔彝茰y這才是‘羔’的早期含義,下部四點(diǎn)代表用火炙烤,而上部羊的姿態(tài)是倒懸狀,符合古代祭祀中‘獻(xiàn)牲’的儀式。”這一發(fā)現(xiàn)不僅填補(bǔ)了甲骨文字庫的空白,更印證了文獻(xiàn)記載的祭祀習(xí)俗,展現(xiàn)了古文字研究“證經(jīng)補(bǔ)史”的價(jià)值。
首次實(shí)現(xiàn)人工智能批量綴合甲骨
在莫伯峰的電腦上,一幅幅甲骨拓片圖像在人工智能模型的輔助下逐漸拼合,仿佛古老文明的碎片在數(shù)字技術(shù)的魔法中重新煥發(fā)生機(jī)。這也被稱作甲骨綴合,將本屬同版的甲骨碎片,依據(jù)形態(tài)、卜辭等信息拼接在一起,盡可能恢復(fù)其本來面貌。
訪談中,莫伯峰詳細(xì)解釋了甲骨文研究的基石——“綴合”與“補(bǔ)合”。甲骨文自1899年被發(fā)現(xiàn)以來,歷經(jīng)戰(zhàn)亂流散,十?dāng)?shù)萬片甲骨分散于全球各大博物館,許多已成殘片。研究者需通過“綴合”將破碎的甲骨重新拼接,通過“補(bǔ)合”將不同收藏者制作的拓片整合為最完整的圖像。這一工作傳統(tǒng)上依賴人工比對,耗時(shí)費(fèi)力。例如,某片甲骨可能分散在中國臺灣、北京、加拿大等地,研究者需翻閱數(shù)萬張拓片,尋找形態(tài)、紋飾的契合點(diǎn),全憑個(gè)人經(jīng)驗(yàn)和腦力記憶,耗費(fèi)大量時(shí)間和精力。
“過去做綴合,就像拼一張巨大的拼圖,但碎片數(shù)量以萬計(jì),且很多缺失關(guān)鍵部分。”莫伯峰舉例說,“比如一片甲骨在中國臺灣,另一片在加拿大,研究者可能耗費(fèi)大量時(shí)間才能把二者聯(lián)系起來?!边@種困境,直到人工智能技術(shù)的介入才迎來轉(zhuǎn)機(jī)。自2019年起,莫伯峰便提出用計(jì)算機(jī)綴合甲骨作為“甲機(jī)會”的實(shí)驗(yàn)項(xiàng)目,2020年與河南大學(xué)聯(lián)合研發(fā)軟件“綴多多”,在甲骨學(xué)歷史上首次實(shí)現(xiàn)了人工智能批量綴合甲骨。
莫伯峰會將自己的思考隨時(shí)寫在辦公室的小黑板上。 新京報(bào)記者郭延冰 攝
今年暑假,他專注于一本補(bǔ)合書籍的撰寫,其中涉及的新研究成果是基于他的團(tuán)隊(duì)與微軟亞洲研究院合作開發(fā)的AI模型Diviner獲得的。通過圖像識別和深度學(xué)習(xí)技術(shù),該模型能夠自動比對數(shù)十萬張甲骨拓片,識別出同一片甲骨的不同拓本,進(jìn)而將不同拓本取長補(bǔ)短合并在一起。這一技術(shù)突破不僅極大提升了效率,更補(bǔ)合了數(shù)百組此前殘缺的拓本?!癆I能識別人類難以察覺的細(xì)微特征,比如裂紋的弧度、字體的筆觸角度,這些都為補(bǔ)合提供了關(guān)鍵線索?!蹦逭故玖艘粡堁a(bǔ)合后的甲骨圖像,原本殘缺的文字連成完整的卜辭,揭示了一場商王出征的史實(shí)。
面對AI技術(shù)對傳統(tǒng)研究的沖擊,莫伯峰持開放態(tài)度,“AI不是替代學(xué)者,而是拓展我們的認(rèn)知邊界?!彼麖?qiáng)調(diào),人工智能在材料處理層面的優(yōu)勢無可比擬,但解讀文字仍依賴學(xué)者的歷史與語言學(xué)素養(yǎng)。例如,AI模型能識別字形相似性,但無法理解卜辭的語法結(jié)構(gòu)和歷史語境,這需要學(xué)者介入闡釋。
在“冷門絕學(xué)”中堅(jiān)守“熱望”
“從甲骨文到今天的漢字,三千年一脈相承,這是世界文明史上獨(dú)一無二的奇跡?!蹦逶?jīng)撰文用“尋寶”“探秘”兩個(gè)詞形容自己的科研日常。
所謂“尋寶”,即通過技術(shù)手段復(fù)原甲骨文的原始樣貌,將散落世界的文化珍寶重新聚合;所謂“探秘”,則是破解文字背后的歷史密碼,探尋商代社會的真實(shí)圖景。他認(rèn)為,看似枯燥的學(xué)術(shù)工作,實(shí)則是一場與古人對話的智力冒險(xiǎn)?!爱?dāng)我們書寫‘雨’字時(shí),仍能看到甲骨文中雨點(diǎn)垂落的形象;‘宗’字中的房舍與祭臺,延續(xù)著古人‘敬天法祖’的觀念。這種文字與文明的共生關(guān)系,是中華文明韌性的見證。”莫伯峰認(rèn)真地說道。
從2008年攻讀博士至今,他已在甲骨學(xué)研究領(lǐng)域耕耘近二十年。談及堅(jiān)持的動力,他笑言:“每次發(fā)現(xiàn)一片新綴合的甲骨,或破解一個(gè)疑難字,那種發(fā)現(xiàn)的喜悅,足以抵消所有枯燥?!闭沁@份對知識純粹的熱情,支撐他在“冷門絕學(xué)”中持續(xù)深耕。
莫伯峰臨摹甲骨以及上面的文字。 新京報(bào)記者郭延冰 攝
2020年,鐘芳蓉以高考676分的優(yōu)異成績選報(bào)了北大考古專業(yè),當(dāng)時(shí)她的選擇曾引發(fā)網(wǎng)絡(luò)關(guān)注?!昂芏嗳藭X得進(jìn)入考古專業(yè)就和賺錢沒有什么太大的關(guān)系了,但賺錢的目的是什么?賺錢只是一個(gè)手段,根源是用錢實(shí)現(xiàn)對你有意義的事情。我們研究的東西本身就對我很有意義了,我每天都看著它,不斷思考,我很滿足,這是與錢無關(guān)的直接意義?!痹谀蹇磥恚M管甲骨文研究、考古研究長期面臨人才短缺、資金有限的困境,但是“只要文明傳承的需求在,甲骨文研究就不會冷。每一片甲骨的拼合,都是對文明記憶的修復(fù)。”
莫伯峰常常用興趣和熱愛激勵自己的學(xué)生們?!凹坠俏难芯康囊饬x,在于證明我們從何處來,也指引我們向何處去?!钡牵瑢τ谀切┫敫鲅芯康膶W(xué)生,他做的第一件事反而是先“勸退”。“在我這里,你不認(rèn)全4000多個(gè)甲骨文字是不行的,不僅要認(rèn)識字還要知道他的意義,這就像學(xué)英語一樣,你不背單詞是不行的??隙ㄒ乱环喙Γ磿鴮W(xué)習(xí)是一個(gè)苦差事,研究這個(gè)又賺不了什么錢,如果沒有興趣,來我這里做什么呢?”
正因如此,沒被“勸退”的青年學(xué)生們在研究中往往是興趣盎然的,他們會為一片甲骨上為什么會有“其”字而展開頭腦風(fēng)暴,得出新的學(xué)術(shù)結(jié)論后又歡欣鼓舞。莫伯峰鼓勵年輕學(xué)者在深耕傳統(tǒng)研究方法的同時(shí),勇于嘗試新技術(shù)、新方法,例如通過建立甲骨文數(shù)字?jǐn)?shù)據(jù)庫、開發(fā)智能識別工具等,推動學(xué)科發(fā)展。這種理念已在其團(tuán)隊(duì)中形成良好的學(xué)術(shù)生態(tài),多名青年教師成長為領(lǐng)域內(nèi)新生力量。
訪談尾聲,莫伯峰展示了一份最新成果:利用AI技術(shù)復(fù)原的商王田獵卜辭。殘缺的裂紋在數(shù)字模擬中閉合,模糊的文字逐漸清晰,顯現(xiàn)出“王田于某地,獲鹿十”的記錄?!澳憧矗昵暗耐鹾钚雄E,就這樣被我們‘看見’了。”他的話語中帶著學(xué)者特有的謙遜與激動,“我們所做的,不過是讓文明自己講述自己的故事?!?/p>
新京報(bào)記者 劉洋
編輯 繆晨霞 校對 楊利