優(yōu)勝?gòu)倪x擇開始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測(cè) 我要投稿 合法期刊查詢

基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)知識(shí)管理研究

作者:侯西龍,談國(guó)新,莊文杰,唐銘來(lái)源:《中國(guó)圖書館學(xué)報(bào)》日期:2020-09-28人氣:1684

 引言

非物質(zhì)文化遺產(chǎn)(以下簡(jiǎn)稱“非遺”)作為各民族優(yōu)秀傳統(tǒng)文化的重要組成部分,彰顯著地域的特色,蘊(yùn)含著群體的智慧,對(duì)于每個(gè)國(guó)家都是不可再生的文化財(cái)富。非遺文化的表現(xiàn)形式多樣,涉及領(lǐng)域廣泛,蘊(yùn)含著豐富的知識(shí)。對(duì)非遺領(lǐng)域知識(shí)進(jìn)行結(jié)構(gòu)化表示與語(yǔ)義化組織,是知識(shí)時(shí)代對(duì)非遺文化保護(hù)與知識(shí)傳播的必然要求。然而,中國(guó)非遺網(wǎng)及各省市非遺傳播平臺(tái)在對(duì)非遺知識(shí)進(jìn)行管理時(shí),僅以列表的形式展示非遺項(xiàng)目與代表性傳承人的信息,缺少項(xiàng)目與傳承人、項(xiàng)目與地區(qū)等知識(shí)要素之間的關(guān)聯(lián);非遺領(lǐng)域知識(shí)由于缺乏有效的組織和管理,造成了信息的碎片化,大大限制了知識(shí)的完整性與可傳播性。同時(shí),在非遺垂直領(lǐng)域缺少專業(yè)的知識(shí)型關(guān)聯(lián)數(shù)據(jù)集,尚未形成成熟的非遺百科類知識(shí)庫(kù)。雖然國(guó)內(nèi)在通用領(lǐng)域的中文百科知識(shí)圖譜研究方面取得了一定成果,包括zhishi.me(東南大學(xué))、CN-DBpedia(復(fù)旦大學(xué))、PKUPie(北京大學(xué))、Xlore(清華大學(xué))等中文百科知識(shí)圖譜;OpenKG也正在促進(jìn)這些百科類知識(shí)圖譜的開放與互聯(lián)[1]。但在中文知識(shí)百科領(lǐng)域,缺少像DBpedia、Freebase等大型百科知識(shí)型數(shù)據(jù)集。由于非遺領(lǐng)域數(shù)據(jù)仍以半結(jié)構(gòu)化數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)庫(kù)為主,碎片化的數(shù)據(jù)較多,缺乏高質(zhì)量的非遺開放數(shù)據(jù)集;對(duì)非遺知識(shí)單一線性的組織,無(wú)法體現(xiàn)非遺文化的多元特征,無(wú)法滿足多維度揭示與知識(shí)檢索的需要[2]。這限制了對(duì)非遺的科學(xué)研究,也限制了非遺知識(shí)的傳播和對(duì)非遺文化的傳承。

傳統(tǒng)的非遺項(xiàng)目的知識(shí)管理方式主要依據(jù)主題、地域與級(jí)別等進(jìn)行分類歸檔,組織單元的顆粒度較粗,組織模式是線性的、一維的;非遺領(lǐng)域知識(shí)元素的語(yǔ)義化程度較低,無(wú)法充分表達(dá)與揭示知識(shí)元素之間的關(guān)系。隨著知識(shí)組織與知識(shí)管理研究的深入,非遺領(lǐng)域知識(shí)的管理向主題圖譜、知識(shí)圖譜、語(yǔ)義組織等新型組織方式發(fā)展,更加注重領(lǐng)域知識(shí)間關(guān)系的多維度揭示。尤其是語(yǔ)義網(wǎng)技術(shù)堆棧中的本體與關(guān)聯(lián)數(shù)據(jù)技術(shù)為非遺領(lǐng)域知識(shí)的語(yǔ)義組織提供了新的解決思路和方案。關(guān)聯(lián)數(shù)據(jù)被看作是語(yǔ)義網(wǎng)的輕量級(jí)實(shí)現(xiàn),其以關(guān)聯(lián)開放數(shù)據(jù)的形式聚合異構(gòu)的信息資源,能夠提高資源與知識(shí)的可見度、共享性和開放性?;陉P(guān)聯(lián)數(shù)據(jù)對(duì)非遺知識(shí)的組織與管理,是在規(guī)范統(tǒng)一的領(lǐng)域本體模型的指導(dǎo)下,以結(jié)構(gòu)化、形式化方式表達(dá)非遺領(lǐng)域知識(shí)元素及其屬性,并構(gòu)建知識(shí)元素之間的語(yǔ)義關(guān)系,進(jìn)而達(dá)到知識(shí)的語(yǔ)義化與有序化的目的,并提供開放的數(shù)據(jù)獲取和知識(shí)服務(wù)。

基于此背景,本文針對(duì)非遺知識(shí)的有效管理與知識(shí)關(guān)聯(lián)問題,提出基于關(guān)聯(lián)數(shù)據(jù)的非遺知識(shí)組織與非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)庫(kù)構(gòu)建的方法體系,包括從非遺知識(shí)本體模型設(shè)計(jì)到關(guān)聯(lián)數(shù)據(jù)構(gòu)建、存儲(chǔ)與發(fā)布的整個(gè)過(guò)程;研究將非遺領(lǐng)域內(nèi)部關(guān)聯(lián)數(shù)據(jù)集與DBpedia及GeoNames外部知識(shí)型數(shù)據(jù)庫(kù)進(jìn)行知識(shí)關(guān)聯(lián),建立一個(gè)擁有豐富語(yǔ)義關(guān)系、知識(shí)互聯(lián)共享的非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)庫(kù),提供領(lǐng)域知識(shí)的有序組織及知識(shí)可視化。并以湖北省非遺項(xiàng)目為例,將非遺項(xiàng)目有關(guān)的知識(shí)進(jìn)行關(guān)聯(lián)聚合,構(gòu)建了非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)集與服務(wù)平臺(tái)。在數(shù)字人文研究背景下,通過(guò)對(duì)非遺知識(shí)組織與管理的深入研究,以期為我國(guó)非遺知識(shí)的組織與管理以及非遺文化的保護(hù)與傳播提供參考。

1 非遺領(lǐng)域知識(shí)本體研究與關(guān)聯(lián)數(shù)據(jù)技術(shù)應(yīng)用現(xiàn)狀

非遺領(lǐng)域知識(shí)涉及的內(nèi)容豐富,文化形態(tài)多元,但是由于缺少詳盡的分類體系標(biāo)準(zhǔn),導(dǎo)致非遺知識(shí)組織的程度較低,非遺領(lǐng)域知識(shí)無(wú)法得到有效的管理。如何將海量、零散的非遺知識(shí)按照知識(shí)的內(nèi)在關(guān)系進(jìn)行表示與組織,成為亟待深入研究的問題。隨著語(yǔ)義網(wǎng)的發(fā)展,一些研究者已經(jīng)將本體及關(guān)聯(lián)數(shù)據(jù)的理論與方法引入到非遺知識(shí)組織和知識(shí)管理領(lǐng)域,在本體構(gòu)建、資源整合、資源組織等方面開展了大量的研究。在非遺領(lǐng)域知識(shí)結(jié)構(gòu)分析與本體構(gòu)建研究方面,蔡璐等[3]從系統(tǒng)論角度分析非遺的各要素,構(gòu)建了由非遺項(xiàng)目類、人物類、事物類、事件類以及文獻(xiàn)類等核心概念組成的本體概念模型,并制定非遺資源的元數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范。黃永等[4]分析了非遺知識(shí)本體構(gòu)建的難點(diǎn),以民間舞蹈為例設(shè)計(jì)了面向文本與多媒體數(shù)據(jù)的非遺知識(shí)本體構(gòu)建系統(tǒng)。滕春娥、王萍[5]基于本體理論從非遺項(xiàng)目及人物、事件、文獻(xiàn)等維度對(duì)赫哲族非遺信息資源進(jìn)行組織與整合。周耀林等[6]以本體方法為研究視角,從本體表示與語(yǔ)義組織、語(yǔ)義檢索兩個(gè)層面,設(shè)計(jì)了非遺信息資源組織與檢索框架,以戲劇類非遺項(xiàng)目為例實(shí)現(xiàn)非遺信息資源本體的構(gòu)建。此外,國(guó)內(nèi)學(xué)者針對(duì)不同類型的非遺項(xiàng)目,對(duì)知識(shí)本體的構(gòu)建與應(yīng)用進(jìn)行了探索。比如,郝挺雷[7]、胡駿等[8]和隗昊[9]研究端午節(jié)、盤王節(jié)等傳統(tǒng)節(jié)日領(lǐng)域知識(shí)本體的設(shè)計(jì)與構(gòu)建方法。綜上,學(xué)者們從不同角度或針對(duì)具體的非遺細(xì)分領(lǐng)域提出了許多有價(jià)值的非遺領(lǐng)域本體模型。目前,國(guó)內(nèi)對(duì)非遺領(lǐng)域本體的研究處在起步階段,雖然取得了一定的成果,但尚未形成統(tǒng)一規(guī)范、完善的知識(shí)組織本體模型?,F(xiàn)有的研究多針對(duì)非遺信息資源的組織,缺少在知識(shí)層面的分析和研究,沒有突出非遺領(lǐng)域知識(shí)內(nèi)部之間以及與外部知識(shí)的關(guān)聯(lián)性,造成非遺項(xiàng)目蘊(yùn)含的知識(shí)內(nèi)容孤立與流失。

在關(guān)聯(lián)開放數(shù)據(jù)的環(huán)境下,越來(lái)越多的領(lǐng)域資源和數(shù)據(jù)以關(guān)聯(lián)數(shù)據(jù)的方式提供開放訪問服務(wù),關(guān)聯(lián)開放數(shù)據(jù)云圖中的數(shù)據(jù)集逐年增長(zhǎng)。關(guān)聯(lián)數(shù)據(jù)技術(shù)的優(yōu)勢(shì)為非遺知識(shí)管理與信息資源的聚合,提供了強(qiáng)有力的工具和技術(shù)手段。王燕紅[10]梳理國(guó)內(nèi)基于關(guān)聯(lián)數(shù)據(jù)的資源整合研究現(xiàn)狀,發(fā)現(xiàn)基于關(guān)聯(lián)數(shù)據(jù)的資源整合集中應(yīng)用在網(wǎng)絡(luò)信息資源、數(shù)字圖書館、書目資源等領(lǐng)域,呈現(xiàn)出從理論研究向應(yīng)用研究發(fā)展的趨勢(shì)。戎軍濤[11]對(duì)基于關(guān)聯(lián)數(shù)據(jù)的知識(shí)組織深度序化機(jī)制進(jìn)行了研究,認(rèn)為關(guān)聯(lián)數(shù)據(jù)為知識(shí)組織的深度序化提供了實(shí)現(xiàn)路徑和基礎(chǔ)。翟?shī)檴櫟萚12]對(duì)非遺數(shù)字資源內(nèi)容的語(yǔ)義表達(dá)、知識(shí)單元關(guān)聯(lián)揭示的問題進(jìn)行研究,提出了面向非遺傳承和傳播的多維度研究框架。李?yuàn)檴櫟萚13]針對(duì)非遺檔案資源,提出了基于關(guān)聯(lián)數(shù)據(jù)的非遺檔案資源開發(fā)模型。董坤[14]利用關(guān)聯(lián)數(shù)據(jù)技術(shù)對(duì)非遺知識(shí)進(jìn)行語(yǔ)義化組織,實(shí)現(xiàn)了對(duì)非遺資源及其關(guān)系的語(yǔ)義化揭示與組織。仝召娟等[15]基于關(guān)聯(lián)數(shù)據(jù)對(duì)非遺數(shù)字資源聚合進(jìn)行研究,實(shí)現(xiàn)對(duì)來(lái)源異構(gòu)、內(nèi)容異構(gòu)的非遺數(shù)字化資源的整合與聚合,使數(shù)字化資源有序重組,更好地得到利用。此外,關(guān)聯(lián)數(shù)據(jù)技術(shù)在數(shù)字人文領(lǐng)域也得到了廣泛矚目和應(yīng)用,出現(xiàn)了大量的利用關(guān)聯(lián)數(shù)據(jù)實(shí)現(xiàn)數(shù)字人文服務(wù)的項(xiàng)目[16]。從上述研究中可以看出,利用關(guān)聯(lián)數(shù)據(jù)技術(shù)針對(duì)非遺數(shù)字化資源的研究較為豐富,主要集中在非遺數(shù)字資源的聚合、數(shù)字資源內(nèi)容的語(yǔ)義揭示等方面。但在非遺知識(shí)管理與知識(shí)組織方面,缺少系統(tǒng)性的研究,非遺領(lǐng)域知識(shí)也較少以關(guān)聯(lián)數(shù)據(jù)的方式進(jìn)行組織與管理。在實(shí)踐應(yīng)用方面,尚缺乏可供非遺領(lǐng)域參考的標(biāo)準(zhǔn)化、批量化、可供操作的關(guān)聯(lián)數(shù)據(jù)應(yīng)用方案,非遺知識(shí)亟待有效的組織與管理。

在借鑒國(guó)內(nèi)外相關(guān)研究成果的基礎(chǔ)上,本文從知識(shí)組織與知識(shí)關(guān)聯(lián)的角度,研究基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的非遺知識(shí)管理與知識(shí)關(guān)聯(lián)的方法,并構(gòu)建非遺知識(shí)庫(kù),實(shí)現(xiàn)非遺知識(shí)表示、知識(shí)可視化等創(chuàng)新性知識(shí)服務(wù)。首先,分析非遺領(lǐng)域知識(shí)的結(jié)構(gòu),梳理非遺項(xiàng)目之間、項(xiàng)目與傳承人以及項(xiàng)目與地域等領(lǐng)域內(nèi)部知識(shí)要素之間的關(guān)聯(lián)關(guān)系,構(gòu)建了非遺知識(shí)本體模型。其次,研究基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的非遺知識(shí)組織與知識(shí)庫(kù)的構(gòu)建過(guò)程,包括實(shí)體RDF化、實(shí)體關(guān)聯(lián)、數(shù)據(jù)存儲(chǔ)與發(fā)布等核心過(guò)程。在此基礎(chǔ)上,研究與DBpedia、GeoNames外部關(guān)聯(lián)數(shù)據(jù)庫(kù)的知識(shí)關(guān)聯(lián),最終構(gòu)建非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)庫(kù),促進(jìn)非遺領(lǐng)域知識(shí)關(guān)聯(lián)與知識(shí)發(fā)現(xiàn)。最后,在非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)庫(kù)的基礎(chǔ)上,提供非遺知識(shí)的瀏覽、關(guān)聯(lián)可視化表達(dá)等創(chuàng)新性知識(shí)服務(wù)。采用本體與關(guān)聯(lián)數(shù)據(jù)技術(shù)規(guī)范描述非遺領(lǐng)域的知識(shí),能夠提高非遺知識(shí)的關(guān)聯(lián)性、開放性與可見度,能夠?yàn)榉沁z領(lǐng)域、數(shù)字人文等方面的科學(xué)研究提供開放數(shù)據(jù)服務(wù),有助于非遺知識(shí)的挖掘與發(fā)現(xiàn),以及我國(guó)非遺文化的國(guó)際傳播。

2 非遺知識(shí)本體模型的設(shè)計(jì)與構(gòu)建

本體被認(rèn)為是共享概念模型的明確的形式化規(guī)范說(shuō)明[17];在信息科學(xué)與計(jì)算機(jī)領(lǐng)域,本體可以看作是一種模型,是對(duì)客觀存在對(duì)象或概念及其屬性和相關(guān)關(guān)系形式化的表達(dá)。對(duì)非遺領(lǐng)域知識(shí)的有效組織與管理,首先需要明確非遺知識(shí)的結(jié)構(gòu)、知識(shí)的構(gòu)成要素及內(nèi)部關(guān)系等。然后,在參考國(guó)際通用本體模型的基礎(chǔ)上,針對(duì)非遺領(lǐng)域的知識(shí)特征,建立非遺領(lǐng)域知識(shí)本體模型。

非遺知識(shí)本體是對(duì)非遺內(nèi)涵及其組成要素高度抽象概括而形成的一個(gè)形式化的概念模型。本文在本體理論與現(xiàn)有研究成果的基礎(chǔ)上,按照領(lǐng)域本體設(shè)計(jì)與構(gòu)建的思路與步驟,通過(guò)分析非遺項(xiàng)目的知識(shí)結(jié)構(gòu)和構(gòu)成要素,構(gòu)建了非遺知識(shí)本體模型,旨在為非遺知識(shí)描述及知識(shí)關(guān)聯(lián)提供統(tǒng)一規(guī)范的知識(shí)表示模型和數(shù)據(jù)模型。目前我國(guó)對(duì)非遺文化的保護(hù)與傳承,制定了“國(guó)家—省—市—縣”四級(jí)非遺保護(hù)名錄制度,每個(gè)非遺項(xiàng)目有其組織申報(bào)的地域或單位,并在口頭文學(xué)、表演儀式、手工技藝等領(lǐng)域認(rèn)定非遺項(xiàng)目的代表性傳承人。因此,有關(guān)非遺的基本知識(shí)可以看成由非遺項(xiàng)目、傳承人、相關(guān)機(jī)構(gòu)、項(xiàng)目類型、地理位置等要素構(gòu)成,組成要素之間存在著傳承關(guān)系、地域分布關(guān)系、類屬關(guān)系等語(yǔ)義關(guān)系。

在分析非遺知識(shí)基本結(jié)構(gòu)與關(guān)系的基礎(chǔ)上,本文設(shè)計(jì)構(gòu)建的非遺知識(shí)本體模型如圖1所示。該本體模型參考借鑒了CIDOCCRM①、FOAF②、GeoNames③、人物關(guān)系詞表(Relationship)④等本體模型以及都柏林核心(Dublin Core,DC)元數(shù)據(jù)標(biāo)準(zhǔn)。根據(jù)非遺領(lǐng)域知識(shí)構(gòu)成的核心要素,將非遺領(lǐng)域知識(shí)本體抽象出非遺項(xiàng)目(ICHproject)、代表性傳承人(Person)、地理位置(Place)、項(xiàng)目類型(Category)四大核心類;每個(gè)核心類定義相應(yīng)的數(shù)據(jù)屬性(Data Properties),實(shí)體之間的關(guān)系通過(guò)對(duì)象屬性(Object Properties)進(jìn)行描述與揭示。非遺知識(shí)本體模型提供對(duì)非遺領(lǐng)域知識(shí)概念及其關(guān)系的宏觀理解,規(guī)范統(tǒng)一非遺領(lǐng)域的基本術(shù)語(yǔ)及關(guān)系,并準(zhǔn)確描述知識(shí)概念之間的內(nèi)在關(guān)聯(lián)。

圖1 非遺知識(shí)本體模型

注:前綴ich表示本文構(gòu)建的非遺知識(shí)本體的命名空間,定義為http://localhost:8890/ontology/。

2.1 非遺項(xiàng)目類

非遺項(xiàng)目類(ICHProject)是對(duì)非遺項(xiàng)目的抽象,其實(shí)例指我國(guó)建立的“國(guó)家—省—市—縣”四級(jí)非遺保護(hù)名錄中的每一個(gè)具體的項(xiàng)目。非遺項(xiàng)目實(shí)例是一個(gè)復(fù)合型對(duì)象,既具有本身的內(nèi)涵屬性,還包括與之相關(guān)的傳承人、地域等實(shí)體。非遺項(xiàng)目實(shí)體的屬性主要包括項(xiàng)目簡(jiǎn)介、基本內(nèi)容、歷史淵源、存續(xù)狀態(tài)、保護(hù)與傳承情況等關(guān)于項(xiàng)目?jī)?nèi)容的描述信息,根據(jù)我國(guó)《國(guó)家級(jí)非遺代表作申報(bào)書》中設(shè)置的主要欄目,從中選取非遺專指概念;此外,除了以上基本屬性外,不同種類的非遺項(xiàng)目又有其獨(dú)有的特征;比如,民間音樂類非遺項(xiàng)目使用的樂器、獨(dú)特的唱腔等,民間舞蹈中的服裝,傳統(tǒng)手工技藝類包含的制作技術(shù)、方法或過(guò)程、工具材料、相關(guān)制品及應(yīng)用等。非遺項(xiàng)目類的具體屬性如圖2所示。

圖2 非遺項(xiàng)目類及其屬性

2.2 項(xiàng)目類型類

項(xiàng)目類型類(Category)用于對(duì)非遺項(xiàng)目分類體系的構(gòu)建;為使非遺分類體系具有國(guó)際通用性,將其細(xì)分為聯(lián)合國(guó)分類(UNCategory)與我國(guó)“十分法”(CNCategory)兩個(gè)子類。依據(jù)我國(guó)《國(guó)家級(jí)非物質(zhì)文化遺產(chǎn)名錄》將非遺分為民俗、民間文學(xué)、傳統(tǒng)音樂、曲藝、傳統(tǒng)舞蹈等十大類;聯(lián)合國(guó)教科文組織在《保護(hù)非物質(zhì)文化遺產(chǎn)公約》中將非遺分為口頭傳說(shuō)和表述、表演藝術(shù)、社會(huì)實(shí)踐、禮儀和節(jié)慶活動(dòng)、有關(guān)自然界的知識(shí)和實(shí)踐、傳統(tǒng)手工藝技能五種形式[18]。通過(guò)使用表示概念上下級(jí)關(guān)系的對(duì)象屬性(skos:broader、skos:narrower等),可以構(gòu)建一個(gè)多視角、多層次、可伸縮的非遺項(xiàng)目分類體系。

2.3 代表性傳承人類

非遺作為活態(tài)的遺產(chǎn),需要人的傳承才能延續(xù)與發(fā)展。非遺代表性傳承人是非遺文化的重要組成部分,傳承人掌握著杰出的技藝、技能,對(duì)群體、族群具有影響力,代表著非遺蘊(yùn)含的深厚文化傳統(tǒng);傳承人在培養(yǎng)傳人、技藝傳授等方面起到關(guān)鍵作用。本文定義的本體模型中主體類(Agent)的定義復(fù)用FOAF本體模型,將主體類可以分為“傳承人個(gè)體”與“組織與機(jī)構(gòu)”兩個(gè)子類;“個(gè)體”主要指認(rèn)證的國(guó)家級(jí)、省市級(jí)代表性傳承人個(gè)人,“組織與機(jī)構(gòu)”則表示某些非遺項(xiàng)目的申報(bào)單位,比如,農(nóng)歷二十四節(jié)氣的申報(bào)單位為中國(guó)農(nóng)業(yè)博物館。對(duì)于非遺項(xiàng)目代表性傳承人對(duì)象,其屬性包括傳承人編號(hào)、姓名、性別、稱謂、民族、出生日期、籍貫等基本信息,以及其掌握的技能、技藝傳承的情況等。本體模型中代表性傳承人類的具體屬性如圖3所示。此外,復(fù)用人物關(guān)系詞匯表(Relationship)中的屬性,來(lái)更好地表達(dá)傳承人之間錯(cuò)綜復(fù)雜的傳承關(guān)系和傳承譜系。

2.4 地理位置類

非遺具有鮮明的地域特色,不同地域的風(fēng)俗習(xí)慣、語(yǔ)言、文化和歷史孕育了不同特色的非遺內(nèi)容。本體模型中定義地理位置類,一方面為表達(dá)非遺項(xiàng)目分布與流傳的地理空間,另一方面記錄傳承人的居住地與籍貫等信息。并為地理位置類賦予其省、市、縣、村鎮(zhèn)行政級(jí)別的數(shù)據(jù)屬性,與我國(guó)的行政區(qū)劃相對(duì)應(yīng)。同時(shí),將每個(gè)地理位置實(shí)例與地理數(shù)據(jù)庫(kù)GeoNames進(jìn)行實(shí)體的關(guān)聯(lián),獲取地理位置簡(jiǎn)介、經(jīng)緯度等信息。結(jié)合地理信息系統(tǒng)(GIS)技術(shù),不僅通過(guò)地圖空間分布的直觀可視化形式表達(dá)非遺的空間分布,還可以從深層次挖掘出非遺中空間維度的隱含信息,通過(guò)空間聚類、核密度分析等GIS空間分析技術(shù),對(duì)非遺的空間結(jié)構(gòu)與演變及特征進(jìn)行分析,對(duì)理解非遺文化的內(nèi)涵具有重要意義。

圖3 代表性傳承人類及其屬性

2.5 實(shí)體之間的關(guān)聯(lián)關(guān)系

通過(guò)對(duì)非遺知識(shí)結(jié)構(gòu)的分析,抽象出本體模型的核心類之外,還需要定義知識(shí)要素間豐富的關(guān)系。通過(guò)對(duì)非遺領(lǐng)域?qū)嶓w之間的關(guān)系進(jìn)行梳理,可以概括出非遺項(xiàng)目與傳承人間的代表關(guān)系、項(xiàng)目與地域的位置關(guān)系、傳承人間的傳承關(guān)系、項(xiàng)目類別之間的層級(jí)關(guān)系等,這些關(guān)系對(duì)了解和認(rèn)識(shí)非遺文化的活態(tài)流變性非常重要。在本體模型中通過(guò)定義對(duì)象屬性,對(duì)實(shí)體間關(guān)系進(jìn)行描述與表示,最終,在對(duì)非遺領(lǐng)域知識(shí)結(jié)構(gòu)分析的基礎(chǔ)上,定義對(duì)象屬性及其定義域與值域,如表1所示。實(shí)體間的關(guān)聯(lián)關(guān)系將獨(dú)立的知識(shí)要素聯(lián)系起來(lái),形成非遺知識(shí)網(wǎng)絡(luò),改變傳統(tǒng)知識(shí)組織的單線索模式。此外,在這些關(guān)聯(lián)關(guān)系的基礎(chǔ)上,通過(guò)定義規(guī)則與關(guān)系推理,能夠推斷并發(fā)現(xiàn)隱形的知識(shí)。

圍繞非遺項(xiàng)目相關(guān)知識(shí)的組織與管理,本文在參考借鑒CIDOC CRM、FOAF、Relationship等國(guó)際通用本體模型的基礎(chǔ)上,根據(jù)非遺知識(shí)的特點(diǎn)進(jìn)行本體的復(fù)用和自定義擴(kuò)展。最終,設(shè)計(jì)構(gòu)建的非遺知識(shí)本體模型包含8個(gè)核心類和25個(gè)對(duì)象屬性、非遺項(xiàng)目和傳承人類的27個(gè)數(shù)據(jù)屬性,以及本體推理規(guī)則等,為非遺領(lǐng)域知識(shí)的組織與形式化表示提供了較為全面的、規(guī)范統(tǒng)一的模型,滿足了對(duì)非遺領(lǐng)域知識(shí)結(jié)構(gòu)的形式化描述與表示。使用本體編輯軟件protégé進(jìn)行非遺知識(shí)本體模型的開發(fā)與實(shí)現(xiàn),本體模型的結(jié)構(gòu)如圖4所示。非遺知識(shí)本體模型面向非遺知識(shí)的組織與管理,提供對(duì)非遺領(lǐng)域知識(shí)的形式化表示,滿足了對(duì)非遺項(xiàng)目申報(bào)與認(rèn)證過(guò)程中的知識(shí)管理需求。對(duì)湖北省非遺知識(shí)組織與管理的實(shí)踐,驗(yàn)證了本文構(gòu)建的非遺知識(shí)本體模型的合理性和有效性。

圖4 非遺知識(shí)本體模型的可視化

非遺知識(shí)本體模型構(gòu)建的主要作用是對(duì)非遺知識(shí)的描述和形式化表達(dá)進(jìn)行規(guī)范,而數(shù)據(jù)的語(yǔ)義轉(zhuǎn)化、知識(shí)的結(jié)構(gòu)化表示與存儲(chǔ)則需要借助關(guān)聯(lián)數(shù)據(jù)相關(guān)技術(shù)進(jìn)行實(shí)現(xiàn)。

3 非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)集的構(gòu)建與發(fā)布

關(guān)聯(lián)數(shù)據(jù)技術(shù)使用統(tǒng)一資源標(biāo)識(shí)符(URI)對(duì)資源實(shí)體進(jìn)行命名描述,采用RDF作為其數(shù)據(jù)模型,鏈接、發(fā)布、共享各類信息、數(shù)據(jù)和知識(shí),從而構(gòu)成數(shù)據(jù)的關(guān)聯(lián)網(wǎng)絡(luò);采用關(guān)聯(lián)數(shù)據(jù)技術(shù)對(duì)信息與知識(shí)進(jìn)行組織,使得人與機(jī)器都能夠獲取與理解這些語(yǔ)義關(guān)聯(lián)化與結(jié)構(gòu)化的數(shù)據(jù)。關(guān)聯(lián)數(shù)據(jù)靈活的內(nèi)外部鏈接機(jī)制,能夠?qū)⒖珙I(lǐng)域、跨類型的知識(shí)對(duì)象連接成一個(gè)整體的知識(shí)網(wǎng)絡(luò)[11]。

非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)集的構(gòu)建是一個(gè)龐大而系統(tǒng)的工程。首先,明確研究范圍,梳理非遺領(lǐng)域的知識(shí)對(duì)象;其次,對(duì)領(lǐng)域?qū)嶓w進(jìn)行抽取,明確實(shí)體的各類屬性,構(gòu)建領(lǐng)域本體模型,形成敘詞表和術(shù)語(yǔ)表;再次,按照本體模型對(duì)實(shí)體進(jìn)行RDF化屬性描述,建立實(shí)體鏈接,包括領(lǐng)域內(nèi)部實(shí)體之間以及與外部開放數(shù)據(jù)間的實(shí)體鏈接;最后,選擇合適的數(shù)據(jù)存儲(chǔ)與發(fā)布平臺(tái),為人機(jī)提供訪問和數(shù)據(jù)接口。遵循關(guān)聯(lián)數(shù)據(jù)的基本原則,非遺領(lǐng)域知識(shí)關(guān)聯(lián)數(shù)據(jù)庫(kù)的構(gòu)建可以分為五個(gè)關(guān)鍵步驟,即數(shù)據(jù)建模、實(shí)體命名、實(shí)體RDF化、實(shí)體關(guān)聯(lián)、實(shí)體發(fā)布[19]。其中,數(shù)據(jù)建模過(guò)程即非遺領(lǐng)域知識(shí)本體模型的構(gòu)建過(guò)程。本文以湖北省非遺項(xiàng)目為例,探索非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)集的構(gòu)建步驟和具體實(shí)現(xiàn)的方法。非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)集構(gòu)建的技術(shù)框架如圖5所示。

3.1 非遺項(xiàng)目數(shù)據(jù)的獲取與處理

由于我國(guó)非遺項(xiàng)目數(shù)量相當(dāng)龐大,而且非遺項(xiàng)目和傳承人的認(rèn)定是動(dòng)態(tài)變化的,導(dǎo)致整個(gè)非遺領(lǐng)域知識(shí)庫(kù)的建設(shè)過(guò)程需要分層次、分批進(jìn)行。本文以湖北省非遺項(xiàng)目為例,收集整理湖北省非遺項(xiàng)目和代表性傳承人的基本信息,在此基礎(chǔ)上構(gòu)建湖北省非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)集。數(shù)據(jù)來(lái)源主要有兩個(gè)途徑,一是非遺項(xiàng)目申報(bào)與代表性傳承人認(rèn)證申請(qǐng)的數(shù)據(jù),二是通過(guò)網(wǎng)絡(luò)爬蟲、實(shí)體抽取等技術(shù),從我國(guó)非物質(zhì)文化遺產(chǎn)網(wǎng)、湖北非物質(zhì)文化遺產(chǎn)網(wǎng)等網(wǎng)站上收集的互聯(lián)網(wǎng)數(shù)據(jù),最后對(duì)收集的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗等預(yù)處理,并存儲(chǔ)在數(shù)據(jù)庫(kù)中。共收集整理了湖北省國(guó)家級(jí)、省級(jí)和地市級(jí)非遺項(xiàng)目370項(xiàng),代表性傳承人310位,包括湖北省行政區(qū)劃與非遺項(xiàng)目類型等數(shù)據(jù)。為準(zhǔn)確研究非遺的地域分布,將不同地區(qū)的同一非遺項(xiàng)目進(jìn)行拆分。

圖5 非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)集構(gòu)建的技術(shù)框架

3.2 實(shí)體RDF化

RDF(Resource Description Framework)即資源描述框架,是關(guān)聯(lián)數(shù)據(jù)使用的數(shù)據(jù)模型,其采用三元組的結(jié)構(gòu)化形式對(duì)資源進(jìn)行描述。RDF使用“實(shí)體、屬性、屬性值”三元組陳述來(lái)描述事物。實(shí)體RDF化即是對(duì)每個(gè)對(duì)象及其屬性利用RDF語(yǔ)義描述語(yǔ)言進(jìn)行規(guī)范化和結(jié)構(gòu)化描述。在標(biāo)準(zhǔn)詞表和領(lǐng)域本體的前提下,進(jìn)行詞匯的RDF映射與實(shí)體對(duì)象的RDF描述;實(shí)體RDF化可以分為手動(dòng)描述和自動(dòng)轉(zhuǎn)化,自動(dòng)轉(zhuǎn)化是將結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)依據(jù)本體模型進(jìn)行數(shù)據(jù)映射,轉(zhuǎn)換成RDF數(shù)據(jù)。

由于眾多傳統(tǒng)的非遺信息系統(tǒng)主要用關(guān)系型數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)存儲(chǔ),本文選擇基于D2RQ進(jìn)行數(shù)據(jù)語(yǔ)義映射,將關(guān)系型數(shù)據(jù)庫(kù)中的內(nèi)容轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù)。D2RQ平臺(tái)是目前關(guān)聯(lián)數(shù)據(jù)構(gòu)建過(guò)程中廣泛使用的工具,其以虛擬RDF圖的方式訪問關(guān)系型數(shù)據(jù)庫(kù),支持主流的關(guān)系型數(shù)據(jù)庫(kù),并提供SPARQL查詢接口及Web化的執(zhí)行界面⑤。D2RQ平臺(tái)的核心功能模塊包括D2R Server、D2R Engine與D2R Mapping,其中,Mapping映射語(yǔ)言定義數(shù)據(jù)映射的規(guī)則,規(guī)范關(guān)系型數(shù)據(jù)庫(kù)結(jié)構(gòu)與本體模型的關(guān)系。數(shù)據(jù)的語(yǔ)義映射即是將二維表結(jié)構(gòu)轉(zhuǎn)換成更善于處理復(fù)雜關(guān)系、更富有語(yǔ)義信息的關(guān)聯(lián)數(shù)據(jù);具體包括數(shù)據(jù)表向類映射、數(shù)據(jù)表中的列向?qū)傩杂成?、關(guān)系表向關(guān)聯(lián)關(guān)系映射。在映射語(yǔ)言中,使用d2rq:ClassMap定義本體模型的類,對(duì)應(yīng)數(shù)據(jù)表的映射,使用d2rq:PropertyBridge定義本體模型中的屬性,對(duì)應(yīng)數(shù)據(jù)表中的列及關(guān)系表的映射。

對(duì)關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)向RDF的映射,要遵循本體模型中定義的類與屬性。如圖6所示,將關(guān)系型數(shù)據(jù)庫(kù)中五個(gè)主要數(shù)據(jù)表映射為非遺項(xiàng)目、傳承人、分類與地理位置四個(gè)核心類及其屬性,其中,關(guān)系表映射為“hasInheritor”對(duì)象屬性;每個(gè)數(shù)據(jù)表的字段映射為相應(yīng)的屬性。表2對(duì)應(yīng)映射框架,是將項(xiàng)目表、傳承人、傳承關(guān)系表進(jìn)行語(yǔ)義映射的核心語(yǔ)句。

圖6 類及屬性的映射框架

最后,根據(jù)數(shù)據(jù)映射文件,使用D2RQ平臺(tái)的dump-rdf工具將關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)轉(zhuǎn)換生成RDF/XML格式文件,供其他數(shù)據(jù)庫(kù)或第三方應(yīng)用程序使用。雖然D2RQ也可以對(duì)關(guān)聯(lián)數(shù)據(jù)進(jìn)行發(fā)布,但其對(duì)數(shù)據(jù)的更新與管理不夠靈活,對(duì)復(fù)雜關(guān)系和海量數(shù)據(jù)的支持有限。因此本文使用D2RQ對(duì)數(shù)據(jù)進(jìn)行語(yǔ)義轉(zhuǎn)換,將其轉(zhuǎn)換為RDF/XML格式文件。然后將數(shù)據(jù)存儲(chǔ)在專門的Triplestore數(shù)據(jù)庫(kù)中,并配置服務(wù)器實(shí)現(xiàn)數(shù)據(jù)的關(guān)聯(lián)發(fā)布和數(shù)據(jù)開放接口。

3.3 實(shí)體關(guān)聯(lián)

實(shí)體關(guān)聯(lián)是在實(shí)體RDF化描述的基礎(chǔ)上,采用RDF鏈接描述不同實(shí)體對(duì)象間的語(yǔ)義關(guān)系,同時(shí)盡可能地與外部數(shù)據(jù)建立關(guān)聯(lián),從而構(gòu)建關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)[20]。將數(shù)據(jù)關(guān)聯(lián)到其他開放RDF數(shù)據(jù)集與詞匯表是豐富關(guān)聯(lián)數(shù)據(jù)語(yǔ)義的關(guān)鍵步驟[21]。實(shí)體鏈接應(yīng)更多地將內(nèi)部數(shù)據(jù)與外部開放數(shù)據(jù)集進(jìn)行語(yǔ)義鏈接,通過(guò)跨領(lǐng)域、跨學(xué)科、跨數(shù)據(jù)庫(kù)的知識(shí)聚合,實(shí)現(xiàn)知識(shí)的發(fā)現(xiàn)。

在語(yǔ)義網(wǎng)環(huán)境下,借助關(guān)聯(lián)數(shù)據(jù)的規(guī)范性和開放互聯(lián)性等突出特點(diǎn),并整合多個(gè)知識(shí)庫(kù),能夠提高非遺領(lǐng)域知識(shí)的豐富程度和廣度,為非遺文化的科學(xué)研究與知識(shí)傳播提供數(shù)據(jù)基礎(chǔ)和知識(shí)服務(wù)。為豐富非遺領(lǐng)域知識(shí),本文選擇與DBpedia以及GeoNames關(guān)聯(lián)數(shù)據(jù)項(xiàng)目進(jìn)行數(shù)據(jù)匹配與關(guān)聯(lián)。通過(guò)與DBpedia及其數(shù)據(jù)來(lái)源維基百科的關(guān)聯(lián),獲得與非遺項(xiàng)目對(duì)應(yīng)的中英文詞條;通過(guò)與全球地理數(shù)據(jù)庫(kù)(GeoNames)的關(guān)聯(lián),獲取有關(guān)非遺領(lǐng)域涉及地域的更多信息。使用OWL內(nèi)置屬性owl:sameAs將內(nèi)部知識(shí)實(shí)體與外部數(shù)據(jù)集中的實(shí)體進(jìn)行關(guān)聯(lián),表示鏈接的兩個(gè)實(shí)體對(duì)象為同一個(gè)事物。與DBpedia和GeoNames數(shù)據(jù)集的語(yǔ)義關(guān)聯(lián)如圖7所示。

圖7 非遺領(lǐng)域知識(shí)關(guān)聯(lián)數(shù)據(jù)與外部數(shù)據(jù)集關(guān)聯(lián)示意

(1)非遺項(xiàng)目實(shí)體與DBpedia關(guān)聯(lián)

DBpedia項(xiàng)目是抽取維基百科的數(shù)據(jù)而建立的以關(guān)聯(lián)數(shù)據(jù)為標(biāo)準(zhǔn)的大型知識(shí)型數(shù)據(jù)集,是關(guān)聯(lián)開放數(shù)據(jù)云圖中的核心中樞。DBpedia數(shù)據(jù)集中包含大量的用中英文描述的有關(guān)我國(guó)非遺文化的信息,與之進(jìn)行實(shí)體關(guān)聯(lián)能夠豐富非遺領(lǐng)域知識(shí),提高非遺知識(shí)的可見度和通用性。本文采用自動(dòng)檢索與人工檢查相結(jié)合的方式,首先通過(guò)SPARQL語(yǔ)言在線檢索DBpedia中與非遺項(xiàng)目相關(guān)的資源條目,然后對(duì)檢索的結(jié)果通過(guò)人工檢查的方式進(jìn)行篩選和核對(duì)[22],最后將檢索到的資源的URI通過(guò)owl:sameAs屬性與內(nèi)部非遺項(xiàng)目實(shí)體進(jìn)行關(guān)聯(lián)。

在DBpedia本體模型中,db:abstract屬性表示該資源的摘要,foaf:isPrimaryTopicOf屬性鏈接與該資源對(duì)應(yīng)的維基百科頁(yè)面。在線調(diào)用DBpedia的SPARQL Endpoint站點(diǎn),將非遺項(xiàng)目的相關(guān)概念通過(guò)構(gòu)建SPARQL語(yǔ)句,檢索包含該關(guān)鍵詞的資源條目。如表3所示,以“黑暗傳”為關(guān)鍵詞對(duì)DBpedia的中文標(biāo)簽進(jìn)行全文檢索,同時(shí)獲取該資源的摘要信息及對(duì)應(yīng)的維基百科頁(yè)面;然后經(jīng)過(guò)人工判斷確定檢索結(jié)果是否為相同的資源實(shí)體,并將其與內(nèi)部數(shù)據(jù)集中的非遺項(xiàng)目實(shí)體進(jìn)行鏈接。

由于DBpedia存在不完善的地方,如有些非遺項(xiàng)目缺少詞條,DBpedia提供的中文信息不全,維基百科中有關(guān)非遺的資源條目DBpedia沒有收錄,還因?yàn)榉沁z項(xiàng)目的稱謂不統(tǒng)一,通過(guò)以上方式只能正確匹配部分實(shí)體,有些還無(wú)法完全匹配。因此,本文在自動(dòng)檢索的基礎(chǔ)上,結(jié)合人工檢查的方式,盡可能多地將內(nèi)部非遺項(xiàng)目實(shí)體與DBpedia相關(guān)資源進(jìn)行關(guān)聯(lián)。最終,大概1/3的非遺項(xiàng)目與DBpedia或維基百科進(jìn)行了實(shí)體關(guān)聯(lián),也從側(cè)面凸顯了建立我國(guó)非遺百科型數(shù)據(jù)庫(kù)的必要性。

(2)地理位置實(shí)體與GeoNames關(guān)聯(lián)

GeoNames⑥地理數(shù)據(jù)庫(kù)包含全世界1000萬(wàn)余條地理名稱,并提供地理名稱替代名、經(jīng)緯度、人口數(shù)量及維基百科等信息。其采用關(guān)聯(lián)數(shù)據(jù)的原則進(jìn)行組織,為每條地理名稱定義唯一的資源URI,將地理空間語(yǔ)義信息發(fā)布到互聯(lián)網(wǎng)上。為了獲取更多有關(guān)地理位置的信息,豐富領(lǐng)域知識(shí),同時(shí)為基于地理信息對(duì)非遺文化的空間分析提供數(shù)據(jù)基礎(chǔ),本文將非遺項(xiàng)目申報(bào)地區(qū)、傳承人居住地等涉及地理位置的實(shí)體與GeoNames數(shù)據(jù)庫(kù)進(jìn)行關(guān)聯(lián)。

GeoNames數(shù)據(jù)的獲取可以調(diào)用其官方API,或者借助第三方提供的SPARQL端點(diǎn)進(jìn)行獲??;為保證與DBpedia數(shù)據(jù)關(guān)聯(lián)方式的一致,本文使用Factforge⑦網(wǎng)站的SPARQL端點(diǎn)獲取GeoNames數(shù)據(jù),其核心SPARQL查詢語(yǔ)句如表4所示。該查詢語(yǔ)句檢索“恩施州”在GeoNames數(shù)據(jù)庫(kù)中對(duì)應(yīng)的資源條目,并限定檢索的范圍為中國(guó)(編碼為CN)、資源類型為國(guó)家與地區(qū)(編碼為A)。檢索結(jié)果將返回該地理位置對(duì)象的URI,<http://sws.geonames.org/1811624/>,并可以進(jìn)一步獲取該地理位置的經(jīng)緯度以及維基百科鏈接等信息。對(duì)于地理名稱相同的情況,可以通過(guò)判斷市級(jí)與省級(jí)地理名稱(parentADM2、parentADM1)來(lái)消歧。通過(guò)上述方式,對(duì)地理位置實(shí)體的關(guān)聯(lián)達(dá)到了100%的匹配。

最后,在構(gòu)建內(nèi)部非遺領(lǐng)域知識(shí)關(guān)聯(lián)數(shù)據(jù)的基礎(chǔ)上,將非遺項(xiàng)目、人物、地理位置等多個(gè)類別的實(shí)體與DBpedia和GeoNames等外部數(shù)據(jù)庫(kù)進(jìn)行關(guān)聯(lián)。最終構(gòu)建的非遺領(lǐng)域知識(shí)關(guān)聯(lián)數(shù)據(jù)庫(kù)中實(shí)體與三元組數(shù)量如圖8所示,其中共有9600余個(gè)三元組,涉及非遺項(xiàng)目、傳承人、機(jī)構(gòu)、地理、類型等多個(gè)類別的對(duì)象,與DBpedia關(guān)聯(lián)的實(shí)體有306個(gè),與GeoNames關(guān)聯(lián)的實(shí)體有124個(gè)。通過(guò)鏈接DBpedia可以更方便地與維基百科、WIKIDATA、YAGO等資源進(jìn)行關(guān)聯(lián)。而且,構(gòu)建的非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)以W3C標(biāo)準(zhǔn)完全開放,可以通過(guò)在線檢索、SPARQL Endpoint等多種數(shù)據(jù)調(diào)用方式獲取數(shù)據(jù)服務(wù)。

圖8 非遺領(lǐng)域知識(shí)關(guān)聯(lián)數(shù)據(jù)的統(tǒng)計(jì)

3.4 非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)的存儲(chǔ)與發(fā)布

將非遺領(lǐng)域各類數(shù)據(jù)與知識(shí)轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù)的形式之后,需要對(duì)其進(jìn)行持久化存儲(chǔ)與發(fā)布,關(guān)聯(lián)數(shù)據(jù)的存儲(chǔ)與發(fā)布直接影響數(shù)據(jù)的共享與重用。關(guān)聯(lián)數(shù)據(jù)存儲(chǔ)與發(fā)布有多種途徑,本文采用原生方式進(jìn)行存儲(chǔ),配置關(guān)聯(lián)數(shù)據(jù)發(fā)布的服務(wù)器,提供開放數(shù)據(jù)服務(wù)和知識(shí)服務(wù);使用OpenLink Virtuoso作為RDF數(shù)據(jù)的存儲(chǔ)與管理數(shù)據(jù)庫(kù),并利用LodView為用戶提供非遺知識(shí)庫(kù)的數(shù)據(jù)瀏覽,利用LodLive提供非遺知識(shí)關(guān)聯(lián)圖譜的可視化表示。

(1)關(guān)聯(lián)數(shù)據(jù)的存儲(chǔ)

關(guān)聯(lián)數(shù)據(jù)的存儲(chǔ)方案大致分為基于關(guān)系型數(shù)據(jù)的存儲(chǔ)、使用NOSQL數(shù)據(jù)庫(kù)存儲(chǔ)以及Triplestore數(shù)據(jù)庫(kù)存儲(chǔ)等[23]。其中,Triplestore數(shù)據(jù)庫(kù)是專門針對(duì)RDF數(shù)據(jù)結(jié)構(gòu)的特點(diǎn)開發(fā)的,具有高效的數(shù)據(jù)存儲(chǔ)、查詢及推理機(jī)制;同時(shí)因其采用統(tǒng)一的數(shù)據(jù)模型,可以實(shí)現(xiàn)數(shù)據(jù)間高效的交互。考慮到未來(lái)非遺領(lǐng)域知識(shí)的擴(kuò)展和數(shù)據(jù)的增長(zhǎng),本文選擇應(yīng)用較為廣泛的OpenLinkVirtuoso⑧作為數(shù)據(jù)庫(kù)管理軟件。Virtuoso數(shù)據(jù)庫(kù)是跨平臺(tái)可伸縮的高性能數(shù)據(jù)庫(kù)管理軟件,提供SQL、XML、RDF數(shù)據(jù)庫(kù)管理功能,支持?jǐn)?shù)十億規(guī)模三元組的存儲(chǔ)和管理[24]。Virtuoso數(shù)據(jù)庫(kù)為數(shù)據(jù)導(dǎo)入提供WEB頁(yè)面或ISQL命令等多重機(jī)制。將非遺相關(guān)的原始數(shù)據(jù)經(jīng)過(guò)語(yǔ)義描述或語(yǔ)義映射生成RDF格式數(shù)據(jù),然后導(dǎo)入到Virtuoso數(shù)據(jù)存儲(chǔ)中,并指定數(shù)據(jù)所屬的命名圖的IRI(Internationalized Resource Identifiers)。

(2)關(guān)聯(lián)數(shù)據(jù)的發(fā)布

通過(guò)上文構(gòu)建的非遺領(lǐng)域知識(shí)RDF數(shù)據(jù)需要經(jīng)過(guò)關(guān)聯(lián)數(shù)據(jù)發(fā)布,才能夠?qū)崿F(xiàn)數(shù)據(jù)的利用與共享;關(guān)聯(lián)數(shù)據(jù)常用的發(fā)布方式有基于靜態(tài)RDF/XML文件、基于關(guān)系型數(shù)據(jù)、基于RDF數(shù)據(jù)存儲(chǔ)庫(kù)、使用RDFa方式等多種途徑[25]。本文在Virtuoso數(shù)據(jù)庫(kù)平臺(tái)的基礎(chǔ)上,遵循W3C的關(guān)聯(lián)數(shù)據(jù)發(fā)布的四原則,配置關(guān)聯(lián)數(shù)據(jù)發(fā)布的服務(wù)器,提供RDF數(shù)據(jù)管理、關(guān)聯(lián)數(shù)據(jù)瀏覽、SPARQL端點(diǎn)、內(nèi)容協(xié)商等服務(wù)。

為了完整、全面地展示非遺關(guān)聯(lián)數(shù)據(jù)集中每個(gè)實(shí)體的屬性及其關(guān)系,使用LodView工具為用戶提供非遺關(guān)聯(lián)數(shù)據(jù)的瀏覽。LodView⑨是基于Jena與Spring框架開發(fā)的WEB應(yīng)用程序,支持符合W3C標(biāo)準(zhǔn)的國(guó)際化資源標(biāo)識(shí)符(IRI)的解析,將RDF數(shù)據(jù)格式轉(zhuǎn)化到HTML的工具;配置LodView的SPARQL站點(diǎn)及多媒體展示及經(jīng)緯度等屬性,根據(jù)內(nèi)容協(xié)商機(jī)制返回正確的RDF數(shù)據(jù)和網(wǎng)頁(yè)描述。非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)集的實(shí)體,按照實(shí)體的類型進(jìn)行區(qū)分,包括非遺項(xiàng)目、傳承人、地名、項(xiàng)目類型等。實(shí)體命名的URI格式為http://[baseURI]/[entityTypeName]/[entityID],其中,[entityTypeName]與本體模型中的類對(duì)應(yīng);如http://localhost:8890/resource/ichproject/359表示“非遺項(xiàng)目類”的實(shí)例“黑暗傳”;使用LodView工具展示該實(shí)例詳細(xì)信息的頁(yè)面如圖9所示。

圖9展示了非遺項(xiàng)目“黑暗傳”實(shí)例的所有屬性。頁(yè)面上部為多媒體展示部分,直觀顯示與其相關(guān)的圖片、視頻等多媒體資源,頁(yè)面中羅列出該項(xiàng)目的代表性傳承人、所屬類型、分布地區(qū)等關(guān)聯(lián)對(duì)象。比如,通過(guò)ich:hasInheritor屬性鏈接該項(xiàng)目的代表性傳承人,點(diǎn)擊超鏈接跳轉(zhuǎn)至圖10所示傳承人對(duì)象的詳細(xì)頁(yè)面。當(dāng)用戶訪問時(shí),提供直觀的HTML頁(yè)面;應(yīng)用程序訪問時(shí),根據(jù)不同的內(nèi)容請(qǐng)求,返回RDF/XML、RDF/Turtle、JSON等相應(yīng)格式的數(shù)據(jù)。

在非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)集中,地理位置類對(duì)象與GeoNames進(jìn)行了關(guān)聯(lián)。圖11是地理位置類“神農(nóng)架林區(qū)”實(shí)例的信息頁(yè)面,使用在線地圖的形式,根據(jù)經(jīng)緯度信息顯示地圖中的位置。頁(yè)面中部顯示地理位置類的具體屬性,并與DBpedia、GeoNames及Wikipedia進(jìn)行關(guān)聯(lián);頁(yè)面底部通過(guò)ich:hasPlace屬性的逆反性,反向檢索出該地區(qū)擁有的非遺項(xiàng)目和傳承人對(duì)象。

3.5 非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)的可視化

非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)集的獨(dú)特性是以事物間的關(guān)系為核心,而事物間復(fù)雜的關(guān)系最適合使用圖形化的方式表示。非遺知識(shí)關(guān)聯(lián)關(guān)系的可視化通過(guò)LodLive⑩系統(tǒng)實(shí)現(xiàn),LodLive以可視化知識(shí)圖譜的方式對(duì)非遺知識(shí)庫(kù)的數(shù)據(jù)提供直觀的數(shù)據(jù)瀏覽服務(wù)。LodLive僅僅基于SPARQL端點(diǎn)就可以實(shí)現(xiàn)對(duì)RDF資源進(jìn)行導(dǎo)航;通過(guò)配置SPARQL Endpoint站點(diǎn),LodLive可自動(dòng)查詢與該實(shí)例相關(guān)的三元組信息,并與DBpedia、GeoNames等外部數(shù)據(jù)集進(jìn)行關(guān)聯(lián)查詢。

圖9 非遺項(xiàng)目對(duì)象頁(yè)面

圖10 傳承人對(duì)象頁(yè)面

圖11 地理位置對(duì)象頁(yè)面

在知識(shí)關(guān)聯(lián)圖譜中,節(jié)點(diǎn)表示對(duì)象實(shí)例,鏈接兩個(gè)節(jié)點(diǎn)的箭頭則表示二者間的關(guān)系。每?jī)蓚€(gè)實(shí)例對(duì)象之間,都直接或間接地存在某種聯(lián)系,以任意一個(gè)知識(shí)對(duì)象為起點(diǎn),都可以發(fā)現(xiàn)其他與之相關(guān)的對(duì)象及他們之間的相互關(guān)系,以遞進(jìn)的方式展示知識(shí)的關(guān)聯(lián)性。這種細(xì)粒度的知識(shí)組織和互聯(lián)方式使數(shù)據(jù)的集成與利用變得更加容易。

圖12是以非遺項(xiàng)目“黑暗傳”為中心的知識(shí)關(guān)聯(lián)圖譜。其中,右側(cè)描述了該項(xiàng)目的基本信息,中間區(qū)域是領(lǐng)域內(nèi)部知識(shí)關(guān)聯(lián)數(shù)據(jù)集,包括項(xiàng)目傳承人、項(xiàng)目類型、分布地區(qū)等具體實(shí)例,與之鏈接的節(jié)點(diǎn)可以繼續(xù)展開。左側(cè)區(qū)域?yàn)殛P(guān)聯(lián)的外部DBpedia、GeoNames等數(shù)據(jù)集,通過(guò)自建的關(guān)聯(lián)數(shù)據(jù)集與外部不同數(shù)據(jù)源的實(shí)體關(guān)聯(lián),可以獲得更多相關(guān)的知識(shí)信息。通過(guò)關(guān)聯(lián)關(guān)系的圖譜化呈現(xiàn),能夠發(fā)現(xiàn)更多隱含的有價(jià)值的非遺知識(shí)。

除了將非遺知識(shí)以關(guān)聯(lián)圖譜的形式進(jìn)行可視化之外,還可以借助地理信息系統(tǒng)(GIS)以在線地圖的形式展示非遺知識(shí)中的地理特征。通過(guò)與GeoNames數(shù)據(jù)庫(kù)關(guān)聯(lián)以及利用地理編碼技術(shù)獲取非遺項(xiàng)目或傳承人實(shí)體的經(jīng)緯度信息,在基礎(chǔ)地圖服務(wù)的基礎(chǔ)上實(shí)現(xiàn)非遺知識(shí)地圖可視化。圖13是非遺地圖可視化界面,頁(yè)面左側(cè)按照行政區(qū)劃與項(xiàng)目類型提供分類導(dǎo)航;此外,提供地圖查詢功能,查詢結(jié)果將在地圖中標(biāo)記出來(lái),點(diǎn)擊地圖上的興趣點(diǎn)可以查看詳細(xì)信息。以地理空間為主線,以非遺領(lǐng)域知識(shí)為對(duì)象,將領(lǐng)域知識(shí)圍繞地理特征進(jìn)行匯聚與組織,從而實(shí)現(xiàn)非遺知識(shí)服務(wù)的智慧化系統(tǒng)。

圖12 非遺項(xiàng)目“黑暗傳”的關(guān)聯(lián)圖譜

本文構(gòu)建的非遺知識(shí)庫(kù)以關(guān)聯(lián)開放數(shù)據(jù)集的形式進(jìn)行開放,通過(guò)互聯(lián)網(wǎng)提供非遺領(lǐng)域數(shù)據(jù)的消費(fèi)接口;在領(lǐng)域?qū)<液头沁z保護(hù)機(jī)構(gòu)的支持下,非遺領(lǐng)域知識(shí)將會(huì)得到進(jìn)一步的補(bǔ)充和更新。通過(guò)標(biāo)準(zhǔn)化的知識(shí)組織,向社會(huì)提供數(shù)據(jù)的共享與重用,促進(jìn)非遺領(lǐng)域知識(shí)的規(guī)范控制、數(shù)據(jù)共建與共享以及知識(shí)的創(chuàng)新性應(yīng)用?;陉P(guān)聯(lián)數(shù)據(jù)技術(shù)的非遺知識(shí)管理的研究,為大數(shù)據(jù)和數(shù)字人文背景下非遺領(lǐng)域知識(shí)的深度組織與開發(fā)提供了思路,對(duì)我國(guó)非遺知識(shí)的管理具有一定的參考價(jià)值。

圖13 非遺知識(shí)的地圖瀏覽與地圖查詢

4 結(jié)論與展望

語(yǔ)義網(wǎng)及關(guān)聯(lián)數(shù)據(jù)的發(fā)展,為非遺領(lǐng)域知識(shí)的組織與共享提供了新的思路與方法,改變了非遺知識(shí)的表示與表達(dá)方式。為實(shí)現(xiàn)對(duì)非遺知識(shí)的有效組織與管理,本文在對(duì)非遺領(lǐng)域知識(shí)進(jìn)行加工與整理的基礎(chǔ)上,梳理出非遺知識(shí)要素與語(yǔ)義關(guān)系,構(gòu)建了非遺知識(shí)本體模型,以揭示非遺領(lǐng)域豐富的知識(shí)以及知識(shí)間的內(nèi)在聯(lián)系?;陉P(guān)聯(lián)數(shù)據(jù)技術(shù)構(gòu)建的非遺知識(shí)關(guān)聯(lián)數(shù)據(jù)集,以關(guān)聯(lián)開放數(shù)據(jù)的形式提供數(shù)據(jù)的消費(fèi)與共享,并基于關(guān)聯(lián)數(shù)據(jù)集提供領(lǐng)域知識(shí)的關(guān)聯(lián)展示、知識(shí)可視化等知識(shí)服務(wù)。

本體與關(guān)聯(lián)數(shù)據(jù)的思想與技術(shù)在非遺領(lǐng)域知識(shí)組織方面具有巨大的優(yōu)勢(shì),利用關(guān)聯(lián)數(shù)據(jù)技術(shù)構(gòu)建我國(guó)非遺領(lǐng)域知識(shí)庫(kù),并與國(guó)際上的開放數(shù)據(jù)集進(jìn)行實(shí)體鏈接,能夠提高非遺領(lǐng)域知識(shí)的關(guān)聯(lián)性、共享與開放性、影響力。高質(zhì)量的非遺知識(shí)開放數(shù)據(jù)集與知識(shí)服務(wù)平臺(tái)的構(gòu)建,一方面為更深層次非遺文化的分析與研究提供了科學(xué)的數(shù)據(jù)集,另一方面促使非遺知識(shí)發(fā)揮出更大的價(jià)值,對(duì)非遺文化的傳播與傳承具有重要的意義。

非遺蘊(yùn)含著豐富的知識(shí),本文僅僅研究梳理了非遺項(xiàng)目、傳承人、地域、傳承關(guān)系等基本知識(shí)要素,知識(shí)組織的顆粒度還有待進(jìn)一步細(xì)化。非遺知識(shí)本體模型仍需要根據(jù)實(shí)際需求進(jìn)行進(jìn)一步的擴(kuò)展與豐富。后續(xù)研究將擴(kuò)大數(shù)據(jù)來(lái)源與研究對(duì)象,在大數(shù)據(jù)環(huán)境下,研究非遺海量異構(gòu)知識(shí)的組織與管理,并在此基礎(chǔ)上分析非遺項(xiàng)目的時(shí)空演變與歷史發(fā)展歷程,以及非遺文化的存續(xù)狀態(tài),深入挖掘非遺領(lǐng)域的知識(shí)內(nèi)涵。

網(wǎng)絡(luò)客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過(guò)郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號(hào)中州期刊聯(lián)盟 ICP備案號(hào):豫ICP備2020036848

【免責(zé)聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權(quán)、違規(guī),請(qǐng)及時(shí)告知。

版權(quán)所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關(guān)注”中州期刊聯(lián)盟”公眾號(hào)
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院?jiǎn)挝话l(fā)核心?

掃描關(guān)注公眾號(hào)

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言