• Keine Ergebnisse gefunden

3 诗词文本挖掘应用于人文景观格局 研究的适应性与方法框架

Im Dokument 1 2 / 2 0 1 9 (Seite 54-59)

由于诗词属于古汉语,不能仅按照普通 的现代汉语进行分词处理,因此采取分词词 条与单字词共同参考的方式,以全面真实地 展现诗词中描绘的人文景观。结合高频词与 高频字,即可较全面客观地展现诗词中所描 绘的人文景观画像与特征。

4  以唐代诗词为样本的关中地区空间 语义与人文景观格局分析

关中地区是中国最早的人类聚居地之一,

也是历史上最早的“天府之国”。古代关中 地区指“四关”之内,即东潼关(函谷关)、

西散关(大震关)、南武关(蓝关)、北萧关(金 锁关)。现关中地区位于陕西省中部,包括西 安、宝鸡、咸阳、渭南、铜川、杨凌五市一区,

总面积55 623 km2(图2)。

关中地区人文景观资源丰富,具有极高 的历史地位。其得天独厚的地理形势、古人 传统的营城智慧、风格独到的景观构建手法,

共同构建关中特有的人文景观格局,其人文 景观具有极高的研究价值。笔者对关中地区 人文景观格局的研究包括:1)对其核心的人

文景观资源点进行梳理,在空间上进行复原和 落位;2)针对诗词文本素材,通过软件分析 进行语义挖掘,将文本与空间进行对应分析,

总结唐代关中地区的人文景观格局整体构成,

以及各类型景观空间的语义特征、情感特征、

色彩特征。

4.1  素材选取与样本处理

描绘关中地区的诗词以唐代居多,笔者 首先将唐代诗词出现地点进行汇总,进行空间 落位还原了唐代关中地区主要的人文景观点 分布地图(图3),进行空间落位,然后从唐 代诗词中筛选出有关描写关中地区人文景观 的诗词近400首,对诗词进行整理,并提取位 置信息与景观分布地图进行叠合;对样本导

入ROST CM6进行情感分析可得出关中区域

整体与不同地理位置的情感感知情况,映射在 地理空间上即可得到关中地区人文景观的正 面情感与负面情感的分布情况;将诗词原始

文本导入ROST CM6进行分词处理,再进行

词性分析。形容词通过词频统计可用作关中 地区人文景观整体意象分析和色彩格局分析,

名词通过语义网络分析可划分为不同的人文

景观空间类型,针对不同人文景观类型也可 分析其分别具有的特征。

4.2  关中地区不同类型空间的语义分析 对于诗词文本的转译与挖掘,首先使用 超级批量文本替换(ultra-replace),依据词条 的空间维度与性质,参考《古汉语词典》进行 词条的标准化,进而将文本所有的源词条替 换为对应的标准词条,完成转译。数据整理

后,运用ROST CM6软件进行文本挖掘,使

用ROST CM6中自带的“词频分析”功能项

进行形容词和名词2类词条的词频统计分析,

导出词频统计表;将词频表导入ROST CM6 中加载项工具NetDraw,构建出意境词条的可 视化网络语义图谱。

将关中地区整体形容词通过ROST CM6进 行词频分析并导入Python制作词云(图4),

可看出关中地区整体描述最多的人文景观意象。

将关中区域的形容词词条进行整体情感 分析,显示正面指数0.61,负面指数0.39,

结果表明关中区域整体情感感知为积极情感,

但消极情感仍占有较大部分比例。将所有诗

词在ROST CM6中进行逐条情感分析,结合

2

4 3

2 关中地区地理范围

The geographical scope of Guanzhong area

3 唐代关中地区主要人文景观点

Main cultural landscape places in Guanzhong area of Tang Dynasty

4 关中地区整体人文景观氛围词云

Keywords of overall cultural landscape atmosphere in Guanzhong area

位置信息将结果导入GIS中,得出关中地区 人文景观情感分布图(图5)。从图中可看出 正面情感的空间分布大致呈西北东南向,且 场所最多;中性情感空间分布相对均匀,大 致呈东西向;负面情感空间分布较为集中,

且场所最少。

提取所有诗词文本中的色彩关键词,结 合位置信息导入GIS中,可得出关中地区人 文景观色彩分布图(图6),词频越高色彩范 围越大,可看出关中地区人文景观色彩以绿、

素、青、朱为主。

人文景观类型与诗词语义的对应分析,

首先将所有名词导入ROST CM6进行语义网 络分析(图7),通过软件对所有词条按照语 义的近似性归类,并与唐代人文景观分布地 图进行空间叠合,可以发现近似语义的词条 在空间上呈现出明显的集聚性。按照空间特

征和位置分布,可将所有词进行分类,可大 致归纳为长安故都、行宫别苑、山水形胜、

田园意境和雄关遗迹5种不同的景观空间类型

(表2)。

将以上5种类型的诗词文本进行情感指 数分析(表3),可看出不同的空间类型的 情感指数有很大差异,有关田园意境的正面 情感指数最低,仅0.29,说明田园意境的人 文景观相对更具有消极特征;行宫别苑空间 的正面情感指数最高,高达0.99,其次是长 安故都,为0.67,说明行宫别苑与长安故都 的人文景观相较其他空间类型更具积极特征。

唐代行宫在地域分布上呈现出在京都周围密 集的特点[15],结合图5可看出,长安及其周 边具有较多的正面情感分布点,符合客观特 征。对5种空间类型进行具体的空间语义人 文景观分析:

1)长安故都。将长安故都空间类型诗词 的形容词进行语义网络分析,可看出整体的 空间氛围围绕“九重”一词展开(图8)。“九”

在古汉语中释义为“多数”或“多次”,“九 重”释义较多,可译为多层、天、宫门、朝 廷、帝王皇位等。由此看来,长安故都的营 城手法与人文景观空间布局原则均严格遵守

“九重”这一原则,例如城市格局以象征皇 权的宫城长宽为基准,城中以其等比相似形 态划分,隐喻“化家为国”之意[16]。在语义 网络图中,可看出与九重关联较大的词为“娇 奢”“窈窕”“豪华”“十六”(指代长安 十六宅)等词,均体现了当时长安城内奢华 的人文景观。

2)行宫别苑。使用相同的语义网络分析 方法,可看出行宫别苑类型的人文景观尺度 中,宫墙常与鼓声、照影、池塘、骊山等构

表 2 语义词条与空间的对应关系及景观空间分类

Tab. 2 The correspondence between semantic terms and space and landscape spatial classification

词条语义 对应空间点位 对应景观空间类型

黄金、歌舞、美人、白玉、金阶、君王、长安、公子等 大明宫、兴庆宫、太极宫、荐福寺等 长安故都

梨园、天子、珠帘、凤凰、大道、秋千等 华清宫、翠微宫、石瓮寺等 行宫别苑

楼台、柳条、江边、白马、青云、落花、南山等 曲江、灞河、终南山、秦岭等 山水形胜

莲花、落日、陌上、桃李、明月、云端、玉女等 周至、蓝田、悟真寺、辋川等 田园意境

旌旗、骏马、渭水、万国、登临、瑞气、走马、将军等 潼关、茂陵、高冠谷、沣水等 雄关遗迹

表 3 不同空间类型情感指数

Tab. 3 Emotional index of different spatial types

空间类型 正面情感指数 负面情感指数

长安故都 0.67 0.33

行宫别苑 0.99 0.01

山水形胜 0.64 0.36

田园意境 0.29 0.71

雄关遗迹 0.50 0.50

5 关中地区正面、中性、负面人文景观情感空间分布

Spatial distribution of positive, neutral and negative cultural landscape emotions in Guanzhong area

6 5

6 关中地区人文景观色彩分布

Cultural landscape color distribution in Guanzhong area

成一组;宫女常与歌舞、芙蓉、白玉、温泉、

城楼构成一组;渭河常与鼓楼、玉树、秦岭、

华清池构成一组,此组特指华清宫的人文景 观。华清宫背靠骊山,面对清渭,集聚山光水 色与亭台楼榭,是唐代行宫之最[17]。不难看 出,行宫别苑的人文景观与长安的气派相较,

更具赏乐的成分。

3)山水形胜。使用相同的语义网络分析 方法,可看出山水形胜的景观格局中,华山 三峰(东峰朝阳峰、南峰落雁峰、西峰莲花 峰)与石作、松柏等组成一组;杨柳与石林、

秦山、高城、碣石等组成一组;曲江与歌舞、

芙蓉等组成一组,这一组即唐代曲江芙蓉园 的人文景观,每年春季,百姓甚至是皇帝,

均到此游玩,独具人文特色。综上可见,华 山与曲江是关中山水形胜人文景观之中的重 要元素。

4)田园意境。在田园意境的景观格局语 义网络分析中可看出,芳草常与垂柳、鸟声、

游人构成一组;乡村常与麦苗、田夫(农夫)、

野老(村野老人)等构成一组;落日常与古道、

古树、渡头等构成一组;相比其他人文景观 要素,田园意境相对较为低沉,符合前文的 情感分析结果。

5)雄关遗迹。雄关遗迹的景观格局语义 网络分析中可看出,君臣常与江海、尘埃、

长缨等构成一组,楼台常与行人、杨柳、走马、

江边构成一组。这些元素的人文景观构成高

远明丽、意蕴深厚,一般交织着感慨、报国、

思乡等多种情感,符合情感分析的正负指数 均衡特点。

4.3  关中地区人文景观格局的画像与特征 总结

对不同类型和尺度的景观空间的名词进 行词频与字频分析(表4)。

在长安故都人文景观尺度中可明显看出

“君王”“天子”的词频数最高,这一现象 表明,在当时的长安城内,带有皇权特征的 人文景观给诗人留下最深刻的印象,这与前 文中的“九重”不谋而合。“珠帘”“车马”“龙 池”“衣裳”“凤凰”“金殿”“歌舞”等词,

也展现了当时长安城内奢华、独特的人文景 观。从高频字看,花卉为长安故都的重要人 文景观,结合高频词可看出包括牡丹、芙蓉、

桃李、樱桃、杏花等。

在行宫别苑的人文景观尺度中,常见元 素为温泉、楼殿、歌舞、池水、梨园等。例 如罗隐的《华清宫》中描写到“楼殿层层佳 气多,开元时节好笙歌”;王建的《温泉宫行》

描写为“宫前内里汤各别,每个白玉芙蓉开”

都是对行宫别苑人文景观的真实写照,符合 通过语义网络分析的赏乐特性,也具有很高 的正面情感特征。

在山水形胜的人文景观尺度中,常见景 观元素为流水、高山、道路、杨柳、泉水、

楼台等。例如诗句“青天白日映楼台”“曲

江水满花千树”。

在田园意境的人文景观尺度中,常见元

在田园意境的人文景观尺度中,常见元

Im Dokument 1 2 / 2 0 1 9 (Seite 54-59)