掷箸生 发表于 2025-11-16 02:47:57

“成一农:数字人文”视野下的中国古地图数据平台建设 成一农

[摘 要] “数字人文”以“重新定义、提出以及解答人文问题”为目的,基于这一思路,未来中国古地图数据平台建设,除应基于古地图研究所面对的关键问题囊括众多的新史料以及更多的与古地图有关的信息之外,更应以史学问题为导向构建数据结构,同时注重建立与其他数据平台之间的联系,并提供古地图和史学研究所需要的分析工具,最终对诸如中国古代疆域变迁、政务处理中信息传递等热点和关键的史学问题进行探讨。上述设计思路不仅适用于古地图数据平台建设,而且适用于众多面向“数字人文”的数据平台建设,由此最终实现真正意义上的“数字人文”,并促进学术研究的发展。

[关键词] 数字人文;古地图;数据平台;大数据

一、中国古地图数据平台建设的现状
随着近年来各藏图机构收藏的中国古地图的不断披露以及“图像史学”的兴起,学界对古地图(1)史料价值的挖掘日益重视。由于“史料”是史学研究必不可少的基础,因此在过去10余年中,对中国古地图的搜集、编目、整理和出版也成为古地图研究的热点之一。与此同时,随着数字人文的兴起,除出版传统的纸本图录和图目之外,某些机构和研究者也开始试图建立古地图数据平台,不过数量有限,目前所见大致有:

复旦大学历史地理研究中心建设的“古旧地图资料数字平台”,其数据主要来源于该中心资料室所藏纸本及电子版中国古旧地图,目前已经完成第一期数据的建设,收录有《康熙皇舆全览图》、《雍正十排图》、《乾隆内府舆图》、《百万分之一中国舆图》、《大清帝国全图》、《中华民国新地图》和《中国大陆五万分之一地形图》等古旧地图。就功能而言,这一数据平台除可以阅览地图的基本信息和图像之外,还基于地图的原有索引重新制作了图上索引,由此通过整体展示与分幅索引,既可以对相关地图进行整体展示,同时又允许使用者通过内容或区域对图幅进行选择。目前第二期数据正在制作中(2)。

澳门科技大学建立的“全球地图上的澳门”(3)数据平台,这一平台主要搜集和整理绘制有澳门的各类地图,它所收地图不限于中国古旧地图,还包括世界其他地区制作的地图。就功能而言,这一数据平台主要提供了基本的检索功能以及地图图面内容和基本信息的阅览功能。

台湾地区正在进行的“皇舆搜览——寻访清宫流散历史舆图连接数位计划”,这一项目意图复制和整理收藏在世界各地的中国传统舆图。项目组将搜集到的地图以网站的形式供研究者查阅和下载,但网站的功能比较简单(4)。

少量综合性或专题性的数据平台也收录一些相关的古地图,如张萍教授主持建立的“丝绸之路历史地理信息开放平台”(5),就收录了一些与“丝绸之路”有关的古旧地图,且在现代地图上标出了这些古旧地图所涵盖的大致地理范围。又如中国台湾“中研院”构建的“中华文明之时空基础架构(CCTS)”中也收录了一些古旧地图。

世界各地的众多图书馆等藏图机构中都收藏有中国古地图,这些机构的在线目录中有时也包含有其馆藏古地图的相关信息,甚至可以查看古地图的图面内容。如美国国会图书馆收藏的中国古地图目前已经可以通过该馆网站进行检索、查阅,并且可以下载高分辨率的图像。又如台北故宫博物院已经将其收藏的古地图上线,可以通过检索的方式阅览其所藏地图的基本信息,其中“图组”类的地图可以阅览分辨率不高的图像,“单件”类的地图可以下载清晰的图档,而“内图”类的地图则只能浏览地图的基本信息。

此外,还有一些公众号或者网站提供了古地图的阅览、下载和藏图机构的链接,如“地图书”(6)。

总体而言,目前中国古地图的数据平台数量很少,其中大部分只是藏图机构提供的查阅系统;即使是专门的数据平台,功能大都非常简单,通常只是提供一些简单的检索功能以及地图基本信息和图面内容的阅览功能。目前中国古地图数据平台所提供的功能极为有限,甚至无法满足古地图研究自身的一些基本需求。而“数字人文”视野下的数据平台建设能够改变这种状况。虽然学术界目前对“数字人文”缺乏明确的定义,但大致可以归结为用计算机或者智能技术的手段来重新定义、提出和解答人文问题。因此,“数字人文”视野下的数据平台建设,其核心并不是对数据的整理和展示及对数据本身的研究,而应当是“重新定义、提出和解答人文问题”,这也决定了“数字人文”视野下“数据平台”并不能仅仅只是数据的汇集(并提供数据本身的分析工具),而应是针对“问题”进行的设计。

基于此,未来中国古地图数据平台建设要考虑两个问题:一是提供一些古地图研究所需要的基本研究和分析工具;二是针对中国古地图及其相关研究的“问题”设计数据平台本身,具体而言就是利用“数字人文”的优势,来解决一些用传统研究手段难以回答,或者是需要花费大量时间和精力来解决的问题,下面分别就这两方面进行讨论。

二、满足古地图研究需要的数据平台的功能设计
虽然研究者有时将古地图看成一种图像,并希望从“图像史”的角度对其进行解读,但古地图作为一种蕴含有地理信息的“图像”,也存在众多与通常“图像”的不同之处,因此中国古地图数据平台还需要针对这些“特殊性”开发专门的功能或工具。

例如,与现代地图不同,中国古地图图面上存在大量文字,这些文字除标注各类地名之外,有时还记载了某些地区或地点的历史和地理等内容,这些文字无论是对于古地图的研究,还是对于以这些信息为基础的相关研究而言都有一定的价值,因此需要将这些文字转化为可以检索的文本数据。但中国古地图的全文数字化不同于古籍的全文数字化。虽然目前已经有成熟的OCR软件,不过它主要针对的是书写相对“规范”的古籍。中国古地图中的文字标注大都不规范,有横向的、竖向的、斜向的,甚至存在标注不同地理要素的文字混杂在一起的现象。与此同时,位置也无一定之规,且有些地图上的文字是手写的,非常潦草,对这些文字的识别是以往主要针对古籍的OCR软件所无法实现的,因此需要在过去OCR软件的基础上开发一套针对古地图的全文数字化辅助工具。不仅如此,由于这些文字信息绝大多数都与“位置”存在密切联系,因此除了地图图面文字的数字化之外,还需要记录这些文字的图面位置以及与相关地点之间的关联,甚至有可能还需要记录这些文字之间相对的位置关系。

又如古地图的研究者在研究时通常需要对比多幅古地图的图面内容,进而通过分析古地图之间的异同,判断地图之间的传承关系以及建立地图的演化谱系。常见的图像浏览软件虽然也可以实现这一功能,但操作起来比较繁琐,且很容易发生误操作。目前开发的中国古地图数据平台虽然大都提供包括缩小、放大和平移等功能,但都没有提供多幅地图图像对比的功能。针对这一需求,古地图数据平台应当提供二至六幅古地图同屏展示的功能,且应当支持独立放大、缩小和浏览。

此外,中国古地图通常图幅巨大,边长超过1米的古地图颇为常见,虽然现在有大屏幕显示器,但对于这些原图幅巨大的古地图而言,尤其是对于那些针对某幅古地图的深入研究来说,在屏幕上浏览依然颇为不便。虽然可以将这些古地图打印出来阅览,但目前民用彩色打印机最大只能支持A3纸张,这对于动辄边长1米以上的古地图而言还是太小了;而缩小打印出来的图像颇为模糊,难以用于研究。因此,中国古地图数据平台需要针对这一需求开发古地图自动切分打印功能,即按照使用者的需求将古地图自动切分为打印机支持的尺幅,此后研究者只需将打印出来的图像拼合,即可以按照原图的大小查阅地图。

由于种种原因,某些中国古地图不宜对外公开,但这些地图对于研究者而言又是其研究所必需的。为了解决上述矛盾,古地图数据平台应当整合一套用户授权系统,通过技术手段防止未授权者对平台中的内容进行修改,以及通过拷贝、打印、拍照等方式对古地图进行非法复制。

大致而言,为满足古地图研究的基本需要,古地图数据平台应当包括以下一些功能:1.支持检索和查阅古地图的基本信息(7);2.应当支持众多目前流行的图像格式,如BMP、JPG、TIFF、PNG和JP2等;3.支持二至六幅图像的同屏阅览;4.支持图像的彩色和黑白打印输出,且支持将图幅较大的图像自动切分打印;5.支持各类扫描仪的输入,也支持直接导入图像文件;6.数据库中的地图图像应当以加密方式储存,且在软件运行期间,可以确保无法通过其他软件读取图像以及图像目录;7.支持数据库的备份,且支持备份文件的加密,支持定期清理冗余数据和查找重复数据;8.数据库的分级管理,不同级别的使用者被赋予不同的修改、添加、阅览和检索数据等的权限。

以上只是中国古地图数据库针对古地图自身研究应当具备的基本功能,但要将其真正服务于学术研究则还要针对“问题”进行平台的整体设计。

三、针对“问题”的古地图数据平台的整体设计
正如前文所述,“数字人文”视野下的古地图数据平台的设计主要针对的应当是“问题”,那么现在需要考虑就是古地图研究所涉及的“问题”是什么?这是一个很难具体回答的问题,毕竟随着学术自身以及社会的演变,学术发展的趋势以及价值判断也会发生变化,由此也会导致“问题”的演变,因此下文仅以近几年来相关领域的研究趋势和“问题”为例进行讨论。

长期以来中国古地图的研究主要倾向于对地图“图面”信息以及相关问题的研究,即主要讨论地图的绘制年代、绘制者、描绘的空间范围和地理信息、绘制技术以及与现存其他古地图的关系(即构建地图谱系),由此也就决定了中国古地图数据平台所应当著录的古地图的基本信息通常包括:1.地图收藏地;2.图名,原图没有图名的,通常参照学界的惯例自拟简明并能概括其内容的图名;3.绘制者;4.绘制年代和图面内容表现的年代,原图没有说明绘制年代的,通常经过对图中地理要素、绘制风格等的研究,提供一个大致的时段,且中国古地图有时绘制年代和图面内容表现的年代并不一致,通过研究能加以区分的,则两者单独列出;5.印制地;6.载体形态,通常按成图形态分为地图集、地球仪、单幅地图等,其中地图集以一册计,按实际幅数著录,同时单幅地图分切数张者,仍以一幅计,加著分切张数;7.制版类型,通常分为绘本、刻本、拓印本、石印本、刊印本及图之设色等;8.尺寸,以纵长×横长的方式标注,计量单位通常为厘米;9.以“计里画方”绘制的古地图,照录图面所注明的每方对应的里数;10.提要,介绍被著录地图覆盖的地理范围、图面的主要内容、地图之间的渊源关系,以及确定地图表现年代和绘制时代的依据等。

不过,最近几年来,在中国古地图研究领域所关注的“问题”正在发生深刻的变化,其中既包括与地图本身有关的“问题”,也包括地图之外与地图相关的“问题”,而这些内容应当是当前以及未来中国古地图数据平台设计所需要考虑的。

就研究对象而言,长期以来,中国古地图的研究主要关注那些绘本地图(集)和重要的刻本地图集,以及少量古籍中重要的插图,但实际上存世的古籍中有着大量以插图形式存在的地图,仅就《续修四库全书》、《四库全书存目丛书》、《四库禁毁书丛刊》、《四库未收书辑刊》以及《文渊阁四库全书》五套丛书统计(去除了上述丛书中重复收录的古籍;此后的统计数据都来源于这四套丛书),其中收录的地图多达5000余幅。与那些深藏于各藏图机构的绘本地图(集)相比,这些古籍中作为插图的地图是易得和常见的,但数量如此庞大的古地图在以往相关资料的整理与研究中基本被忽略,其原因一方面是古籍中的插图,大多是刻版的,其精美程度难以与绘本地图相比;另一方面传统中国古代舆图的研究大都只关注那些体现了“科学性”的看上去绘制“准确”的地图,从这一视角来看,古籍中的地图绝大多数都是示意性质的,远远谈不上“科学”。但是与绘本地图(集)以及那些以往被认为重要的刻本地图集相比,古籍中作为插图存在的地图也有其自身的价值。一般而言,保存至今的大部分绘本地图,都是因时因事而绘,具有较强的针对性,比如留存众多的明清时期的河工图。但这些地图通常流通范围不广,且绘制成本较高,也使得其难以被大量复制。而古籍中的地图,保存至今的大都是刻本书籍中的地图,印刷量通常较大,且收录这些地图的大多属于士大夫重点关注的经、史类著作,因此与绘本地图相比,古籍中作为插图的地图,在很大程度上代表了当时士大夫所能看到的地图(8)。

此外,现存的宋代及其之后的地方志中通常都存在数量不等的地图。由于长期以来定期或不定期的编纂,留存下来的中国古代的地方志数量庞大。如《中国地方志联合目录》中就著录地方志8200多种,虽然其中一些地方志没有地图,还有一些地方志中的地图在流传过程中散佚,但基于其庞大的数量,当前留存下来的古代地方志中的地图的数量极为可观。

除了有自身的史料价值外,地方志尤其是古籍中的地图与传世的绘本和刻本地图之间经常会存在渊源关系,因此只有对两者进行整体性研究,才能更为完整地揭示中国古代地图的样貌。针对“更为完整揭示中国古代地图的样貌”这一问题,古地图数据平台的设计就应当将这两类地图囊括进来(9)。但需要注意的是,除与绘本和单行本的刻本地图相近或者相同的基本信息之外,无论是古籍中的地图,还是地方志中的地图,都有着其他需要著录的重要信息。如同一部古籍的不同版本中所收录的同一图名的地图,在具体内容上可能并不相同。如明代叶盛《水东日记》中收录了元人清濬于至元庚子(1360年)所绘《广轮疆里图》,目前比较容易找到的版本有《文渊阁四库全书》本和嘉靖刻本。其中嘉靖刻本中地图上的字迹模糊,甚至难以辨识,而《文渊阁四库全书》本中的地图则刻印得非常清晰,如果进行比较的话,可以发现,嘉靖本地图上的文字注记要多于《文渊阁四库全书》本地图上的。因此,虽然这两幅地图的主体信息基本一致,但它们应当被认为是同一幅地图的不同版本。由此,数据平台在著录古籍中地图时必须要著录收录这一地图的著作的版本。正是由于中国古地图之间经常存在传承关系,数据平台的设计中应当将这种“关系”表达出来。

总之,随着“更为完整揭示中国古代地图的样貌”这一地图学史问题的提出,中国古地图数据平台的设计不仅要囊括更多的数据,而且还需要对基本数据结构进行调整。

不仅如此,以前中国古地图的研究往往只重视现存的地图,但在文献中还保存有大量已经散佚的地图,而这些地图同样是描述中国古代地图全貌不可或缺的内容。而且,虽然留存下来大量清朝日常政务中所使用的地图,如河工图、海塘图和行宫图等,但由于这些地图的图面大都没有记载地图绘制的背景和目的,且在近现代的档案整理中,它们与其原本所属的奏折或者文档被整理者拆分开来,因此现代研究者也就难以将这些地图与相关的历史事件关联起来。但在现存的明清文献中,尤其是各类档案中保存有大量地图,对这些资料进行梳理,通过对其中提到的地理、人物或者事件信息进行分析,则有可能将其中提到的地图与现存的中国古地图建立起联系,由此可以深化对某些现存地图的认知。基于这一“问题”,古地图数据平台建设除了要包括“地图”之外,还应当包括与“地图”有关的文字史料,且还需要设计有建立两者之间关联的工具。

需要强调的是,上述两者虽然主要满足于古地图研究的需要,但已经不再是针对“功能”,而是针对“问题”提出的对数据平台整体设计的要求。

正如前文所述,除了古地图自身的研究之外,当前历史学众多领域研究也开始注意古地图的史料价值,产生了一些具有影响力的成果。如近年来关于王朝时期以及近现代时期“疆域观念”的研究就开始以地图为史料,且得出了一些不同于以往的结论。比如林岗《从古地图看中国的疆域及其观念》认为“历史上存在两个关于中国疆域的观念系统:一个是‘禹迹图’系统,另一个是‘一统图’系统,古地图有‘本部中国’和‘周边中国’观念系统的分别。这种历史上既有联系又相互区别的两种关于中国疆域的观念,反映的正是农耕世界和游牧世界共处东亚大陆而相互冲突和融合的状况。冲突和融合的漫长历史塑造了那种有中央属土和周缘边陲之分的疆域观念。经过清朝的统治和现代民族解放运动,本部与周边划分的历史痕迹正在消退,中国由王朝国家演变成现代民族国家”(10);而成一农以王朝以及近现代时期绘制的历史地图集为主要史料,提出“任何历史书写都是时代的产物,也是时代需求的反映,‘中国疆域沿革史’的历史书写也是如此。受到‘天下观’和‘疆域观’的影响,中国古代并不存在现代意义的‘疆域沿革史’。民国时期,基于中国传统的‘政区沿革’的研究,形成了真正意义上的以王朝疆域为描述对象的‘中国疆域沿革史’的历史书写,其目的在于唤起民族自豪感以救亡图存。1949年之后,曾存在多种‘中国疆域沿革史’的历史书写,差异在于涉及的‘历史上中国疆域’的范围。最终谭其骧提出的方案占据了主导地位,因为其满足了对内强化民族团结、激发爱国主义精神,对外抵制各种对我国领土无理要求的时代需求”(11)等(12)。而且现在学界已经意识到,包括地图在内的图像的史料价值并不在于图面内容,而在于图像所反映的它与其被绘制的社会、经济以及文化之间的关系,由此也才有可能从不同的侧面回应史学问题(13)。古地图的研究除了地图本身之外,还需要涉及其他众多的史料,由此也就需要古地图平台除收录中国古地图的相关信息之外,还需要建立与其他史料之间的联系,而这又可以分为多个层面:

首先,由于“地图”是“地理”的直观反映,因此其提供地理信息也就成为中国古地图最为直接的史料价值。显而易见的是,在通过使用前文提及的OCR技术提取地图图面的地理信息之后,就需要与目前已经建立的GIS系统,如复旦大学历史地理研究中心建设的CHGIS、张萍教授主持建设的“丝绸之路历史地理信息开放平台”以及众多地名数据库进行关联,由此通过将古地图提供的地理信息与其他地理信息进行对照和关联,不仅会使研究者可以更深入地理解古地图提供的地理信息,而且也有助于将其他资料提供的地理信息进行定位。当然,从“图像入史”的研究视角来看,古地图所提供的地理信息属于“看图说话”的层面,并不是古地图所承载的最为重要的信息,甚至是不太重要的信息,但却是最基本的信息。

其次,数据平台需要针对古地图与其他学术领域交叉形成的学术问题进行设计。正如前文所述,当前留存下来数量众多的清代日常政务处理中使用的地图,而日常政务处理中的信息传递正是当前中国古代史研究的热点,且通过对留存下来的文字材料和地图分析,可以认为地图在清代甚至之前王朝的日常政务处理中确实发挥了信息传递的功能,如在以平定大小金川为代表的军事活动中以及在治理黄河等工程中,清廷的各级机构都通过地图在相互之间传递着信息。对于这一问题讨论,仅仅依靠现存的地图,或者仅仅依靠文本文献都是难以进行的,而只有将这两类文献结合起来,才能对用于地图绘制的信息的搜集方式和过程、地图绘制者、绘制时信息的处理方式、地图的传递过程、各级机构从地图中获得的信息类型及其对信息的反馈、地图的收藏和储存等等问题进行讨论。而对这些问题的讨论,不仅有助于理解中国古代地图的绘制、生产及其使用,更有助于深入理解清朝日常政务的运作机制、某些历史事件的过程以及影响这些事件过程的因素等。由此,在设计中国古地图数据平台时,不仅在数据结构中要包括上述与地图自身有关的内容、与地图有关的文本文献,而且还要建立起与其他众多数据平台之间的联系。

再次,正如前文所述,当前存在一些以古地图为史料进行的研究。与前两点不同,这些领域的研究通常远远超出了古地图本身,如上文提及的对王朝时期“疆域观念”的研究。在这些研究中,古地图虽然是基础甚至是主要史料,但同时还要辅助以大量其他史料。为了回答这些问题,在中国古地图数据平台的设计中,同样要建立起与其他众多数据平台之间的联系。

通过上述分析可以认为,随着古地图研究以及史学研究的发展,“数字人文”视野下的中国古地图数据平台的设计与之前的数据平台有着本质的区别,其不仅要囊括众多“新”史料以及更多的与古地图有关的信息,而且还需要建立与其他数据平台之间的联系。需要强调的是,“与其他数据平台之间的联系”要求中国古地图数据平台不仅要预留有与其他数据平台之间建立联系的“接口”,而且要针对这一需求对平台本身的数据结构的设计方式进行深入思考。当然,这种数据平台之间的联系,也是“数字人文”内在的需求,是真正实现“数字人文”的基础。

数据平台当然还需要提供一些相关的分析工具,毕竟随着计算机技术的发展,这些分析工具不仅可以节约研究者的时间,而且也会使分析结果更为准确,但本文之所以不对此进行强调,是因为在本人看来,史学研究的基础在于研究者的“主观性”或者“人性”,因为“问题”是研究者提出的,“问题”的意义也是研究者赋予的,同时对于“问题”的回答路径也是研究者选择的,而分析工具只是工具而已,其必然随着研究者的选择而发生着变化,并无一定之规(14)。

结 语
总体而言,“数字人文”视野下的中国古地图数据平台与之前数据库和数据平台之间的本质差异在于,其不拘泥于古地图本身以及学界所习惯的处理古地图的方式,而是要针对学界所关注的与古地图相关的问题,即重点在于“问题”而不在于“数据”,且这点应当也是“数字人文”视野下其他数据平台开发的出发点。

如果理解了此点,那么很有可能将会改变未来各类数据平台的开发模式,即由于对所有“问题”的回答都应当涉及众多不同的材料,即使用越多的材料越能加深或者拓展对于“问题”的认知,因此“互联互通”也就成为数据平台开发的基本理念,由此也就会“顺其自然”地打破目前各个数据平台之间的“壁垒”,从而真正达成“数字人文”所需要的“大数据”。

古代地图虽然没有版权问题,但出版绘本和刻本古地图(集)则存在使用权的问题,且按照相关规定,地图在出版和发行之前需要送交相关部门审定,这两者可能极大地影响了中国古地图数据平台的建设和发布。中国国家图书馆不仅是世界上收藏中国古地图最多的藏图单位,而且它还收藏有数量庞大的古籍以及地方志,其藏品中有着丰富的“地图”,中国国家图书馆应当是未来建设中国古地图数据平台的主要力量。不仅如此,长期以来,中国国家图书馆已经建设了数量可观的各类数据平台,比较容易建立古地图数据平台与这些数据平台之间的关联,为实现本文一再强调的针对“问题”的数据平台建设奠定了基础。就地图的审定而言,则可以与相关负责单位进行联系,按照类型分批进行。
作者简介:成一农,历史学博士,云南大学历史与档案学院教授。

基金项目:2020年度国家社会科学基金冷门绝学研究专项学者个人项目“明代边海防地图整理与研究”(20VJXG013)。
页: [1]
查看完整版本: “成一农:数字人文”视野下的中国古地图数据平台建设 成一农