您所在的位置:CVH首页  >>  工作进展
标本采集人整理简报
发布日期:2015-09-21         点击次数:7511

概述  


  目前,植物子平台共完成数字化标本561万份,其中331万份实现了CVH网上查询共享。 这些标本均为数年来“国家科技基础条件平台”植物子平台项目参加单位的数字化标本备份,共计30余家标本馆,主要是中科院系统生物标本馆,还有四川大学标本馆等(图1)。

  对561万份的标本统计显示,标本采集省级中名列前两位的是云南和四川,分别是87万份和86万份,其他省份都在3万份以下(图2);标本采集活动主要是上世纪50年代进行,尤其是195859两年达到顶峰,均为41万份(图3)。

 http://www.cvh.org.cn/dc/w_include/images/image001.jpg

 1. 植物标本子平台数字化标本来源(标本馆代码依傅立国1993

http://www.cvh.org.cn/dc/w_include/images/specimen3.jpg

 

2. 植物标本子平台数字化标本分布省份

      对于561万份标本采集人及其采集量统计显示,共有95,987位采集人或采集队,其中,仅一份标本记录的有43,691人(队),10份以下79694人(队),100份以下采集量的91765人(队),1000份以上756人,5000份以上177人,10000份以上74人(队)(图4)。

 

 

 

 

 http://www.cvh.org.cn/dc/w_include/images/specimen1.jpg

4. 子平台标本采集人采集量统计。

 

 

采集人数据库中存在的主要问题及工作难点: 

    对采集人的初步统计分析,发现同人异名现象比较严重,即相同的采集人或采集队在不同标本馆甚至同一标本馆中因种种原因被写成不同的名称。 这种现象在采集量大,且为早期采集和复份标本多的采集人或队中更容易发生。例如,著名采集人王启无先生是本库中采集量最大的个人采集者,共105472份,其名下分别为“王启无”64706份,“C.W.Wang39829份,“王啟无”937份;类似情况还有“刘慎谔”(42154),“T.N.Liou”(18559,“Tchen-Ngo Liou”(1031),共计61744份;青藏队(56892),青藏科考队(3063),青藏补点组(3771),青藏补点(2049)等等。 

显然,标本信息中的这些同人异名现象势必影响到用户查询标本信息的结果,从而降低了标本信息共享的意义。因此,我们从比较重要和常见的“同人异名”采集人入手,进行规范化整理,找出他们之间的对应关系,以更新到数据底库中,并作为参考资料供成员单位标本整理及分类学研究参考。

  

整理原则、方法及技术路线

  

原则:考虑到561万份标本共有九千多名采集人(队),数量大,很复杂的情况,我们采取分步整理的办法,优先整理那些重要性较大,人数较少的采集人,而多人组成的采集队较为复杂,留待以后整理。在具体操作上,是首选那些采集量大且复份分布较广(即多家标本馆有收藏的)、采集年份较早,且存在同人异名现象的采集人。 

最终需整理成的采集人规范库采集队规范库,应该包括以下信息:姓名、单位、生卒年代、标本采集量、采集时间和采集省份和馆藏等关键字段,其中姓名字段尤为重要,包括中文名、外文全名和标准缩写,以及在标本库中出现的不同写法等。 

经过规范化整理形成的“采集人和采集队规范数据库”一方面可以为整理规范标本数据提供相关的标准和规范,另一方面可为用户提供更准确、全面的采集人信息,方便用户查找相同采集人的全部标本;另外还可以为国内各标本馆数字化标本的采集记录中的采集人字段进行校正。

 

方法:分现阶段整理采集量大、采集年份较早、存在同人异名现象的采集人(队)。首先,筛选出标本采集量在1000份以上名单,共有387人,涉及标本约250万份,按照规范化要求,整理出这些采集人的采集事件资料,包括对照姓名,主要的采集时间、省份和馆藏等资料;经过比对和整理,发现其中有87位采集人存在同人异名现象,涉及标本量120万份。整理出重要采集队名单,共331队,均为采集量500份以上者。整理建成的规范数据库包含采集队名和库中对照名、采集主要年代、采集主要省份、主要馆藏数量、采集号段等,涉及标本量71万份。

   

技术路线:

 

 http://www.cvh.org.cn/dc/w_include/images/liuchengtu.jpg

5. 采集人同人异名整理路线图

 

工作进展 

1.整理出《采集人整理规范库》

根据设计要求,并结合参考文献(见下文),从561万份标本大库中初步理出重要采集人名单,共387名,均为采集量千份以上者。整理建成的规范数据库包含采集人姓名和库中对照名、采集年代、采集省份、馆藏数量等,如图6所示。

 

http://www.cvh.org.cn/dc/w_include/images/ziduan1.jpg

 

6. “采集人规范数据库”字段名 

 

        下表为一些重要采集人的整理数据结果。可见其在库中的不同名称及名下标本量,以及标本保存的标本馆。 

1重要采集人

http://www.cvh.org.cn/dc/w_include/images/1.png

http://www.cvh.org.cn/dc/w_include/images/2.png

http://www.cvh.org.cn/dc/w_include/images/3.png

 

 2. 整理出《采集队整理规范库》

根据设计要求,并结合参考文献(见下文),从561万份标本大库中初步理出重要采集队名单,共331队,均为采集量500份以上者。整理建成的规范数据库包含采集队名和库中对照名、采集主要年代、采集主要省份、主要馆藏数量、采集号段等,如图7所示。

7. “采集队规范数据库”字段名 

 

2重要采集队

 

 

 

 

 

 

 

主要参考文献: 

 

1. 傅立国等主编,1993. 中国植物标本馆索引。北京:中国科学技术出版社。

2. 中国模式标本,见GBIFThe Global Biodiversity Information Facility)网站:http://www.gbif.org/

 3. 植物学命名人及采集人名称数据库,见哈佛大学网站(http://kiki.huh.harvard.edu/

4. 中国科学院中国植物志编辑委员会中国植物志北京科学出版

 

[ 编辑/admin ]
2013-5-21 22:00:25
我有话说
CVH © 2004~2015 中国科学院植物研究所 京ICP备16067583号