和光同尘 挥洒人生 之三

林夕湖畔

<p class="ql-block" style="text-align:center;"><b style="font-size:22px; color:rgb(237, 35, 8);">我与图书情报事业的不解之缘</b></p><p class="ql-block" style="text-align:center;"><span style="font-size:22px; color:rgb(237, 35, 8);">(第三篇)</span></p><p class="ql-block" style="text-align:center;"><span style="font-size:22px; color:rgb(237, 35, 8);">孟连生</span></p><p class="ql-block"><br></p> <p class="ql-block" style="text-align:center;"><b style="color:rgb(255, 138, 0); font-size:22px;">读研究生</b></p> <p class="ql-block"><span style="font-size:22px;">  1978年我国恢复研究生培养制度,第二年中国科学院图书馆开始招收硕士研究生。早在大约一年之前得知此事,我就开始着手进行考试的各项准备工作,尤其是重点学习两门专业课和政治思想课考试所需要的各方面知识。1979年秋季,我以较好的成绩通过招生考试,成为中国科学院图书馆成立以来首次招收的四个硕士研究生之一。</span></p><p class="ql-block"><span style="font-size:22px;"> 同届招收的还有朱献有、许志强和晁芳三位同学,他们三人都是学习计算机专业的,由中国科学院图书馆和计算所联合培养。我是图书馆专业的,由中国科学院图书馆和北京大学图书馆系联合培养,导师是图书馆的彭溎源研究馆员和北大图书馆系的周文骏教授。中国科学院各个研究所招收的研究生都属于中国科大研究生院(中国科学院研究生院的前身)的学籍,在研究生院上基础课。</span></p><p class="ql-block"><span style="font-size:22px;"> 中国科大研究生院刚刚恢复招生时没有自己的校舍,而是在现在北京林业大学的主楼那里授课,只有教学大楼,不具备安排学生住宿的条件,所有学生的住宿都是由各研究所自行安排。图书馆的房屋条件十分紧张,在中关村南路8号馆舍的后面有一个不大的院子,北面有一所较大的平房是职工食堂的厨房和餐厅,餐厅的西面盖了一个烧开水的锅炉房。南面盖有8间平房,俗称“八间房”,每间大约有12平方米。八间房里都住满了人,有食堂的大师傅,有年纪比较大的单身职工,还有新毕业来馆工作的大学生。经领导协调,在那里腾出一间房子作为研究生宿舍,我们三个男生住在那里,一个女生则住在附近的家里。</span></p><p class="ql-block"><span style="font-size:22px;"> 那时我家住在前门东大街,从中关村回家一趟骑车往返需要2个多小时。为了节省路上花费的时间,研究生学习期间我基本上都是住在宿舍,通常只是周末进城回家看看。在做学位论文的关键时刻,每天都要加班加点地干活,几个月也不能回家一趟。读研究生的三年时间,我们三个研究生挤在那个小小的房间里挑灯夜战的场景令人回味。我们与邻居们的关系也很融洽,朝夕相处,亲如一家,度过了美好而难忘的时光。下班后大伙儿在院子里洗衣做饭,散步聊天的情景历历在目。那段时间学习很紧张,生活很艰苦,日子很充实。</span></p><p class="ql-block"><span style="font-size:22px;"> 得益于几年来一直坚持收听外语广播讲座,我的英语考试成绩相对好一些。开学后经过英语摸底考试,我被划分到了A班,外教老师讲课的比重偏大一些,英语基础知识方面的教学内容相对较少一些,更加侧重于提高实际交流能力方面的训练。这一阶段值得提及的事情是,学校经常组织著名科学家的讲座活动,以扩大学生的基础知识面,培养学术分析解决问题的能力。</span></p><p class="ql-block"><span style="font-size:22px;"> 我们曾经聆听卢嘉锡、严济慈等多位资深院士的学术讲座,十分有益于培养学术研究工作中的综合分析能力和辩证思维能力。也曾上过李佩教授讲授的英语课,作为英语教研室主任,李教授的讲课特别受同学们的欢迎。</span></p> <p class="ql-block">研究生院英语A班全体同学合影(我右侧为外教老师)</p> <p class="ql-block"><span style="font-size:22px;">  当时中国科学院图书馆尚未拥有硕士学位授予权,致使我获得硕士学位证书还颇费了一番周折。招生时是由中国科学院图书馆和北京大学图书馆系签订的联合招生协议,中国科技大学研究生院当年招收图书馆学专业的硕士研究生只有我一个人,又是第一年招生,研究生院还没有设立图书馆学的专业课程。所以我的所有基础课在中国科技大学研究生院上,各门专业课都是在北大,与北大的同届同学们一起上课,一同考试。上学期间一切顺利,到颁发学位证书时则出了问题。</span></p><p class="ql-block"><span style="font-size:22px;"> 北大学位办不认同图书馆系与其他单位签订的联合招收培养研究生的协议,不给我颁发学位证书。虽然他们认可我在北大上的专业课的成绩,但是不认可在中国科大研究生院上的基础课的成绩。经图书馆系与校学位办的多次沟通,最后提出了一个解决方案,即参加北大下一届研究生相关基础课的考试,考试通过后学校方可同意授予硕士学位。为此,我第二年又参加了两门北大研究生基础课的考试,于1983年才获得北大颁发的硕士学位证书。而研究生毕业证书则是由中国科大研究生院于1982年颁发的,这也算是人生挫折的一段小小的插曲吧。</span></p><p class="ql-block"><span style="font-size:22px;"> 1981年7月,我有机会参加了入行以来的第一次专业会议,跟随彭溎源老师到江苏连云港,参加由北京图书馆组织的一次学术研讨会会议。会议上发言文章的标题记不得了,只记得当时要将我在会上发言的稿子,请图书馆的打字员打到蜡纸上,再印出200份带到会上,会务人员将所有会议论文集中起来,装在牛皮纸口袋中分发给每一位与会代表。在微机普及之前,会议论文的稿子基本上都是这样分发的,所不同的是有些会议要求与会代表提前将发言稿寄到会议主办单位。有些会议则要求代表开会时将打印出来的发言稿带到会上。</span></p> <p class="ql-block">汉字打字机</p> <p class="ql-block">只有专业打字员才能操作中文打字机</p> <p class="ql-block"><span style="font-size:22px;">  连云港是陇海铁路的起点,是一个依山傍海非常漂亮的小城市,街道不太宽但是非常干净整洁,风光很美,交通便捷,给我留下了深刻的印象。现在还记得,老师住的宾馆房间是2.5元一天的单人间,我住房间是三人间,房费是每人每天1.6元。那时候因公出差有伙食补贴,本市外出办事每天补助0.2元,外地出差每天补助0.8元,在火车上过夜一夜补助1.6元。老师出差可以乘坐卧铺,我只能乘坐火车的坐席,即使需要在火车上过夜亦是如此。</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size:22px;"><span class="ql-cursor"></span></span></p> <p class="ql-block" style="text-align:center;"><b style="font-size:22px; color:rgb(255, 138, 0);">泰山游览</b></p> <p class="ql-block"><span style="font-size:22px;">  连云港会议之后,我是乘坐火车坐席返回北京的,从而开创了我在北京之外的国内著名景点游览观光的先例。从连云港到北京需要20多个小时,在火车上需要过夜,所以我跟老师请了一天假,打算分两段乘坐火车,中途在泰安下车去爬泰山。</span></p><p class="ql-block"><span style="font-size:22px;"> 说是坐火车,其实是站火车,火车上的人太多了,根本没有座位可坐。车厢的过道里挤满了人,我也是站在过道上,周围大包小包的,不要说座位了,就连坐在地上的位置也没有,只能人挤人,人挨人地站在那里。那个年代公共交通系统发展得很不够,人们乘坐火车和公共汽车,在高峰时间的拥挤程度,是现在的年轻人根本无法想象的。</span></p><p class="ql-block"><span style="font-size:22px;"> 火车走走停停,几乎每个小站都有不少人上下车,车过花果山时,上来一个女孩站在了我的旁边。通过聊天知道,她叫梅丽君,出身美术世家,父亲是教授。她自己是上海市美术学校的学生,利用假期外出采风,刚从花果山下来,目的地是北京。我们会议也组织去了花果山游览,这样便有了聊天的话题。她没有去过北京,又是独自出行,所以问了我许多有关在北京吃、住、行等方面的问题。当她知道我要去泰山旅游后非常感兴趣,表示要跟我一起去登泰山,搜集素材,就这样原本一个人的泰山游计划变成了两个人的登山活动。</span></p><p class="ql-block"><span style="font-size:22px;"> 凌晨4点多钟火车抵达泰安火车站,下车后直奔山门,5点多钟我们就进入山门开始爬山了。沿途看到好看的风景,她都要停下来画一些速写,留作素材。泰山有的地方很陡,加之前一天晚上基本没有睡觉,登山途中感觉很累。但是在泰山壮美的风光之中,欣赏着美丽的少女坐在石头上作画的场景,在很大程度上减轻了登山的劳顿,为我的首次泰山之行增添了许多诗情画意。一路经过中天门、十八盘、南天门,抵达玉皇顶时已经到下午5点多钟了。</span></p><p class="ql-block"><span style="font-size:22px;"> 在泰山顶上登高望远,体味到了杜甫描述的“一览众山小”的感觉,兴奋之情难以言表。为了在山顶观看泰山日出,当晚就住在山顶上了。没想到当时留下最深印象的并不是那在烟雾缭绕中红日跃然而出的景观,而是山顶上非常恶劣的服务和住宿条件。花2元钱租借的用来睡觉盖的和早上穿的大衣冰冷潮湿,肮脏无比。不仅不保暖,而且上面的味道呛得人喘不上气来,简直无法盖在身上。晚上10多个人睡在一个大通铺上,拥挤不堪,又冷又潮,难以入眠。</span></p><p class="ql-block"><span style="font-size:22px;"> 回到北京几天以后,梅丽君专程来我家,给我女儿买了一些小礼物,对我一路给她的帮助表示感谢,还吃了我母亲做的炸酱面。与文艺女青年梅丽君火车相遇,泰山同游,也算是我人生的第二次邂逅吧。多年以后听说她去法国留学了,好像在那里定居了,也不知现在回国没有。难忘的连云港会议,</span></p><p class="ql-block"><span style="font-size:22px;"> 难忘的泰山之行,为我紧张而枯燥的研究生学习生活增添了一抹靓丽的色彩,不仅首次体验了参加专业学术会议,在会议上发言陈述自己研究成果那紧张而激动的感受,而且开创了我到名山大川旅行的先例,拉开了我在之后数十年当中,广泛游历国内外数百处风景名胜、旅游景点的序幕。此次出行可谓意义重大,收获颇丰。</span></p><p class="ql-block"><br></p> <p class="ql-block" style="text-align:center;"><b style="font-size:22px; color:rgb(255, 138, 0);">我的导师</b></p> <p class="ql-block"><span style="font-size:22px;">  我的导师彭溎源老师,早年就读于美国波士顿的西蒙斯图书馆学院,50年代初回到中国,一直在中国科学院图书馆工作,直到退休。我上研究生的时候她是文献检索室的负责人。她具有非常扎实的英文功底,还会其他数种外语,对检索室的各种参考和检索工具书都了如指掌。读者咨询文献检索和科技知识查询方面的任何问题,她都能快速准确地在相应工具书中找到答案,被读者誉为活词典。她为人和善,待人真诚,爱徒如子,言传身教,认真负责,一丝不苟。</span></p> <p class="ql-block">彭溎源老师与我的师妹陈必(后排:闫立中副馆长与我的师妹陈胜芳)</p> <p class="ql-block"><span style="font-size:22px;">  在给我讲课的时候,老师会找来相应的工具书结合实例耐心地讲解,毫无保留,尽心尽力地传授知识。她有计划地布置我学习掌握各种工具书的使用方法,详细介绍针对不同咨询问题的解答思路与步骤,定期检查我对学习内容的掌握情况。不仅在学术方面教导学生,而且十分注重在思想品德和研究方法方面培育学生。时常教育我要老老实实做人,踏踏实实做事。讲话要留有余地,研究问题要有根有据,绝不能好大喜功,不求甚解。做事情要从基础做起,埋头做事,按部就班,扎扎实实,一步一个脚印。</span></p><p class="ql-block"><span style="font-size:22px;"> 1978年,党的第十一届三中全会召开,中国进入了改革开放和社会主义现代化建设的新时期,科学的春天来到了。当时国家提出了四个现代化的建设目标,对科研工作给予高度重视和更多的经费支持。中国科学院图书馆的资源订购数量有了大幅度增加,在新增订购的文献中有一套订价最贵的检索工具书,就是美国科学情报研究所出版的《科学引文索引》(Science Citation Index,SCI,即WEB OF SCIENCE数据库的前身),当时中国只订购了两套,另一套在北京图书馆(即国家图书馆)。</span></p><p class="ql-block"><span style="font-size:22px;"> SCI是一种新颖独特的检索工具,不仅具有文献检索功能,而且具有科学计量分析功能。SCI的使用方法不同于CA、BA、EI等传统的文献检索工具,需要将其引文索引、来源索引、机构索引和轮排主题索引4个组成部分配合起来使用,才能完成文献检索的全过程。因此,尽管装帧十分精美的数十卷SCI摆放在检索室一进门最为醒目的书架上,可是在订购后的很长一段时间内,SCI始终很少有人问津。包括检索室的老师在内,没有多少人了解该索引的使用方法和利用价值,SCI犹如一颗埋藏于深山之中的宝石,有待被发现,被开发,被利用。</span></p><p class="ql-block"><span style="font-size:22px;"> 专业课学习的主要内容是要熟练地掌握科技领域的各种主要的检索工具书和参考工具书。彭溎源老师凭借几十年在一线服务岗位积累的丰富经验,有计划地、系统地安排我学习和了解相关工具书的主要结构、作用和使用方法,其中SCI是一项十分重要的学习内容。在老师的安排和指导下,我花了很长时间,对SCI的使用方法进行了深入学习。同时认真研读了SCI创始人加菲尔德博士和其他专家在SCI上刊载的,以及在美国和国际重要学术期刊上发表的,关于SCI在文献计量学领域应用的数十篇文章,为了阅读方便和理解深刻,还特别将其中一些重要文章翻译成中文。</span></p><p class="ql-block"><span style="font-size:22px;"> SCI作为国际著名的文献检索工具和引文分析工具,收录世界各国出版的重要期刊,其中收录美国出版的期刊数量最多。那时候收录中国出版的科技期刊不到10种,很难反映出中国科技各领域发展的全貌。况且当时我们订购的印刷版SCI仅适用于进行文献检索,根本无法利用其进行文献计量学方面的深入分析和探索,更不要说利用其提供的数据,针对中国学术机构和科研人员的业绩和研究成果开展系统的分析评价了。</span></p><p class="ql-block"><span style="font-size:22px;"> 通过这样系统深入的学习,不仅熟练地掌握了SCI的使用方法,而且对其在文献计量学方面的利用价值与应用方法有了较为深刻的理解。当时学习的知识为之后在文献检索课和各类型培训班上,给研究生和科技人员介绍SCI的使用方法和应用领域提供了大量的素材。同时,也为我开展硕士学位论文研究启迪了思路,奠定了基础。</span></p><p class="ql-block"><span style="font-size:22px;"></span></p> <p class="ql-block" style="text-align:center;"><b style="font-size:22px; color:rgb(255, 138, 0);">论文选题</b></p> <p class="ql-block"><span style="font-size:22px;">  经过研究生院一年基础课的学习,从第二年起学生们都回到所里开始准备学位论文。学位论文选题的确定是每个研究生都要面临的头等大事,也是彭溎源老师和我经常讨论的主题。1980年下半年,我跟老师提出能不能尝试编制一个中国自己的科学引文索引,从国人的角度探索和应用文献计量学的分析评价方法,以文献计量学视角宏观揭示中国科学的发展概貌,以及各学科领域之间的学术关联。老师也认为此项工作非常新颖,具有重要的现实意义,但要做成此事涉及的工作量非常巨大,仅凭我个人之力很难完成,因此开始时没有同意。</span></p><p class="ql-block"><span style="font-size:22px;"> 我给老师摆了我有信心做成此事的三方面有利条件。</span></p><p class="ql-block"><span style="font-size:22px;"> 第一是资源优势,中国科学院图书馆拥有SCI这种新型的检索工具可供参考,拥有多年编制题录、文摘等检索工具的经验可供借鉴,收藏有充分的各学科领域的学术期刊可以作为建设科学引文索引的数据来源。</span></p><p class="ql-block"><span style="font-size:22px;"> 第二是技术优势,中国科学院图书馆是国内最早开展计算机应用试验的图书馆之一,近年来图书馆装修了计算机房,购置了一台IBM 1123 计算机,成立了计算机小组,这些都可以为我建立引文数据库和做相关数据分析提供技术支持。</span></p><p class="ql-block"><span style="font-size:22px;"> 第三是人力优势,我已经对引文索引的体系结构和引文分析方法的应用有了较为深刻的理解,我的两个学习计算机的同窗好友可以帮助我解决数据处理过程中遇到的计算机编程问题。</span></p><p class="ql-block"><span style="font-size:22px;"> 我还多次向老师表示,自己已经对有可能遇到的数据收集和处理方面的技术问题找到了一些解决办法,建立了坚定的克服困难,完成艰巨任务的决心和信心。经过与导师的多次沟通和反复论证,老师最终同意以“中文科学引文分析”作为我硕士学位论文的研究选题。</span></p><p class="ql-block"><span style="font-size:22px;"> 那时的计算机应用技术环境和加工引文数据的工作条件非常艰苦。开展引文分析,特别是针对中文科学文献的引文分析的前提,是要建立相应的中文科学引文数据库。在当时的技术环境背景之下,若想建立这样的数据库谈何容易,前进路上障碍重重。但是,既然选定了目标,就要一往无前地走下去,箭在弦上,岂能不发,再大的困难也要勇于面对,找到克服的办法,砥砺前行。</span></p><p class="ql-block"><span style="font-size:22px;"> 建设中文科学引文数据库(Chinese Science Citation Database,简称CSCD),首先面临的就是如何确定加工对象的问题。鉴于做学位论文的时间很短,个人力量也十分有限,经与老师商量,确定针对中国出版的最为重要的核心科技期刊进行引文分析,以这些期刊1980年全年发表的学术论文作为来源文献加工构建中文科学引文数据库。</span></p><p class="ql-block"><span style="font-size:22px;"> 在导师的指导下,依据多项评价指标,在当时1000多种重要的中文科技期刊之中,遴选了132种最为核心的期刊作为加工对象。根据科图分类法,将这些期刊划分为10个大的学科类别。最终加工标引了1980年这些期刊出版的554期上发表的7,658篇学术论文,以这些论文作为引文数据库的来源文章,构建了用以进行中文科学引文分析的基本数据集。</span></p><p class="ql-block"><span style="font-size:22px;"><span class="ql-cursor"></span></span></p> <p class="ql-block" style="text-align:center;"><b style="color:rgb(255, 138, 0); font-size:22px;">论文完成</b></p> <p class="ql-block"><span style="font-size:22px;">  来源文献确定之后,需要解决的就是怎样加工数据的问题。经过多方调研和深入分析,考虑到拟加工文献的可获取性等因素,我制定了一套详细的数据加工方案。针对当时计算机不能处理中文的问题,所采取的解决办法是,将所有需要处理的汉字都转换为汉语拼音进行标引。这样处理的一个最大问题就是,所有汉字都可以转换成汉语拼音,但是若想将它们都准确无误地“翻译”回原来相对应的汉字则基本是不可能的。针对这一问题,我采取了依据参考文献的语种和文献类型区别对待的解决办法,根据学位论文研究工作的需要,对有些内容进行深加工,有些内容进行浅加工。</span></p><p class="ql-block"><span style="font-size:22px;"> 所制定的原则是,对所有外文参考文献进行浅加工,即仅标引外文参考文献的语种类别和发表时间。中文参考文献则根据文献类型加以区分,对文献类型为科技期刊论文的中文参考文献进行深加工。对图书、手册、专著,会议文献、科技报告和内部资料及其他等类型的中文参考文献进行浅加工,即仅标引这些参考文献的文献类型、发表时间和大的学科类别。</span></p><p class="ql-block"><span style="font-size:22px;"> 由于浅加工的参考文献,在标引过程中无需将它们逐一与来源文章建立引证关联,从而极大地减轻了标引工作的难度和工作量。浅加工标引的文献仅用于进行不同时期、不同语种或不同类型文献引文在各个学科领域分布情况的统计和分析,这样的标引方式完全可以满足开展宏观统计分析工作的需要。</span></p><p class="ql-block"><span style="font-size:22px;"> 中文科技期刊发表论文的相互引证关联是我学位论文研究的重点内容,为了反映文献之间的引证关系,需要对每一条中文期刊参考文献进行详细标引,使之建立起与来源文章的引证关联。鉴于那时的计算机不能处理汉字,几乎不可能对文章的标题进行标注,我采取了以标注每一篇文章的详细出处,即文章的著者、期刊刊名,加上文章发表的年、卷、期、页来代表一篇文章的方式,解决了文章的唯一性鉴别问题。为了便于加工和整理数据,经过深思熟虑,我决定以图书馆过去使用的目录卡片作为载体进行数据标引加工。</span></p><p class="ql-block"><span style="font-size:22px;"> 以卡片而非纸张作为数据加工载体的优势是显而易见的,首先,一张卡片加工一条引文,便于我手写加工数据和计算机录入员录入数据。其次,卡片可以非常方便地进行各种排序,便于我在加工过程中做一些必要的标注和开展一些手工统计分析。第三,数据加工过程中出现的各种错误和问题,通过调换卡片可以很容易地加以修改和调整。</span></p><p class="ql-block"><span style="font-size:22px;"> 一条具体数据加工的方法是这样的,首先确定加工对象,选择来源期刊中有学术价值的论文作为拟标引的来源文章。针对来源文章所列参考文献中的中文期刊论文,即被引文章进行逐一标引。在每一张卡片上标注出被引文章的著者、刊名、年、卷、(期)、页,下面列出引用了该文章的来源文章的著者、刊名、年、卷、(期)、页,这样便可将被引文章与来源文章之间建立起引证关联。对于来源文章中引用的其他文献类型中文参考文献,仅标注文献类型、发表时间和大的学科类别。对来源文章中引用的外文参考文献仅标注语种(西、俄、日)和发表时间,这样一篇来源文章的标引工作就完成了。</span></p><p class="ql-block"><span style="font-size:22px;"> 所有个人著者姓名均采用汉语拼音全拼方式进行标引,多著者文章仅标注第一著者。团体著者仅标注“TT”,而不写出团体的具体名称。期刊刊名采用刊名的汉语拼音首字母进行标引,对于首字母重复的刊名再附加上特殊的标识予以区分。另外,用卡片建立了一套期刊名称对照索引,来解决首字母刊名反转回汉字刊名的问题。对于汉语拼音著者姓名反转回汉字著者姓名,以及汉语拼音著者姓名重复的问题,也采取了区别对待的办法。对论文分析过程中需要着重深入分析的刊名、著者或文章,在数据的后期处理时,通过核实来源期刊的方式,将他们都反转为汉字后再进行分析。</span></p><p class="ql-block"><span style="font-size:22px;"> 对于汉语拼音重名的著者,通过引入文章出处的方式来解决重要著者的唯一性鉴别问题。对于所有不拟进行深入分析的大量汉语拼音著者姓名,由于不会对一般性的引文统计分析结果的准确性产生影响,所以没有必要将它们转换回汉字著者姓名,也没有必要对多个相同的汉语拼音著者姓名是否为同一著者而加以鉴别。</span></p><p class="ql-block"><span style="font-size:22px;"> 数据标引加工是一个紧张而漫长的过程,那段时间我一直住在馆里提供的研究生宿舍,由于就住在图书馆的后院,很容易利用图书馆的文献资源。每天从图书馆借出10余册期刊,对期刊中每一篇有学术价值的文章进行标引,第二天归还,再抱回另外一摞期刊。枯燥无味的工作持续了几个月时间,夜以继日地标引数据,总计积累了近20个抽屉的数据卡片。由于采取了上述一系列有繁有简的数据处理方法,不仅解决了当时计算机不能处理汉字的问题,而且极大地减轻了文献数据标引的工作量,使得艰巨的数据标引加工工作能够仅靠一己之力在有限的时间内得以完成。</span></p><p class="ql-block"><span style="font-size:22px;"></span></p> <p class="ql-block" style="text-align:center;"><b style="color:rgb(255, 138, 0); font-size:22px;">论文内容</b></p> <p class="ql-block"><span style="font-size:22px;">  数据标引工作完成之后,利用图书馆购买不久的IBM 1123计算机进行了数据转换。先请数据录入人员使用穿孔卡片机将我写在目录卡片上的一条条内容“打印”到穿孔卡片上,再将穿孔卡片上的数据内容输入到IBM 1123计算机的内存里,形成一条一条的计算机记录。将所有记录汇聚在一起形成数据集合,再转存到大盘的计算机磁带上。之后我将数据磁带送到东单北面米市大街的北京市计算中心,请他们用WANG VS-80计算机对数据进行各项处理和分析。</span></p><p class="ql-block"><span style="font-size:22px;"> 在整个数据处理过程中,朱献有和许志强两位同学在忙于完成自己学位论文的同时,先后帮忙用COBOL语言编制了20个程序,建立了大小50多个数据文档。他们的技术支持对于引文数据库的建立起到了至关重要的作用,没有他们的无私帮助,研究工作根本无法完成,在此要向他们再次致以诚挚的感谢。</span></p><p class="ql-block"><span style="font-size:22px;"> 在各方面人员近一年时间的大力支持下,终于完成了CSCI数据库的建设工作。根据硕士论文研究工作的需要,经过北京市计算中心的计算机处理后,我拥有了三种版本形式的中文科学引文索引(CSCI),即经过对数据卡片重新排序而形成的卡片形式的CSCI,由计算机编辑并以宽行打印机打印出来的纸版CSCI,以及可供用户进行计算机引文查询的磁带版CSCD。</span></p><p class="ql-block"><span style="font-size:22px;"> 三种版本的内容完全相同,但是在数据组织结构和具体查询方法上则各具特色。此外,还建立了一个电子版的中文期刊引文报告(Chinese Journal Citation Report)文档,放在计算机磁带上,用以反映中文期刊之间的相互引证情况。</span></p><p class="ql-block"><span style="font-size:22px;"> 经统计分析,CSCD数据库中收录的来源文章和引文数据的数量,以及所揭示的文献之间引用关系的基本情况是这样的。收录来源文献的统计数据为,在标引的132种554期7,658篇来源文章中,有919篇文章未列出参考文献,另外6,739篇文章列出了各文种、各类型参考文献58,846条,平均每篇中文期刊论文列出8.73条参考文献。收录被引文献的统计数据为,所标引的10,405条中文科学期刊引文,来自于755种被引期刊上发表的8,276篇被引文章。每种期刊平均被引13.8次,每篇期刊论文平均被引用1.26次。CSCD数据库中总共标引了4,098个个人被引文章著者(多著者文章只统计了第一著者,汉语拼音姓名重复的个人著者未做鉴别处理),以及200余个团体被引著者(并未标出团体著者的具体名称),平均每个著者有1.9篇文章被引用,每个著者平均被引用2.4次。</span></p><p class="ql-block"><span style="font-size:22px;"> CSCD数据库的建成,为学位论文所要进行的针对中文科技论文引文结构和引文关系的探索与分析,提供了有效的技术手段,奠定了坚实的数据基础。</span></p><p class="ql-block"><span style="font-size:22px;"> 依靠CSCD数据,针对中文重要科技期刊论文的引文分析是学位论文研究的核心内容。论文主要进行了如下几方面探索。</span></p><p class="ql-block"><span style="font-size:22px;"> 第一,从学科的角度统计分析了我国科学家们在选择参考文献时,对各文种、各类型文献的利用情况。</span></p><p class="ql-block"><span style="font-size:22px;"> 第二,从时间的角度统计分析了中、外文文献在利用时间上的差异,以及各学科学术期刊的半衰期问题。</span></p><p class="ql-block"><span style="font-size:22px;"> 第三,从期刊的角度统计分析了引文的离散现象与集中现象。</span></p><p class="ql-block"><span style="font-size:22px;"> 第四,运用共引文分析方法,从文章的角度统计分析了中国地学论文的引文结构。</span></p> <p class="ql-block">当时学位论文的简易装订</p> <p class="ql-block">汉字打字机打印出来的图表效果</p> <p class="ql-block"><span style="font-size:22px;">  学位论文的具体研究内容主要包括,中文科技论文参考文献的文种结构与文献类型结构分析,中文科技论文引文时间分布曲线与中文科技期刊的半衰期研究,中文科技论文引文的离散性与集中性特征,试用引文的集中性特征确定了中文科技核心期刊,以地学核心论文引文分析为例探索了共引文分析方法的应用效果。通过对引文数据库多角度的统计分析,多方面地尝试了文献计量学的应用方法,初步揭示了我国在改革开放初期核心科技期刊发表论文的引证规律与特征。</span></p><p class="ql-block"><span style="font-size:22px;"><span class="ql-cursor"></span></span></p> <p class="ql-block" style="text-align:center;"><b style="font-size:22px; color:rgb(255, 138, 0);">论文影响</b></p> <p class="ql-block"><span style="font-size:22px;">  学位论文完成后在学术界产生了比较大的影响,在一定程度上促进了中国各领域引文数据库建设和文献计量学研究与应用工作的发展,其研究意义与后续影响主要体现在以下几个方面。</span></p><p class="ql-block"><span style="font-size:22px;"> 首先,在各方面技术条件都十分困难的情况下,首次进行了中文科学引文数据库建设尝试,探索了引文数据库建设的基本方法与流程。以该研究成果为契机,中国科学院图书馆经过多年的申请,于1989年获得国家自然科学基金支持,创立了中国科学引文数据库。作为中国最为重要的科学文献数据库之一,在为广大科技界用户提供文献信息服务和开展引文分析评价工作中发挥了重要作用,受到各界用户的肯定和学术界的好评。</span></p><p class="ql-block"><span style="font-size:22px;"> 其次,CSCD的建立以及基于CSCD所做的引文分析,可以说是我国图书情报界在当时的历史条件下,在文献计量学领域所进行的一次具有创新意义的探索。不仅在国内广泛传播了引文索引及其应用方面的知识,而且在很大程度上促进了文献计量学研究与应用在中国的发展。此后国内许多单位或个人在进行文献计量学研究或引文数据库建设的过程中,都参考或借鉴了该研究的成果。基于学位论文的一部分内容在《情报科学》期刊1983年第1期上发表的“中文科学引文分析”一文,在学术界引起了很大反响。陆续有学者在多种学术期刊上撰文,对该文进行评价。例如:</span></p><p class="ql-block"><span style="font-size:22px;"> 陈子玲发表了“对‘中文科学引文分析’一文中数据的勘误”,张军亮 、宋桂英发表了“‘中文科学引文分析’再探”,鲍国海发表了“也谈‘中文科学引文分析’——兼与张军亮 、宋桂英同志商椎”等文章。陈子玲称该文“在国内图书馆界对中文科学期刊的引文分析起到了开创性作用”。安伟峰称该研究“工作量之大,研究之细微,前人莫属”,“无疑是中文引文分析研究中的一篇力作”。张军亮称该文“被认为是这一领域研究的开创性工作之一,它对于以后许多学科的引文分析研究都是一个重要的参照依据”。谷跃麟通过大量数据分析,评选出中国图书情报界80年代所产生的76篇经典文献,该文在其中名列第六,他称该文“在情报界享有很高的声誉”。</span></p><p class="ql-block"><span style="font-size:22px;"> 1980年代末该文获得了由中国图书馆学会颁发的“中华人民共和国成立40周年中国图书馆学会成立10周年优秀论文奖”。CNKI数据库的统计数字表明,截止到2021年6月该文被引用过272次,被下载过594次。</span></p><p class="ql-block"><span style="font-size:22px;"> 第三,学位论文通过对CSCI多方面的文献计量学分析,以多种数据图表揭示出当时中国科技期刊和科研人员的文献引证和被引证情况,勾画出1980年我国科技期刊论文的引文结构图。进行了包括中国科技核心期刊的确定,中文科技期刊半衰期的探索,各科学领域文献之间引证关系的分析,中国学者引证国外各语种文献的比例,以及地学领域的核心著者与核心论文等方面的分析与研究。这些量化的文献计量指标,可作为以后其他进行同类研究的基本对照数据。通过对比分析,可以反映出我国科技发展对不同类型、不同语种文献利用的变化情况,各学科之间文献之间引证关系的演化情况,以及各领域科技期刊出版利用的发展情况。</span></p><p class="ql-block"><span style="font-size:22px;"> 第四,以实证分析的方式对文献计量学研究方法所进行的综合性探索,深化了我国在文献计量学领域的研究工作,扩大了中国该领域研究在国际上的影响。中国科学院将该项研究所取得的成果列入国际学术合作交流的一项内容,先后于1985年和1993年两次派我到匈牙利科学院图书馆进行学术交流。在交流过程中不仅介绍了我个人所做的一些探索工作,而且较为深入地介绍了国内同仁在引文分析和文献计量学领域开展的一些研究工作,之后匈方专家多次应邀来中国访问,与中国同仁开展了广泛深入的学术交流活动,增进了两国同行的相互了解与友谊,在很大程度上推进了中国在该领域的学术发展。</span></p> <p class="ql-block">1990年代初匈牙利专家来访,在科学会堂举办的国际文献计量学研讨会</p><p class="ql-block"><br></p> <p class="ql-block" style="text-align:center;"><b style="font-size:22px; color:rgb(255, 138, 0);">八零年代</b></p> <p class="ql-block"><span style="font-size:22px;">  我国图书情报事业的发展与两方面因素密切相关。</span></p><p class="ql-block"><span style="font-size:22px;"> 一是与我国的改革开放,经济高速发展密切相关,改革开放促进了管理体制和管理机制的变革,促进了企业型信息机构的建立和发展,促进了公益性文献信息机构的资源共享和合作共荣。国民经济的高速发展为图书情报事业的发展提供了强有力的经费支撑。</span></p><p class="ql-block"><span style="font-size:22px;"> 二是与计算机、互联网和现代信息技术的发展密切相关,计算机和互联网的飞速发展,从图书馆的服务环境、服务设施和信息传播方式等方面提供了基本手段和基础支撑,而现代图书情报技术的发展则使图书馆的藏书建设、数据加工、服务手段和服务模式等发生了翻天覆地的变革。现代信息技术的应用,促进了信息存贮方式、传播途径和服务模式的变革,成为贯穿于40余年来我国图情事业发展变革的一条主线。</span></p> <p class="ql-block"><span style="font-size:22px;">  1978年之后国内几个最主要的图书馆和情报所先后成立计算机小组,引进小型机开始探索计算机在图书情报工作中的应用。可以说1980年代是国内各主要图书馆、情报所全面探索和试验计算机应用的年代。当时使用的计算机都是放在计算机房中的大、中型主机,微机尚未出现,数据存储介质是大盘的磁带。开始时没有显示器,需要利用输入、输出设备进行计算机操作,将操作指令和需要处理的数据“打印”到穿孔卡片或穿孔纸带上,与计算机进行数据交换,操控计算机完成各项数据处理工作。后来有了显示器,是单色的,但是没有鼠标。</span></p> <p class="ql-block">标注数据的卡片</p> <p class="ql-block">穿孔卡片</p> <p class="ql-block">许多穿孔卡片才能表达出一条数据或一项指令的内容</p> <p class="ql-block">穿孔纸带是记录和传输数据的另一种载体</p> <p class="ql-block"><span style="font-size:22px;">  那时候还没有解决计算机系统的汉字编码问题,计算机只“认识”拉丁字母,不能识别汉字。于是国内理论界出现了第一次学术观点的论争,即汉字这种方块字的形式是否科学,是否合理的大讨论。一些学者认为要想在中国应用计算机这种先进的技术手段,就要对汉字进行彻底的改革。有人提出要将汉字拼音化,完全改为用字母的形式来记述。也有人提出完全放弃汉语,全民学习世界语或英语,以适应计算机等先进技术应用的需要。这样的争论在学术界持续了好几年时间,直至后来出现了王码等汉字编码体系和华光汉字照排系统等,计算机处理汉字已经不再成为问题之后,这段学术争论才逐渐平息下来。</span></p> <p class="ql-block">光盘出现之前计算机数据大多存储在这样的大盘磁带上</p> <p class="ql-block">磁带存储的最大问题是不方便查找其中的内容</p> <p class="ql-block">许多台磁带机共同工作,以提高数据处理的效率</p> <p class="ql-block"><span style="font-size:22px;">  1985年之后,国际联机检索系统开始在国内提供服务。在中国科技信息研究所修建现在的馆舍期间,他们工地东面临时搭建的一个木板房中开通了国内第一家国际联机检索系统,提供DIALOG系统的国际联机检索服务,大约一年之后中国科学院文献情报中心开通了STN系统的国际联机检索服务,为中国科技人员提供了通过数据库查询国际最新科技信息的渠道,以后又有一些主要信息机构在国内相继开通了国际联机检索服务,像ORBIT和MEDLINE系统等。</span></p><p class="ql-block"><span style="font-size:22px;"> 不过,由于国际数据通讯方式为海底电缆和卫星通讯,传输速度不快,容量十分有限,价格非常昂贵,并非一般中小型项目或普通研究课题所能消费的起的,更不要说科研人员个人了。通常用户查询一次文献需要花数百元检索费,得到的也只是一些跟查询主题相关的题录或文摘信息,如果想要阅读原文还需要自己到各大图书馆去查找借阅,或者在国内根本就找不到原文。</span></p><p class="ql-block"><span style="font-size:22px;"> 1985年世界上第一张商品化的光盘数据库-Bibliofile在美国国会图书馆问世,随即出版了大量的以光盘为载体的电子出版物和文摘数据库。80年代末,光盘版数据库产品开始逐步被引入中国,不过开始时引进的品种很少,提供光盘数据库检索服务的图书馆数量也十分有限,科研人员利用光盘数据库查询文献简直是一种 “奢侈的享受”。</span></p><p class="ql-block"><span style="font-size:22px;"> 概括而言,80年代后期虽然一些信息机构提供了国际联机检索服务,我国也逐步采购了一些光盘版文献数据库产品,但是国内广大科研人员检索和利用文献信息资源困难的局面并没有得到有效的缓解,只是相对于70年代来说有所改善而已。</span></p> <p class="ql-block">1987年的西长安街,最高的建筑就是电报大楼了</p> <p class="ql-block">1988年的东单北大街,中间电线杆子后面就是现在医科院图书馆的位置</p> <p class="ql-block">1988年西单北大街,22路公共汽车换了新车型,109路无轨电车还没有换。</p> <p class="ql-block"><span style="font-size:22px;">  1980年代,是一个烟火灿烂与诗情迸发的时代,是一个思想开放包容,充满人文情怀的时代,是一个文化自由奔放,学术百花争艳的时代。图书情报学术界也是如此,各种思想讨论非常活跃,许多学者不断努力,探索前行。在科学学、科学交流和科学评价等学术研究领域之中,活跃着两位杰出的代表,他们就是赵红洲和蒋国华两位老师。他们合作发表了一系列文章,积极倡导开展文献计量研究,推动建立科学学。每年夏天他们都召集学术研讨会,邀请一些学者聚在一起,无拘无束,畅所欲言,展望学科的发展动向,探讨研究的重点领域。会上没有什么招待大家的,正好是西瓜上市的季节,每年的会议上都给代表提供应季的西瓜吃,所以后来大伙儿就将该系列会议称之为“西瓜学会”。</span></p><p class="ql-block"><span style="font-size:22px;"> 西瓜学会活动持续了多年时间,从每年的活动中我都可以了解到不少新鲜的学科进展资讯,也会在会议上分享一些自己的学习心得与工作体会。在那个百家争鸣,百花盛开的年代,有那样一批学者,几乎是自发性质的,为中国图情领域学术发展而努力,而奉献,而探索。他们多年的交流与研究成果,对于促进科学学和文献计量学等学科在中国的传播与发展起到了很大的推动作用。</span></p> <p class="ql-block">1980年代北京的一条胡同</p><p class="ql-block"><br></p> <p class="ql-block" style="text-align:center;"><b style="font-size:22px; color:rgb(255, 138, 0);">毕业工作</b></p> <p class="ql-block"><span style="font-size:22px;">  1982年研究生毕业后,我留在中国科学院图书馆检索室工作,不久后担任参考部秘书,兼任文献检索组组长。在没有网络,也没有计算机的时代,查找印刷版的检索工具可以说是科研人员获取文献线索的最主要途径。中国科学院图书馆是全国收藏科技文献检索工具最多的科技图书馆,不仅面向全院科研人员服务,也兼顾为全国的科技工作者服务。院内读者来查阅文献需要提供借书证或工作证,院外读者则需要凭借所在单位开具的介绍信才能进馆查找或借阅文献。</span></p><p class="ql-block"><span style="font-size:22px;"> 每天来检索室查阅文献的读者非常多,甚至将座位都坐满了,工作人员非常忙碌,有时中午都没有时间吃饭。在众多的读者当中,有一个中等身材,体型偏瘦,穿着朴素,戴着眼镜的中年人,经常来检索室查阅文献,往往一待就是一天,下班也不舍离去。检索室的人对他非常熟悉,也非常尊重,下班时他不走也不催他,等他自己意识到检索室读者都已走光了的时候,他会向工作人员致以歉意,才姗姗离开。他就是中国科学院院士,著名数学家陈景润先生。</span></p><p class="ql-block"><span style="font-size:22px;"> 这期间不仅能经常见到国内著名的科学家,而且还与国际著名的文献计量学家尤金·加菲尔德博士打过交道。加菲尔德是美国《科学引文索引》(简称SCI)的创始人,是位于美国费城的科学情报所(简称ISI)的所长,是引文分析和文献计量学的主要推动者之一。</span></p><p class="ql-block"><span style="font-size:22px;"> 为了扩大其产品在中国的影响力和营销份额,经住在新加坡的ISI公司亚太地区总代理陈华江先生的联系,中国图书进出口总公司邀请加菲尔德于1982年访问了中国。他先后访问了国家图书馆和中国科学院图书馆,目的在于宣传产品,拜访客户。在访问中国科学院图书馆时,当时的佟曾功馆长接待了客人,我作为主人一方的翻译参加了接待工作,客人不仅介绍了SCI在不同领域的特殊应用,而且特别介绍了他们出版的SCI磁带版产品的情况。</span></p> <p class="ql-block">陪同陈华江先生访问清华大学(1985年前后)</p> <p class="ql-block"><span style="font-size:22px;">  加菲尔德博士的第一次中国之行不仅促进了SCI印刷版的推广与应用,而且实现了其电子版在中国的发行,大概从1984年起,中国科学院图书馆开始订购SCI的磁带版。由于引文索引具有较为复杂的数据结构,磁带版产品收到以后很长时间,计算机室却无法将磁带上的数据解析出来,大堆的SCI磁带产品放在那里无法得到利用,很令人着急。</span></p><p class="ql-block"><span style="font-size:22px;"> 我的研究生同窗好友,毕业后留在馆里计算机室工作的朱献有老师具有处理此事的能力,但是他那时被院里派去山东枣庄矿务局,帮助那里建立计算机系统。为了解决这个问题,馆领导派我带着相关资料去枣庄找朱献有,一同研究磁带数据格式的解析问题。经过一个多礼拜的深入分析,我们终于搞清楚了SCI磁带版的数据结构,解决了磁带版引文数据无法读取的问题。在枣庄我第一次下到了地下数百米深的矿井之中,看到了煤矿工人采煤的场景,那时基本还是简单的机械采煤方式,工人们的生产方式还比较传统。</span></p><p class="ql-block"><span style="font-size:22px;"> 文革之后百废待兴,科技领域蓬勃发展,每年科学院的各个学科领域都要举办各种各样的学术会议,参考部的一项重要任务是为这些会议提供文献资料服务。通常是针对会议学科领域,事先收集大量与会议主题相关的题录或文摘,编制成专题目录小册子带到会议上,分发给所有与会代表。有时也会应邀在会议上作大会发言,介绍该领域的文献资源查询方法及获取途径等。</span></p><p class="ql-block"><span style="font-size:22px;"> 检索组的人员配合会议文献信息服务做了许多工作,记得有一次我和于继铮老师去桂林参加一个光学方面的学术会议,于老师晚上带我到桂林大街上路边的小吃摊,坐在马扎上吃了一次麻辣烫,蔬菜5分一串,肉类1毛一串,俩人就着啤酒吃了40多串,别提多巴适了。那是我是第一次品尝麻辣烫这种食品,感觉十分新鲜,也十分刺激,至今还能回味出当时那种麻辣鲜香的滋味。</span></p><p class="ql-block"><b style="color:rgb(237, 35, 8); font-size:22px;"> </b></p><p class="ql-block"><b style="color:rgb(237, 35, 8); font-size:22px;"> 未完待续</b></p>