| 一、系统介绍
在图书的流通发行中,由于图书的品种比较多,图书买卖双方(例如,图书馆和图书批发商)经常会遇到这样的问题:如何方便快速地得到“你有我没有,我有你没有,或我们都有”的图书数据,并对这些数据进行科学有效地利用?双方业务人员往往一般是利用EXCEL等办公软件对双方数据进行排序后手工地进行比较,费时费力,而且还
容易出现错误!更要命的是,双方的数据格式有时还并不一样
。比如我方ISBN是10位数字的,对方切是13位带杆杆的,再比如我方的库存数据是EXCEL格式的,对方切是MARC格式的,等等。它们之间不能直接对比。
《华弘俊图书查重工具软件》正是针对上述问题而开发的,优秀工具软件。本软件不仅仅对图书查重问题提供了多种实用功能,还提供了各种数据的互转功能、数据的批量修改功能和数据的去重
、查看、分割、合并等功能。
本软件是绿色软件,无需安装,直接运行。分三大模块:现场采购模块、双方数据自动查重(批查重)模块、数据处理工具模块。具体实现了ISBN现场采购查册次,根据原有复本自动设置追加购买复本数;实现了MARC与EXEC文件之间的相互转换;实现了对MARC文件、EXCEL表格批查重;MARC批量修改;MARC数据去重……等等功能。
欢迎用户朋友提出宝贵意见和批评指正。
二、现场采购查重重
“现场采购”最经典的应用是:图书馆采购人员到图书批发商的卖场进行现场采购。本模块的使用流程是,首先将采购方(图书馆)的数据导入本系统数据库,采购人员带条码阅读器+笔记本即可利用该模块的“现场采购”进行采购工作,对现场图书进行扫描识别,以确保要采购的图书不与已有的图书重复。采购结束后,将现采结果导出就可以得到一个此次采购的书的ISBN和册次的文本文档。然后交给供应方(图书批发商)。
2.1 导入采购方MARC数据
a.
通过“浏览”选取所要导入的采购方marc数据文件,设置复本选项,执行“导入”,即可将采购方书目库的marc数据导入到本软件默认的数据库中。
复本选项:
如果指定初始复本数,则导入数据库中的图书复本数统一为指定的初始复本数;
如果指定复本字段,则导入数据库中的图书复本数为指定字段的值。例如905f字段就代表图书的复本数。为处理特殊自定义字段的情况,指定复本字段可以修改为其它字段。
如果都不指定,则默认为1。
b.输出ISBN:指输出采购方已导入数据库中的ISBN。
如果数据库为空,并且已指定了“采购方MARC”文件,则导出该MARC文件中的ISBN。
常见用于,将其导入数据采集器进行轻巧的现场采购。
2.2 现场采购
首先在“已有数+采购=”处,设置好需要采购的图书的复本数,在“采购ISBN”处对现场图书进行扫描识别,系统能根据参数设置追加采购数或提示该书是否已有。所采购的书的ISBN+册次会自动追加并即时保存在系统的数据库中。不必担心断电或者误操作而前功尽弃。当误操作采购了某书时,在“剔除ISBN”处进行扫描识别,将删除该书的采购数据。现场采购结束后,可以“将现采结果输出”,指定“存为”文件,然后“导出”。如果选中“带复本输出”,结果将是以“ISBN+复本数”的形式输出,否则只输出ISBN文件。
“已有数+采购=”:已有数是指已导入到本系统数据库中的复本数,采购是指将要采购的数量。这里做成“已有复本 +
将要采购的复本 =
多少”的形式,是因为大多数的采购方的每一个现有品种的复本是有多有少的,做这样子,可以方便地求得需要采购的数量。
“现场采购”一边扫ISBN,一边确认是否采购,具有以下三种模式:
逐条确认模式:根据“已有数+采购=”设置,扫ISBN时返回“已有[几]本,已采购[几]本,现采购:[几]本。”。同时,按提醒模式提醒。光标停留在“现采购几本”上,等待输入(或直接确认)采购数量,方进入接受下一条扫描。
连续扫描模式:根据“已有数+采购=”的设置,自动确认是否采购,采购数量,直接进入接受下一条扫描。需要采购时,按提醒模式提醒。
简单提醒模式:不理会“已有数+采购=”的设置,扫描后如果在比对文件中没有找到则按提醒模式提醒。接受下一条扫描。
2.3 利用ISBN输出供应商MARC数据

一般的书商都有书的marc记录,利用此模块就可以带回采购到的书目marc数据。使用该模块先“浏览”指定供应商的marc文件路径,然后“浏览”选中你此次购买的书ISBN文本,将要输出的marc记录“存为”文件,点击“开始”即可以根据ISBN文件套取到供应商的相关的完整的marc记录,回去加以利用。
2.4 现场采购数据维护

本功能主要用于对由导入的采购方数据及现采数据进行维护。可以进行“清空”、“浏览”、“成批修改”等操作。
三、双方数据自动查重
本功能模块着重利用双方的数据来自动地找出下图所示的各个部分。

如果双方的数据格式不一样,可以使用本软件提供的数据处理工具进行转换。
3.1 利用双方MARC数据自动匹配查重
首先指定采购方的数据源,可以使用“现场采购”模块导入的采购方MARC数据作为数据源,也可以使用指定的MARC文件作为数据源。然后“浏览”批定供应商的数据源,设置说明双方数据是重复的字段(例如,只要书名、ISBN、定价一样,则认为它们是相同的,在“查重字段”中这样填写:200a,010a,010d。同时调整为“只要3个字段匹配”)。最后,指定要系统输出的那个部分的数据到文件,“开始”即可。
技巧:如果需要输出“采购方有,供应方没有”的图书部份,其实只要互换一下身份即可。即指定采购方数据源的时候,指定是供应方的数据;而指定供应方数据源的时候,指定的是采购方的数据。
建议:如果双方的数据中含有重复的记录,应先采用本软件提供的“数据去重”功能,把重复多余的数据记录去掉,以确保数据文件中所有记录都是不重复的。
3.2 利用双方ISBN文件自动匹配查重

“浏览”指定采购方的ISBN文件,“浏览”指定供应方的ISBN文件,指定需要输出的文件“存为”,并“开始”即可。
技巧:如果需要输出“采购方有,供应方没有”的部份,其实只要互换一下身份即可。即指定采购方ISBN文件的时候,指定是供应方的ISBN文件;而指定供应方的ISBN文件的时候,指定的是采购方的ISBN文件。
建议:如果双方的数据中含有重复的记录,应先采用本软件提供的“数据去重”功能,把重复多余的数据记录去掉,以确保数据文件中所有记录都是不重复的。
3.3 利用双方EXCEL文件自动匹配查重

首先“打开”打定采购方EXCEL文件,采购方EXCEL文件的数据表内容将出现下面的表格中,如果“第一行包含字段名称”请打上勾,否请将勾勾掉;接着“打开”指定供应方EXCEL文件,供应方EXCEL文件的数据表内容也将出现在下面的表格中,如果“第一行包含字段名称”请打上勾,否请将勾勾掉。
查重后的结果,可以“存为”文件,也可以在双方原文件上增加字段标记并保存到原文件。如果“存为”文件,在目标文件中将会包含四张数据表,它们分别是:“采购方有供应方没有”、“
双方都有(采购方)”、“双方都有(供应方)”、“采购方没有供应方有”。
四、数据处理工具
4.1 从MARC数据中输出ISBN
“浏览”指定“MARC文件”,指定“另存”输出的“ISBN文件”,选择输出选项,然后“开始”。即可从MARC数据中输出ISBN。
4.2 MARC转EXCEL
首先“浏览”指定将要转换的MARC文件,“另存”指定将要输出的EXCEL文件名和路径。
然后在设置需要输出的MARC字段和对应EXCEL列名。列如经常需要输出的字段:010a、200a、200f、010d,对应的列名是:ISBN、书名、作者、单价。
单击“开始”,即开始输出。
对于设置表格的内容,可以“保存表格到文件”进行存放,在需要的时候可以“从文件载入到表格”。以减少重复录入工作。
“增加一行”:即增加一行空白的设置内容;
“删除本行”:即将当前设置内容行删除。
4.3 EXCEL转MARC

首先“打开”要转换的EXCEL文件,这时,在“设置EXCEL表格的列与MARC的对应关系”表格中列出了该EXCEL文件的列信息,在“对应MARC字段”栏中,根据列名或第一行内容判断填写MARC对应的字段号和子字段号(例如:书名对应的MARC字段为:200a;ISBN对应的MARC字段为:010a),指定“存为”输出的“MARC文件”,最后点击“开始”即可。
注意:如果打开的EXCEL文件没有列名出现在表格中,或列名中出现很多空行,请编辑EXCEL文件,请确认要转为MARC的数据表是否为当前的数据表,同时请将数据表中多余的列删除。
由于MARC记录必须具有“001”、“100”、“101”、“200”、“801”字段,如果设置“对应MARC字段”时缺少上述字段,除了必需指定书名字段200a外,系统将自动产生默认内容。其中,“001”字段将按处理的顺序号产生;“100”字段根据数据内容自动产生;“101”字段默认为中文chi;“801”字段将根据本软件“注册信息”中的“用户名称”来产生。
4.4 对MARC文件批量修改

“浏览”指定“原始MARC文件”,“另存”指定批量“修改后的文件”名称和路径。在修改内容表格中设置要进行的批量修改操作。
举例:
1、对原始MARC批量增加一个801主字段(记录来源),内容为:“
0■aCN■b广东天林华翰图书音像发行有限公司■c20050601”。
操作:在表格一行的“字段”栏中输入“801”,在“操作”栏中选择“增加”,在“指示符”栏中输入“0”,在“内容”栏中输入“■aCN■b广东天林华翰图书音像发行有限公司■c20050601”。(按键盘的“\”号输入“■”,这与目前流行的MARC编辑器的操作一致。)
2、对原始MARC批量增加210c子字段(出版发行者名称),内容为:“科学出版社”。
操作:在表格一行的“字段”栏中输入“210c”,在“操作”栏中选择“增加”,在“内容”栏中输入“科学出版社”。
3、对原始MARC批量修改101a子字段(正文语种),内容为:“chi”,同时装该字段的指示符修改为“0”(原著)。
操作:在表格一行的“字段”栏中输入“101a”,在“操作”栏中选择“修改”,在“指示符”栏中输入“0”,在“内容”栏中输入“chi”。
4、对原始MARC批量删除905a子字段(藏书单位代码)。
操作:在表格一行的“字段”栏中输入“905a”,在“操作”栏中选择“删除”。注意,这时“指示符”、“内容”栏将不起作用。
5、对原始MARC批量删除“-01”字段(某图书馆管理系统生成的保留自定义字段)
操作:在表格一行的“字段”栏中输入“-01”,在“操作”栏中选择“删除”。注意,这时“指示符”、“内容”栏将不起作用。
修改内容表格中设置的要进行的操作,具有按顺序执行的特性,如果表格中有两行对同一字段进行不同的操作,结果将会以最后一次的操作为结果。
对于设置表格的内容,可以“保存表格到文件”进行存放,在需要的时候可以“从文件载入到表格”。以减少重复录入工作。
“增加一行”:即增加一行空白的设置内容;
“删除本行”:即将当前设置内容行删除。
设置完成后,“开始”即对原始MARC文件按表格中的操作设置,开始批量修改输出。
4.5 数据去重
数据去重,即把重复多余的数据记录去掉,以确保数据文件中所有记录都是不重复的。
本软件提供对ISBN文件的去重和对MARC文件的去重。
五、系统
5.1 首页
即本软件欢迎使用页。
5.2 注册信息
未注册版本在使用时间、次数或数据处理能力上有限制。
如需注册购买本软件,请直接和我们联系,把“用户名称”和“机器序列”号告诉我们,我们确认收到软件款后,我们将告诉你“注册码”。
注意:这里的“用户名称”会被本系统产生的MARC数据中的801字段引用。
5.3 退出系统
即退出系统运行。
|