企业管理软件应用最广泛的就是数据库应用,数据库简单地说,就是数据存放的地方。数据信息管理就是通过数据库管理数据,实现其基本功能。下面是小编帮大伙儿整编的7篇数据库技术论文,欢迎参考,希望对大家有所帮助。
摘 要:云南少数民族文字文献数据库的构建,是随着计算机、通讯、多媒体、高密度存储等信息技术的发展和应用,尤其是网络技术的迅速普及,文献资源的数字化水平成为各国、各地区信息水平的标志为发展机遇的。云南少数民族文字文献是云南各少数民族智慧的结晶,是中华民族文化宝库中的一块瑰宝。因此,将其数字化必将促进云南地方民族文化大省建设的步伐,在促进民族地区的经济、文件建设与发展中起到不可低估的作用。
关键词:云南;少数民族;文字文献;数据库;建设
中图分类号 G250 74
文献标识码 A
文章编号 1672-867X(2005)01-0148-04
一、引 言
云南是我国少数民族种类最多的省份,人口超过5000人的民族有26个,其中15个是云南独有的民族。除回族、水族、满族3个民族通用汉语外,其余的民族都有自己古老的文字或语言:23个民族使用着27种语言;15个民族使用着24种文字(或拼音方案)。
本文旨在通过论述云南地方少数民族文字文献的宏富,全面探讨云南少数民族文字文献的构成、价值以及对其开发利用的重要性,寻求采用先进科技手段将其数字化的方法,以便更好地传承这一颇具特色的文化奇葩,以造福于子孙后代。
二、丰富的地方民族文字文献是数据库的资源保障
云南地方少数民族文字文献以彝文、东巴象形文、傣文和藏文的文献最为丰富,也是少数民族文字文献中最为悠久、珍贵的文献。
(一)彝文文献。彝族在历史上产生了本民族古文字,明清文献将其称作“爨文”、“韪书”,近人称它为“倮文”、“毕摩文”、“贝玛文”或“罗罗文”等。自彝文产生的时候起,便有了彝文古籍。彝文古籍种类繁多,从学科和内容上分为宗教类、历史类、训劝类、政治军事类、科学技术类、天文地理类、彝文字词典类等。彝文古籍博大精深,任何一部都有丰富的内涵,都有不可替代的作用和地位,它数量庞大,计有数万册、数千种。其中影响较大、被翻译介绍得颇有特色、具有代表性的重要典籍有:《查姆》、《梅葛》、《玄理大书》、《指路经》、《尼租谱系》、《礼法经》、《十月兽历》等。《昆明西乡彝文单字注释》是迄今为止收集到的年代最久远的一部字书,书中收录了206部彝文古籍近7000个彝文字,是研究彝文难得的资料,对编写彝文古籍词典,对彝汉双语教育历史的研究,都有着极高的借鉴和参考价值;彝文医书《彝族医药志》记述了彝医的起源、彝族先民的针灸疗法、常见病防治法,被医药界誉为“哀牢明珠”,据说还早于《本草纲目》12年。国外对彝文的研究始于1852年:法国人把《宇宙源流》译成法文,并在1898年用法文、彝文对照出版;1905年出版了法文与彝文对照的《法罗字典》;英国鲁豪尔的《坚固的堡垒》(1947年)、美国弗兰克的《华南漫游记》(1964年)、法国享利·科尔迪埃的《罗罗的现实形态问题》(1907年)、日本西田龙雄的《中国西南部的罗罗文字》(1980年)等论著也在20世纪上半叶相继出版。
(二)纳西族东巴象形文。纳西族古老的原始象形文计有1400余字。纳西族信奉的东巴教是一种原始的多神教,东巴教的经师称为“东巴”,他们掌握象形文,在进行祭祀、除病禳灭等法事活动中形成了众多的东巴经,用于记载古代纳西社会的历史、宗教、文学、艺术、地理、医学等方方面面。流传至今的东巴文古籍约有2 3万册,不同内容的约有1500册(种),分为祭天仪式经书、占卜经书、舞谱及杂类书等共28类,是研究纳西社会的百科全书。东巴文经典《创世纪》是纳西创世史诗,它所反映的社会内容是十分丰富的,如抹去神话色彩,完全可以看作是纳西族先民从群婚向一夫一妻制婚姻形式过渡的真实写照;《哥巴文字典》是用东巴象形文字为哥巴文注音的字典,从纳西象形文到哥巴文的发展,体现了文字进化的过程,对文字学的研究有着重要的价值;《崇仁潘迪找药》是研究纳西族医药学的珍贵材料;东巴舞谱是迄今世界上唯一的最古老的象形文字舞谱;东巴文是研究人类文字起源的第一手活资料。国外研究纳西文文献的有:法国巴克(J.Bocot)的《么些研究》(1913年);美国洛克(J.E.Rock)的《纳西百科辞典》两卷(1962年);西德雅纳特(Janert)教授来我国研究纳西族语言文字,已出版东巴经目录5册,东巴经“祭风经”5卷;日本白鸟芳郎教授主持的“中国大陆古文化研究会”于1978年出版纳西族的特集(共8集)。
(三)傣文文献。张公瑾先生在其著作《民族古文献概览》中说“文字跟着宗教走”。傣文文献的产生发展情况同这一说法很相符。傣文产生的年代在13世纪左右,傣文的文献古籍也在同期产生。从那时起,就有数量众多的佛经和各种典籍源源不断地被记录下来。其中佛经号称“别闷西版康”(八万四千部),叙事长诗有550部,另外还有各种各样的民间传说、故事,由此构成了内容博大精深、时间跨度数百年的傣族文字古籍文献宝库。傣文古籍内容涉及历史、宗教、经济、语言、文化、民俗、医学、天文历法等,因主要载体是贝叶,故又称之为“贝叶经”,其中佼佼者有:《银云瑞雾的勐果占壁简史》;为历史研究提供了重要的年代依据的《囊丝车勐》(《车里宣尉世系简史》)是一部统治阶级的兴衰史,是不可多得的史料;《苏定》是一部有关傣族天文历法的重要文献;《档哈雅》是西双版纳的傣族药书,是傣族医药宝库中的瑰宝,有些内容已被记入《中国药典》和《云南省药品标准》等医药书内。
(四)藏文文献。藏文古籍内容广泛、卷帙浩繁,其数量仅次于汉文古籍。藏文古籍以《大藏经》分法为准,分为《甘珠尔》(佛说部1108种)和《丹珠尔》(论疏部3461种)。藏文古籍的载体历经了羊皮———木简———白桦树皮———纸几个阶段。重要的藏文典籍有:《历代噶玛举黑帽系活佛教·如意藤》是研究云南藏传佛教和民族关系不可缺少的重要资料;《加岭传奇》是一部研究云南藏族历史、民俗等方面的要籍,也是一部优美的文学作品;《四部医典》则为一部藏医临床百科全书;《恰最松饶历史》是西藏各大寺院、历算机构和个人编制日历的主要工具书之一。
其他少数民族的文字文献,如回族的《赛典赤家谱》等,壮族的《摩则社》等,瑶族的《盘王券牒》等,白族的《古通》、《山花碑》等,都是这些民族灿烂的文化瑰宝,是研究这些民族历史弥足珍贵的第一手资料。
三、信息处理技术日臻成熟为数据库构建提供了技术支持
我国民族文字信息处理的研究始于20世纪70年代后期,到90年代初,已同步实现了汉字的电脑化处理。1991年,由中央民族大学语言研究和计算机系联合研究编著的《中国各民族文字与电脑信息处理》一书,从理论上对我国少数民族文字微机处理的种种问题作了研究,并将所取得的成果作了详尽介绍。在国家的扶持下,许多科研机构开发了多种民族文字的字处理技术及应用系统,完成了包括蒙古文、维吾尔文、哈萨克文、柯尔克孜文、彝文、藏文等在内的编码字符集标准、键盘标准、字模标准,标志着少数民族编码字符向国际标准化的迈进。[5]现已开发的少数民族文字操作系统和出版系统有:蒙文《蒙古文、汉文、西文操作系统》、《华光V型蒙古文书刊、图表、报纸激光照排系统》、《蒙文书目机读数据库》等;藏文《兰海藏文系统》、《北大方正藏文书版系统》、《WIN95藏文文字平台》、《藏文字处理软件》等;朝鲜文《方正朝鲜文书版系统》;彝文《彝文字符国际标准》、UCDOS汉彝双语平台》、《SPDOS汉彝文版汉字操作系统》、《WIN彝文文字平台》等;傣文《傣文电子出版系统》以及《计算机锡伯文、满文文字处理系统》和《壮语词库》等。1991年4月,内蒙古电子计算中心课题组完成了蒙古、藏、维吾尔、哈萨克、朝鲜、满、汉文操作系统4 0版的设计,是国家重点科技攻关项目“少数民族文字处理技术开发”的子课题,这个操作系统可同在一个微机上处理民族文字和汉、英等文。
我们看到,与云南少数民族彝、傣、藏为主体的文字文献已有密切相关的处理系统作为良好基础,将云南的彝、傣、藏文数字化已是指日可待了。民族文字信息技术的成功开发研制,为民族文字文献数据库的建设创造了必要的条件,为民族文字文献的深层次开发利用提供了技术标准和强有力的信息处理保障。但就云南省拥有自己语言或文字的23个少数民族来说,要将其所有民族文字文献数字化,任务还十分艰巨。如东巴象形文至今还未见到一个成熟的软件,但可喜的是有更多的学者都在积极努力寻求将其数字化的途径。华东师范大学中文系郑飞洲就撰文《关于纳西东巴文字信息处理的设想》,专门讨论将现有东巴文字及其研究资料科学合理地整合成数据库,并将文字的检索分为形、音、义检索,从东巴文字字形的描写项、语音的描写项和字形表义情况的描写项三个方面进行检索研究,又根据东巴文的特质提出用字素检索来解决东巴象形文的数字化问题。
三、构建地方少数民族文字文献数据库的现实意义
构建地方少数民族文字文献数据库的现实意义有:
(一)有利于保护和保存优秀的民族文化遗产少数民族文字文献载体除彝族的比较多样化外,其余均主要为纸质。彝文古籍除有竹木质载体外,还有骨质、皮书、布帛书、金石质、石质及纸质。骨质一般用之即弃,很少有保留和流传;皮书易腐布帛书价值昂贵;金石质的在云南仅发现一枚“昭通蛙钮铜印”;石质彝文古籍较著名的有《罗婺贤代铭》(公元1533年)、《普沙摩崖碑》(清咸丰年间)。纸质彝文仍是彝文古籍的主体,大量的彝文古籍主要是靠纸质传承下来的。傣文古籍主要记录在贝叶、绵纸和皮纸上;东巴文古籍书写的纸张是东巴们用当地生长的构树或兰毒草等植物制作的厚硬绵纸;藏文古籍的载体也是纸质;回族古籍多为绵纸、麻纸、草纸和石质的碑刻铭题……。显而易见,纸作为一种文献的重要载体,有它一定的局限性:易腐,不易携带,不易保存,这些制约了它的传世不朽。在科技迅猛发展的信息时代,用机器存贮的方法将民族文化这块瑰宝存贮于易传输、易检索、易复制、保存永久,一次输入、多次输出的现代化管理系统中,是有利于民族文字文献的传承与保护的。
(二)有利于开发和利用民族文化资源,形成特色服务,为研究者提供文献资源保障。地方民族文字文献数据库建设的目的,是为了适应中国地方民族学、民族文化等学科研究之需要,利用现代化手段为教学科研人员提供研究动态、最新成果,把握研究方向,引导这些学科研究走上为民族现代化建设服务的正确轨道。云南璀璨的民族文化资源,是民族学等学科研究的丰厚沃土。在云南,民族学研究源远流长,民族学的研究机构已有30多个,且人才辈出,硕果累累:1986年,云南大学民族学学科中的民族史专业被批准为云南省高等学校重点学科,1997年被正式列为“211工程”部级重点学科;“中国民族史”和“云南地方民族文化”两学科也被列为省级重点学科。作为云南地方的优势、优长学科就应在多方面给予重视和支持。建立云南地方少数民族文字文献数据库,就是为了更好地支持优长学科研究以提供文献保障。
目前,为适应不同层次用户的需要,全国民族高校都设立了民族文献资料室,建立了一批民族文献信息中心,如西藏民院的藏学研究中心、贵州民院的全国傩文化研究资源中心、新疆大学的维吾尔及哈萨克学文献信息中心,等等。云南民族大学民族文化学院筹建了“云南少数民族语言数据库”,软件建设已全部完成,现已投入正常使用[6];云南大学宋光淑老师1999-2002年主持完成了提要型《纳西东巴文化研究数据库》后又主持建设了《西南少数民族数据库》;云南省科研图书馆自1995年以来已建有《馆藏少数民族专题书目数据库》及还将拟建成《云南少数民族画库》。这些成果,把作为云南民族文化载体的云南民族文字文献,经过规范化、数字化处理,使之变成易检索、易复制、不受时空限制的机读式文献,并使之更好的开发和利用。
四、云南少数民族文字文献数据库构建方略
云数据管理技术的一个有效管理方案就是NoSQL系统,即非关系型数据库,NoSQL数据库相对于传统的关系型数据库更适合处理高并发读写、海量数据处理、高扩展性和可用性的应用需求。目前主流的NoSQL数据库主要有BigTable、HBase、Dynamo、Cassandra、MongoDB、CouchDB、Redis、Riak、Membase等。本文以NoSQL系统的典型代表MongoDB数据库为例进行研究。MongoDB是为了Web应用而设计的数据库管理系统,MongoDB能够提供高读写吞吐量、易于伸缩,还能进行自动故障转移,能够解决传统关系型数据库面向Web纯动态网站的高并发读写、海量数据的高效访问、高可扩展性和高可用性时的困境,因此得以推广。MongoDB的设计定位是在具有key/value存储方式的高性能和高度扩展性的同时,具备传统的关系数据库管理系统的丰富功能,集两者的优势于一身。MongoDB使用数据结构松散的BSON(BinaryJSON)格式,面向文档存储数据,使用自动分片(Auto-Sharding)实现海量数据存储,支持全类型索引,使用的查询语言语法类似面向对象査询语言,可以实现类似关系数据库单表查询的绝大部分功能,支持主/从(Master/Slave)和复制集(ReplicaSet)两种数据复制机制。
2数据库建设基本流程
利用实地调研、个人采访的方法获取石油文化纸本文献,然后通过输入设备对这些资源进行数字化,调研、收集、保存、整理网上已的石油文化数字资源,将两种来源途径的石油文化资源放入原始库待处理。通过信息的抽取、分类等方法,对数据信息进行整合,构建数据模型,利用相应软件设计,形成有效信息库。通过前台网页,实现信息与信息检索。图1所示是石油文化数据库建设基本流程。
3基于MongoDB的数据库设计
3.1MongoDB数据库
MongoDB是最受欢迎的开源NoSQL数据库之一,因其高效的性能和丰富的使用功能在生产中有非常广泛的应用。MongoDB是一个面向文档的数据库。数据库有两个要素构成:文档和集合。(1)文档:是MongoDB的核心概念,是键值对的有序集。文档的键和值不再是固定的类型和大小。其功能类似关系数据库中的一条记录。(2)集合:就是一组文档。集合是动态模式的,即一个集合中的文档可以是各式各样的。但集合之间不能进行连接查询。(3)数据库:由集合构成。一个数据库可以包含有0个或者多个集合。文档、集合、数据库三者关系如图2所示。
3.2石油文化数据库设计模型
虽然一个集合中的文档可以是各种各样的,但为了提高管理和查询的访问效率,还是要根据应用情况适当进行分类,考虑应用不同集合来存放相关文档。石油文化资源类型多样化,有文字、图片、图像、音视频资料等,根据实际操作需要,本数据库共建立了3个集合,分别为:用户users集合、资源s1集合,资源Content集合。但Content集合属于嵌入式集合。(1)用户集合users用户包括普通用户和管理员,用户集合主要保存用户的姓名、密码、操作权限等信息。具体如下表1所示。(2)资源s1集合资源集合是本数据库核心内容,主要用于存放关于石油文化的数字资源,可以是文字、图像、声音视频等信息。用集合s1保存资源基本信息(如资源名称、资源创建时间、访问次数,等等),用集合Content用来保存资源具体数据(资源类型,资源内容等)。由于Mon-goDB不能进行集合间连接查询,并且考虑到文字、图像及声音视频之间的关联,因此利用MongoDB的em-bed(嵌入)方法,把资源内容Content作为内嵌文档保存,以达到一次查询的效果。具体如下表2所示。
4结语
本文构建了一种基于云数据管理技术的数据库模型,接下的工作是进一步探讨数据库实现及应用。云数据管理技术所表现出来的可扩展性和松耦合的数据模式以及在易用性、高度伸缩性、支持海量数据等方面所表现出来的优势,其发展前景值得期待,值得科研工作者深入研究。
基站网元需要对数据的各种操作方式作出快速的响应,以及用户信息的固化存储,防止断电后引起的数据丢失,基站的系统资源有限制,不能选用耗费系统资源的物理数据库,专用通信网络使用SQLite数据库,集成了内存的高效操作以及支持物理存储,无需安装,应用广,商用性好。基站控制器,调度台服务器,网管服务器等网元需要存储各种不同的用户信息以及呼叫服务信息,计费信息等各种海量数据,它们对操作数据的反应时间没有很严格的需求,但对数据库存储能力有较大的需求,可以采用应用比较广泛的MySQL数据库。一级网元,作为整网的数据存储以及处理中心,数据量以及数据安全性是需要首先考虑的问题,Oracle是最值得信赖的大型关系型数据库。虚拟数据库使上层软件开发人员无需关心任何物理数据库接口,只需要使用虚拟数据库提供的一套接口,即可自由灵活进行数据的管理操作。
1.1虚拟数据库的基本操作数据库的基本操作分为插入,更新,删除,查询,针对每张表的操作方式,也是基于基本的四类操作,根据操作条件进行操作,总可以将数据转化成SQL语句进行操作。
1.2虚拟数据库的实现虚拟数据库操作的底层接口是各种物理数据库提供的API,虚拟数据库需要将这些API集中地封装起来,并根据用户的需求选择使用。封装结构可以如下所示。示例中仅封装了几个常用的数据库API,也可以根据需求追加定义其他API进入封装结构,也可以根据用户需求随时将其他数据库API封装进来。
2数据下发过程
2.1数据正常下发过程(1)底层网元首先向上层网元上报数据资源审计请求,并将底层网元的数据标识(通常为MD5校验码)带给上层网元。(2)计算底层网元数据审计标识,判断底层数据是否与上层网元数据一致,如果一致,发送数据审计结果正确给底层网元,否则发送数据不一致给底层网元。(3)根据结果判断,如果无需同步,向上层网元发送数据审计流程结束,如果需要同步,向上层网元发送数据请求,数据请求中包含请求数据表,以及数据指针,用于标识上次请求到的数据位置。(4)按照请求数据,从数据库中取出数据,以及数据指针,封装进数据下发包。(5)数据循环向下层网元发送,直到底层网元不在请求数据为止,同时底层网元上报数据审计流程结束,完成数据下发过程。
2.2数据异常下发过程(1)底层网元在无法打开本地的数据库情况下,判断为本地数据库已经损坏,向上层网元发送数据库崩溃通知。(2)生成下层网元的数据库,根据网元类型,通过FTP向底层网元发送数据库文件或者数据文件。(3)底层网元接收完成数据库后,打开数据库,上报数据资源审计请求。
3结束语
每个通信系统都有自身特点,设计出一个适用于本系统的数据库架构,将极大提高系统对数据的处理能力,同时不会降低系统的运营速度,虚拟数据库涉及到数据库技术,操作系统,计算机通信等多方面知识,是一项复杂的工作,需要在实践中不断创新发展。
1 数据库系统的主要特点
1.1 数据结构化:在文件系统中,尽管其记录内部已有了某些结构,但记录之间没有联系。而数据库系统则实现了整体数据的结构化,这是数据库的主要特征之一,也是数据库与文件系统的本质区别。
1.2 数据的共享性高、冗余度低、易于扩充:数据库系统从整体角度看待和描述数据,数据不再面向某个特定的应用程序,而是面向整个系统;因此,数据可以被多个用户、多个应用程序共享使用。数据共享可以大大减少数据冗余,节约存储空间。数据共享还能够避免数据之间的不相容性与不一致性。
1.3 数据独立性高:数据独立性包括数据的物理独立性和逻辑独立性。物理独立性是指用户的应用程序与存储在磁盘上的数据库中的数据是相互独立的。也就是说,数据在磁盘上的数据库中如何存储是由DBMS管理的,用户程序不需要了解,应用程序要处理的只是数据的逻辑结构,这样,当数据的物理存储结构改变时,用户的程序不用改变。逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的,也就是说,数据的逻辑结构改变了,用户程序也可以不改变。
1.4 数据由DBMS统一管理和控制:数据库的共享是并发的(concurrency)共享,即多个用户可以同时存取数据库中的数据,甚至可以同时存取数据库中的同一个数据。
DBMS必须提供以下几方面的数据控制功能:数据的安全性保护(security),数据的完整性检查(integrity),数据库的并发访问控制(concurrency,)数据库的故障恢复(recovery)。
在各类计算机数据库系统中,较广泛运用的有Ashton-Tate公司的DBASEIII、Foxsoftware公司的FoxBASE+,以及Microsoft公司的Access,Borland公司的Paradox。前两者属于传统的关系型数据库。从组成上来看计算机数据库一般包括以下一些内容:①结构化了的数据;独立于使用它们的程序。②在一个单独的数据库中,字段名是唯一的。③用公共通用的方法可以完成数据处理。④具有连接、选择、投影的特点,可以进行数据库之间的关系运算。数据库的这些优点极大地方便了数据库的使用,有效地提升了数据库资源的使用率,从而减少了大量的人力劳动,促进和实现了信息资源的进一步合理优化配置。
2 计算机数据库系统的应用现状
2.1 应用范围不断扩大。计算机技术与数据库理论相结合体现出了良好的生命力和市场发展前景,其在当前的应用范围也在不断的迅速的扩大,目前已经扩大到了我国工业、农业和第三产业,成为带动相关行业信息管理效率的提升,推动行业生产力水平提升的重要技术支撑和保障。
2.2 数据库技术的不断发展。计算机数据库技术的优劣好坏将对其使用质量产生致命的影响,并将影响到其进一步的发展。事实上数据库系统在经历了网状数据库、层次数据库、关系数据库和面向对象数据库等四个发展阶段后,已经具备了更强的适用性和操作性。这种适用性和操作性为其在信息管理中的良好应用提供了有力的保证。
2.3 安全性不断加强。安全性的不断增强是计算机数据库系统在信息管理中不断得到应用的又一有力保证。数据是信息管理中极为重要而有价值的资源,企业信息化过程中,各种应用系统的数据库中大量数据的安全问题、敏感数据的防窃取和防篡改问题,成为信息管理面临的重大问题。
2.4 受重视程度不断提高。计算机数据库系统因其具有良好的安全性和适用性。在实际使用和操作中体现了良好的应用性能,因而其在理论研究与实践开展中都得到了各界的广泛重视。
3 改进计算机数据库系统在信息管理中应用的建议
1概述
1.1农学学科
农学,即农艺学,是农业科学领域的传统科学,涉及禾谷类、豆类、薯类、饲料作物、牧草绿肥作物、经济作物、野生植物、热带亚热带等多种类型的农作物;农学研究内容分布广泛,包括生物学原理、栽培技术与方法、品种与种质资源、作物遗传育种与良种繁育、耕作学与有机农业播种、栽植田间管理、农产品收获、加工及贮藏、农产品综合利用、农产副业技术等多个方面[2]。根据教育部《学位授予和人才培养学科目录》中设置的学科门类可知,农学学位授予包括作物学、园艺学、农业资源与环境、植物保护、畜牧学、兽医学、林学、水产和草学,这里的农学取农业科学的概念[3]。农学分支学科分支较多,使得学科之间交叉性强;学科研究地域性、季节性强,使得学科实践性突出;学科涉及知识面广,知识更新周期短。
1.2农学数据库特点
1.2.1学科分布广交叉学科多农学数据库种类较多,涉及学科分布广,交叉学科多。以美国国家农业图书馆Agricola文摘索引为基础的ProquestAgricultureJournals数据库,收录农业各个方面的期刊资源,涉及水产学和渔业、动物学与兽医学、植物学、农业经济、食品与营养学、农场与农场体系、林业、农作物等。因此,与农业相关交叉学科、多学科的研究内容应属于农学资源范畴。
1.2.2研究内容地域性、季节性、实践性强不同国家、不同地区农业具有明显地域性和季节性,使得研究农业及其相关内容具有明显区别。以中国科技期刊数据库查找有关水稻种植主题的论文为例,汪跃洪发表“南方丘陵区旱地水稻种植自然水资源微循环灌溉系统试验研究”[4],张玉华则发表“北方寒地耐冷抗病优质高产新品种龙稻5号”[5],同是水稻种植,因南北方的地域性、时间性、实践性,使得研究内容具有明显的差异性。因此,农学数据库收录内容具有明显的地域性、季节性,实践性。
1.2.3更新周期短、访问方式多样、检索功能完善为适应农学学科发展要求,数据库更新周期缩短,访问方式多样、检索平台功能完善。农学数据库从之前的月更新、周更新到现在的日更新,保证用户能够及时快速访问到最新数据库资源。同时数据库访问方式除了镜像版,还提供远程访问、在线浏览等多种形式。数据库检索功能从早期仅提供题录检索,到现在的全文访问、快速检索、高级检索、专业检索、浏览、链接、引文分析、多语种等多种功能,检索功能完善。以Ovid平台的Agris、Agricol和CAB世界三大农业数据库为例,提供中文检索页面、高级检索、快速检索、专业检索、支持打印输出、浏览链接等多种功能的检索平台,为用户有效获取资源提供方便。
2农学科技查新主要数据库选择标准
2.1涉及收录学科和内容的全面性、权威性
因农学学科特点,农学课题科技查新数据库应考虑数据库收录学科和内容的全面性、权威性。全面性和权威性是科技查新对文献源的首要要求。科技查新每部分都需列出检索使用的综合数据库和专业数据库。综合数据库保证在文献信息覆盖范围的全面,不但收录农学,同时收录其它学科、交叉学科的内容。专业数据库收录农学领域的专业性强、专指度高的文献,具有权威性。
2.2量化国内外数据库充分利用免费网络资源
2013年9月1日实施的《教育部科技查新工作站查新报告撰写规范》,严格要求中文数据库检索必查数据库应不少于10个、外文数据库检索必查数据库应不少于10个,必查数据库欠缺时需采用国际联机进行补充检索[6]。因此,农学课题科技查新时,中外文数据库的选择不宜少于20个。
2.3兼顾查新课题要求的地域性、季节性、实践性
因学科特点,在进行具体农学课题科技查新时,应兼顾课题内容的地域性、季节性以及实践性。地域性不宜忽略研究地区或国家不同但研究内容相似的文献。同时,在农学课题查新时,季节性和实践性也应考虑其中。
3农学科技查新国内外数据库的选择和案例分析
3.1基本数据库
根据《教育部科技查新工作站查新报告撰写规范》的要求和上文提到的农学科技查新数据库选择标准,并结合高校图书馆科技查新的实践工作,笔者认为应具备收录学科和内容全面的、权威性高的综合数据库,具备收录农学类资源专指度高的专业数据库。如Ovid平台的世界三大农业数据库、Proquest农业期刊数据库、中国期刊全文数据库等(详见附表)。同时,对于数据库的选择量化数量,充分利用免费网络资源,兼顾查新课题实际要求。其中维普包括中国科技期刊全文数据库、外文科技期刊数据库等子库,comKI包括中国学术期刊数据库、国内外重要会议论文全文数据库、《中国专利全文数据库(知网版)》和《海外专利摘要数据库(知网版)》、中国优秀博硕士学位论文全文数据库等子库;万方包括中国学位论文数据库、中国学术会议论文数据库、中外标准数据库、专利技术数据库、数字化期刊系统等子库。除此之外,有关DIALOG国际联机检索系统、免费网络资源(如google学术搜索、百度)、免费的开放存取资源等都可作为数据库资源欠缺图书馆的有益补充。
3.2案例分析
笔者最后以“一种新型植物源诱抗剂在水稻上的应用研究”查新课题作为案例,进行实证分析。首先该课题研究内容是以前胡为原料,分离纯化出稻瘟病诱抗剂,并借助于计算机设备,多角度研究稻瘟病致病机理和诱抗行为。查新确定的中文检索词有前胡、植物源诱抗剂、诱导水稻抗性、稻瘟病、水悬浮剂、系统抗性、植物源农药;英文检索词有RadixPeucedani、inducingresistance、riceblastMagnaprothegrisea、SuspensionConcentrate,SC、systemicacquiredresistance、elicitorbotanicalpesticides,中英文检索式为“诱抗剂*稻瘟病”、“诱抗剂*水稻”、“前胡*稻瘟病”、“riceblast-a-n-delicitor”、“(RadixPeuceda-ni)a-n-d(riceblast)”等。选择的中英文检索工具有comKI中国学术期刊数据库、国内外重要会议论文全文数据库、中国优秀博硕士学位论文全文数据库、中国科技论文在线、中国学术会议在线、国际科技成果网NAST、国家科技图书文献中心、中国科学引文数据库、中国科学文献服务系统、Calis中国高校学位论文库;外文数据库Agris、Agricol、Cabi、ProquestAgricultureJournals、PQDT博硕士学位论文库、ScienceDirect、SCI、AllianceCommunicationsGroupJournals、ASA-CSSA-SSSAJournals、TheCanadianInstituteofForestryJournal。对检索结果去重、排除不相关析出文献后,得到与查新课题相关的中文一般相关文献13篇,密切相关文献1篇,外文一般相关文献12篇,密切相关文献0篇。其中密切相关文献:“前胡诱导水稻抗稻瘟病的活性及其有效成分”一文,发表在2010年《中国农业科学》期刊中。最后根据检索结果对该课题给予了客观、公正的结论与评价。现行的《教育部科技查新工作站查新报告撰写规范》对数据库的选择上有明确规定。因数据库收录的文献类型、数量、语种、时间等均有所不同,对于农学课题查新实践,根据课题的实际需要,尽量有针对性地选择收录具体资源的数据库,严格遵守农学学科特点和数据库选择标准,选择准确检索词、构建合理检索式,保证检索结果的查全率和查准率。
4结语
根据教育部科技查新工作站建设和年审要求,科技查新业务工作必须保证数量,也要保证质量。因此,在寻求科技查新质量、数量平衡点上,对不同类型课题科技查新应确立相关的文献资源选择标准,明确农学课题科技查新数据库资源需求是保证查新质量的前提。
>> 学位论文数据库管理的工作细则 “JALIS博硕士学位论文数据库”的建设实践 国内几种常用论文全文数据库在科技查新中的作用 《SQL server数据库应用》精品课程专题网站建设中的思考与建议 苍穹建库软件在城镇地籍数据库建设中的应用 特色数据库建设中的元数据质量控制研究 农村地籍数据库建设中的数据质量控制 GIS辅助软件在县级矿产规划数据库建设中的应用 Oracle数据库在企业信息化建设中的应用 ArcGIS在土地利用规划数据库建设中的应用 特色数据库建设中的版权问题研究 高职院校校园网建设中的数据库异构现象分析 人才网站建设中的数据库资源核心地位探讨 MAPGIS在县市界线数据库建设中的应用 当前所在位置:.
[2]河海大学研究生院。概况[EB/OL].http:∥/s/11/t/359/p/1/c/4570/list.htm.
[3]河海大学研究生院。河海大学博士(硕士)学位论文编写格式规定[EB/OL].http:∥/picture/article/11/37/1a/6e2a8fca4b298439a0398e7446d8/c189342c-9ed2-43cf-9330-4a13c67e82f0.doc.
[4]河海大学研究生院。河海大学工程硕士学位论文编写格式规定[EB/OL].http:∥/picture/article/11/e4/15/ddea 70144007bbe4217a0bcaa094/66f573d3-f974-4e88-9945-1ba5bbb95e0c.doc.
[5]百度百科。baidu.河海大学工商管理硕士(MBA)学位论文编写格式规定[EB/OL].http:∥/link?url=52 QlbvoAD1d25IrJPXI-bJKHIbk-p3uvMpDVXa7nSUT1-6jT1 JpwfTG18yqzhxh5XOgGh0LWXaN-bLON-9kd4PrGUXWMQZZBemFXMEq.
[6]河海大学研究生院。学科布局[EB/OL].http:∥/s/11/t/359/p/1/c/4571/d/4638/list.htm.
ODBC(OpenDataBaseConnectivity,开放数据库连接)是微软开放服务结构中有关数据库的一个组成部分。它建立了一组规范,并提供了一组应用程序调用接口。用这样一组接口建立的应用程序,对数据库的操作不依赖于任何数据库管理系统,不直接与任何DBMS打交道,由此可实现应用程序对不同DBMS的共享论文。数据库操作的“数据源”对应用程序是透明的,所有的数据库操作由对应DBMS的ODBC驱动程序(ODBCDriver)完成。有了ODBC驱动程序,数据源就变得十分广泛,它可以是本机的某种数据库格式的文件(如本机DOS目录下的Access文
件*.mdb),也可以是远程数据库文件(如MicrosoftSQLServer);它可以是已知的某种DBMS格式,也可以是一种全新的数据库格式。总之,它取决于提供了什么数据库类型的驱动程序。
VisualC++中的ODBC主要是实现基于Windows的关系数据库的应用的共享。
二、ODBC管理器
在ODBC中,数据源是一个重要的概念,它是数据库位置和数据库类型等连接信息的总和。数据源在使用前必须通过ODBC管理器(Administrator)进行登录。在登录数据源时,要搞清数据源名(Datasourcename)、数据库文件名(Databasename)和数据表格名(Tablename)这三者的概念和相互关系:数据源实际是一种数据连接的抽象,数据源名是登录时赋予的“连接”的名称,以供应用程序使用,至于该数据源下连接的是哪一个数据库,则由数据库文件名指出(如Access2.0forMSOffics中的。mdb文件);一个数据库文件中可以包括若干个数据表格(table)和其他。在关系@@09A05900.GIF;图1ODBC层次关系图数据库中,数据是以二维表格的方式存在于数据库@@文件中,应用程序最终的操作目标即是这些表格中的行(row记录)和列(columns字段)数据。对于foxprow数据源,数据库文件名是“路径名”,而该路径下的所有数据文件(*.dbf)都属于该“数据库文件”名下的数据表格(table)。
ODBC管理器被装在ControlPanel里(ODBCINST.CPL)。通过该工具可以增添、修改或删除数据源,也用来增添、删除ODBC驱动程序,ODBC管理器把数据源和它们的连接信息保存在ODBC.INI、ODBCINST.INI和ODBCISAM.INI中。当需要共享应用程序时,只需按新的数据文件的类型和位置重新登录即可。
三、ODBC应用程序接口
ODBCAPI是一组标准的ODBC函数库,除了一般的数据库操作函数外,还包括一组函数(如SQLExec或SQLExecdirect)能够内嵌标准SQL查询语句。SQL(StructuredQueryLanguage结构化查询语言)是一种存取关系型数据库的标准语言,能够定义、查询、修改和控制数据,简单的语句能够作用于整个数据表格,具有很强的功能。
同Windows3.1SDK中API类似,ODBCAPI也是基于句柄(handle)进行操作的。API函数按功能可分为以下几类:
·数据源连接函数,设置/获取有关信息的函数;
·准备/提交执行SQL查询语句的函数和获得数据的函数;
·终止函数和异常处理函数。
上述函数的顺序也表示了进行数据库操作的一般顺序。两个需要特别说明,一是数据类型问题:数据源中的数据所具有的数据类型称为SQL数据类型,这些数据类型在其数据源中可能比较特殊,不一定和ODBCSQL数据类型存储方式一致,驱动程序把这些数据类型同ODBCSQL数据类型进行相互转换,每一个ODBCSQL数据类型都相当于一个ODBCC语言数据类型;二是函数的调用级别问题,并不是每一个ODBC驱动程序都支持所有的ODBCAPI函数调用,在应用程序中,可以调用有关函数获取驱动程序以支持层次方面的信息。
四、ODBC编程
在VisualC++中,MFC(MicrosoftFoundationClass基本类库)是经过对Windows应用程序中各个部件进行类的抽象而建立的一组预定义的类,如窗口基类(CWnd)、各种窗口派生类等等,这些类在应用程序中可直接使用,不需要重新定义。在MFC中,也为ODBC预定义了几个类,其中主要的是数据库类(CDatabase)和记录集合类(CRecoredset)。这两个类既有联系又有区别,在应用程序中,可以分别使用,也可以同时使用,每一类也可以同时存在多个对象。CDatabase的每一个对象代表了一个数据源的连接,CRecordset的每一个对象代表了从一
个数据表中按预定的查询条件获得的记录的集合,一般说来,前者适宜于对数据源下的某个数据表格进行整体操作,后者用于对所选的记录集合进行处理。
同Windows类与SDKAPI函数的关系一样,CDatabase类与ODBCAPI函数也有类似的关系,但CDatabase类中并不包含所有的ODBCAPI函数,大部分操作功能仍须直接调用ODBCAPI函数,如目录功能函数,用于获得数据源下的数据表格信息,如表格名,字段名等。
在应用编程时,一般使用CDatabase和CRecordset的派生类。假设派生类分别为CUserdb和CUserset,而在应用类CUserClass中,使用了一个CUserdb对象(m-db)和一个Cuserset对象(m-recset),图2给出了用户应用类与ODBC类的相互关系示意图。
@@09A05901.GIF;图2CDatabaseCRecordset类与应用类及数据源关系图@@
1.m-db连接数据源
m-db在完成定义构造后,要调用CDatabase的打开(Open)函数以进行数据源的实际连接:
m-db.Open(lpszDSN,bExclusive,bReadOnly,lpszConnect);
打开函数需要输入四个参数。lpszDSN:要连接的数据源的名字,如果lpszDSN=NULL且lpszConnect中也没有指明数据源名,则该调用会自动出现一个对话框列出所有可用的数据源(名),让用户选择。bExclusive:只支持“假”(False)值,表示为共享(share)方式连接。因此,应用程序在运行前,一定要装入share.exe或在Windows的system.ini中装入vshare.386。ReadOnly:指明数据源操作方式是“只读”还是可以修改。lpszConnect:指明连接字符串,包括数据源名、用户标识码、口令等信息。该字符串必须以“ODBC;”开头,表示该连接是与一个ODBC数据源的连接(考虑以后版本支持非ODBC数据源)。
m-db打开后,其指针可以传给m-recset作为其数据源。m-db关闭后,将关闭所有CRecordset对它的连接,m-db也可以重新打开。
2.m-db操作数据
数据源打开后,即可对数据库文件中的数据表格进行操作,操作以调用SQL语句方式进行,可直接通过ODBCAPI函数,或者CDatabase类成员函数ExecuteSQL。数据表名在SQL语句中指定,如下语句则在所在的数据源中的clerk表中插入一个记录,记录的name字段值为"chen"。
m-db.ExecuteSQL("insertintoclerk(name)value(''''chen'''')");3.m-recset连接数据m-recset在构造时,可传入一个CDatabase对象指针,作为m-recset的数据源,当为NULL时,必须重载CRecordset的函数GetDefaultConnect,以提供数据源连接字符串(相当于m-db.Open中的lpszConnect)。如下则表示连接名为COMPANY的数据源(当传入了合法的CDatabase对象指针时,该函数将不被调用)。
CStringCUserset::GetDefaultConnect()
{
return"ODBC;DSN=COMPANY;";
}4.m-recset选取记录和字段
m-recset在调用打开函数时,即获得了符合条件的一组记录,条件语句在Open函数中的lpszSQL中给出,如果lpszSQL为NULL,则必须重载CRecordset的函数以提供该语句。该语句是一个SELECT语句,带或不带where和orderby子句(如果不带,where和Orderby的条件也可在CRecordset的两个预定义成员变量m-strFilter和m-strSort中给出)。lpszSQL也可以只是一个数据表名(table-name),也可以是对内嵌在数据库文件中的查询程序的调用语句。所选择的一系列字段名,在成员函数DoFieldExchange中由一系列RFX-函数指定。RFX-(RecordFieldExchange)函数,使字段和成员变量一一建立类型对应关系。另外,m-strFilter中也可以带变量参数(用"?"表示,如"fieldl>=?ANDfield2<=?"),参数与成员变量的对应关系也在DoFieldExchange中由RFX-函数指定(串中的"?"将被参数变量值逐一替换)。
voidCUserset::DoFieldExchange(CFieldExchange*pFX)
{
pFX->SetFieldType(CFieldExchange::outputColumn);
/*以下为字段连接*/
RFX-???(pFX,"field1",m-var1);
RFX-???(pFX,"field2",m-var2);
...
RFX-???(pFX,"fieldn",m-varn);
pFX->SetFieldType(CFieldExchange::param);
/*以下为参数连接*/
RFX-???(pFX,field1,m-param1);
RFX-???(pFX,field2,m-param2);
...
}其中,???为ODBCSQL数据类型名,如RFX-Double,RFX-Text等。
综合上述,选取记录和字段实际是由下列语句完成:
SELECTrfx-field-listFROMtable-name[WHEREm-strFilter][ORDERBYm-strSort]
字段变量和参数变量的个数一定要在调用打开函数前(如构造函数中)准确地赋值给成员变量m-nFields和m-nParams。m-recset在打开后的任何时候调用Requery()函数,将根据新的查询条件(例如修改了参数变量值)重新选取记录。
5.m-recset操作数据
记录集合生成后,其当前记录的各字段值被保存在前述的各字段变量中,如果调用CRecordset的滚动(scroll)函数,如MoveFirst(),MoveNext(),MovePrev(),MoveLast()等,字段变量的值将自动跟随“当前”记录的位置的变化而变化。IsBOF(),IsEOF()用于判别是否移动到记录的头或尾。
数据操作主要包括删除(Delete),添加(AddNew)和更改(Edit),一般流程为:
if(m-recset.CanUpdate())/*是否允许修改*/
{
if(m-db.CanTransact())/*是否支持“批”处理*/
{
m-db.BeginTrans();
m-recset.AddNew();
/*修改字段变量值*/
...
m-recset.Update();
m-mitTrans();
if(catcherror)
m-();
}
}
对于AddNew和Edit,修改字段变量后一定要调用函数Update(),否则更新将丢失,而Delete操作则不必进行字段值修改和调用Update()。
上述的CDatabase的四个函数是ODBC为保证数据操作的可靠性而提供的“批”处理函数,即在BeginTrans和CommitTrans之间的数据修改如果出现任何异常,可通过函数RoolBack来恢复所做的修改。
在多用户系统使用时,每一个数据源可以被多个用户的多个任务连接,不同的任务可同时修改相同的数据源。ODBC提供了两种数据表更新的同步机制(在m-recset.Open函数中指定),“静态”的(snapshot)和动态的(dynaset)。前者是一组静态的记录集合,当建立后不会改变,除了反应自己的添加/删除外,不反应别的用户的修改,除非调用了Requery重新建立。后者是一组动态的记录集合,自己或别的用户所作的修改随时反应到集合中来(当然也可用Requery重建),以保持记录与数据源的同步。在应用中,应根据需要确定使用哪一种方式。
五、结束语
从以上讨论可以看出,ODBC应用接口十分简便!再加上VisualC++中的AppWizard和ClassWizard自动生成框架代码功能,连接一个数据源,生成一个CRecordset对象,就更快捷了。