系統(tǒng)結構
知識庫管理系統(tǒng)由如下四部分就組成。
- 知識庫使用關系型數(shù)據(jù)庫來存放知識,包括事實與規(guī)則。
- 搜索模塊實現(xiàn)知識庫和推理機之間的知識搜索和與傳遞。
- 查詢模塊實現(xiàn)推理機對知識庫的知識查詢。
- 一致性、完整性檢查模塊在知識庫中的知識發(fā)生變動時對知識庫中的知識進行一致性、完整性檢查。
具備條件
管理知識庫中知識的程序稱為知識庫管理系統(tǒng),知識庫管理系統(tǒng)可簡稱為KBMS。它應具有以下的功能。
知識的操縱
知識的操縱包括對知識庫中知識的插入、刪除及修改,其中知識的刪除是刪除知識庫中的某些知識,知識的插入是在知識庫中添加一些知識,知識的插入涉及到添加的知識與數(shù)據(jù)庫中的知識的相容性、冗余性等。所謂相容性即是添加的知識與知識庫中的知識是否相矛盾。所謂冗余性即是指所添加的知識是多余的,它可以從原有知識庫中經演繹而推出,而沒有添加這些知識的必要。知識的修改涉及到刪除與插入兩個部分,因此也存在與知識庫的相容性與冗余性等問題。
知識的查詢
知識的查詢在這里有兩層含義。一是從知識庫中提取知識。二是由知識庫中的知識可以推算出一些新的知識。
知識的控制
知識的控制包括知識的一致性和完整性控制、知識共享、知識安全、并發(fā)控制、故障恢復等。這都類似于數(shù)據(jù)庫管理系統(tǒng)。根據(jù)KBMS的功能可以看出,從功能范圍看,KBMS實際上是DBMS的一個擴充,即KBMS包括了DBMS的一切,因此在構制KBMS時就可以盡可能的利用現(xiàn)有的DBMS的功能來實現(xiàn)KBMS,這也為本文將KBMS集成到DBMS中提供了依據(jù)。
知識庫中知識表示模型
知識庫中的知識通常用一種或幾種方法來表示。知識表示的方法決定了知識庫的結構,因此,建立知識庫的關鍵在于如何表達知識。當前知識的表示方去有以下幾種:產生式規(guī)則(Productionrules)、語義網絡(Semanticnets)、謂詞演算(PredicateCalculus)、框架(Frames)等等[4]。
基于邏輯的知識表示
亦即用數(shù)理邏輯(命題邏輯和謂詞邏輯〉來表示知識,這種知識表示方法是最早的一種知識表示模式,它簡單、自然、靈活、模塊化程度高、理論嚴謹、表達能力強,同關系數(shù)據(jù)庫一樣它有堅實的數(shù)學理論基礎。為了克服上述邏輯語言表示能力有限的問題,近年來,在所謂的非經典邏輯研究方面取得了重要進展,如模態(tài)邏輯、時序邏輯和非單調邏輯等。
語義網絡知識表示
一種用帶標記的有向圖來表示知識的形式。語義網作為人類聯(lián)想記憶的顯示心理學模型,它用結點和有向弧組成的網絡描述知識。結點表示各種事物、概念、對象、實體、事件等,帶標記的有向弧表示所連接的結點之間的特定關系。通常,一種關系對應一種推理模式。語義網是一種很強的顯式知識表示方法,它直觀清晰,但不適用于不確定性推理。
框架知識表示
可以把對象的所有知識存儲在一起構成的復雜數(shù)據(jù)結構。它反映了人類通過一般性知識去認識個別事物的特點。一個框架由若干個槽組成,每個槽描述框架所描述的對象的某一方面的特性。槽由槽名和槽值組成,同一個槽可能有多種類型的槽值,每種類型的槽筐稱為榕的一個側面。其中,槽值為附加的過程性知識,稱為附加過程。槽值還可以缺省,取缺省值。當框架具有時間性質,就構成時序框架??蚣苤R表示對實現(xiàn)知識庫系統(tǒng)的非精確推理具有重要作用。
面向對象的知識表示
指采用基于信息隱蔽和抽象數(shù)據(jù)類型概念的面向對象的方法來表示知識,它把所有的實體都描述成對象。每個對象都包括其靜態(tài)結構和一組操作。對象按“類”、“子類”、“超類”構成偏序關系。上一層對象的屬性可以有條件地被下一層對象所繼承,對象之間除了互遞消息之外沒有其它的聯(lián)系。用戶要完成的任務也是通過發(fā)送消息來實現(xiàn)的。面向對象知識表示方法封裝好、層次性強、模塊化程度高,有很強的表達能力,更能用于解決不確定問題。
基于本體的知識表示
基于本體的知識表示方法是近年來的研究熱點之一。這種觀點認為:任何復雜的知識都由最基本的概念構成,這些最基本的概念稱為本題;本體是基本概念的詳細說明。本體的重要性體現(xiàn)在它在知識的可重用和共享性上的重要作用。
基于規(guī)則知識表示
基于產生式規(guī)則時是由E.Post于1943年提出的。他運用這種規(guī)則對符號串作替換運算:運算中的每一條規(guī)則就稱為一個產生式。但產生式方法用于專家系統(tǒng)中,無論在理論上或應用方面都有了較大改進。美國斯坦福大學早在1965年就采用這種方法開發(fā)了世界上第一個專家系統(tǒng)DENDRAL,用于幫助有機化學家確定化合物的內部結構。由于DENDRAL的成功開發(fā),使得用規(guī)則來表示專家知識的方法廣為采用?;谝?guī)則的知識表示使用IFCondition,THENaction形成的產生式規(guī)則表示知識,它具有良好的模塊性,是目前應用最廣泛的知識表示方法之一。
知識的搜索
建立知識庫的重要目的之一是有效地運用知識求解復雜的問題,問題求解的過程本質上即為知識的匹配和搜索過程。在搜索過程中,知識庫中的知識通??煽闯删哂袑哟侮P系的樹狀式、網狀式結構。即從某一結點出發(fā)的有向圖。搜索就是從該點出發(fā)對有向圖的遍歷,即沿著有向弧按特定次序訪問有向圖中的每一個結點:搜索的目的是尋找某些滿足一定條件的結點的集合,搜索方法基本上可分為“盲目搜索”和“啟發(fā)式搜索”兩大類。
盲目搜索
盲目搜索是一種“窮盡”搜索方法,它不需要有關求解問題的先驗信息,但效率較低,不適合應用于具有復雜搜索空間的場合。盲目搜索法包括深度優(yōu)先搜索和寬度優(yōu)先搜索法。
- 深度優(yōu)先搜索法。深度優(yōu)先搜索法從根結點出發(fā),順著一指定的分枝向下一層搜索,直至到達樹葉結點為止:在當前結點的所有子結點均被搜索過時,回溯到上一層結點,并選擇一條新的分枝重復上述過程,直至所有結點在被訪問到為止。
- 寬度優(yōu)先搜索法。寬度優(yōu)先搜索法從根結點出發(fā),按搜索樹的深度一層一層地進行搜索,直至所有結點被訪問到為止。
啟發(fā)式搜索
啟發(fā)式搜索利用以往的經驗指導搜索過程,這些經驗包括事實,簡化的評價推理和規(guī)則等。常用的方法有爬山算法和最佳優(yōu)先搜索法。爬山法直接源于我們的爬山的經驗,在爬山中,我們總是選擇坡度最大的方向作為前進的方向,但是采用爬山法我們有可能到達的只是局部最高點,而不是全局最高點,也就是不是最優(yōu)解。最佳優(yōu)先搜索法是爬山法的改進,以解決爬山法的缺陷。設想有一群登山者,從同一點出發(fā),沿著不同的方向爬山,登山者通過通信工具相互聯(lián)系直至最后到達全局的最高點。由于知識庫的容量通常非常大,所以當涉及較大空間時可采用一些技術來縮小搜索空間,如消去法。消去法是盡可能早地剪去搜索樹中非解〈或可能性很小〉的分校。通過這種剪枝的方法來縮小搜索空間。
知識推理方法
所謂推理,是指從已有的知識推導出某種蘊涵的未知知識或發(fā)現(xiàn)新的知識。知識推理技術是如何從給定的前提或假設推導出某種理論,或在要求達到某種結論的情況下,去尋找什么樣的前提才能導致給定的結論。知識推理是專家系統(tǒng)的核心任務之一,是設計實用專家系統(tǒng)的關鍵技術。知識推理技術多種多樣,有演繹和歸納、單調和非單調、確定的和不確定的等。其中,對于確定的知識處理和演繹推理是基于知識推理的核心內容。推理的方向有正向和逆向兩種,對于不同的推理方向,往往有不同的控制策略。而在專家系統(tǒng)中,我們要尋求的是那些功能強,且能描述和解決一大類有用問題的通用方法。目前,有關確定的、以演繹推理為基礎的有效推理技術主要包括:歸結反演技術、規(guī)則演繹技術、啟發(fā)式技術和黑板技術等。對于不確定的知識處理,目前已經提出了許多新方法,這些方法大致可分為兩大類:一類是采用基于概率論和模糊集合論的數(shù)值方法:另一類是采用非數(shù)值的符號方法。
簡介
知識庫,又稱為智能數(shù)據(jù)庫或人工智能數(shù)據(jù)庫。知識庫的概念來自兩個不同的領域,一個是人工智能及其分支-知識工程領域,另一個是傳統(tǒng)的數(shù)據(jù)庫領域。由人工智能(AI)和數(shù)據(jù)庫(DB)兩項計算機技術的有機結合,促成了知識庫系統(tǒng)的產生和發(fā)展。
知識庫使基于知識的系統(tǒng)(或專家系統(tǒng))具有智能性。并不是所有具有智能的程序都擁有知識庫,只有基于知識的系統(tǒng)才擁有知識庫?,F(xiàn)在許多應用程序都利用知識,其中有的還達到了很高的水平,但是,這些應用程序可能并不是基于知識的系統(tǒng),它們也不擁有知識庫。
與程序的區(qū)別
一般的應用程序與基于知識的系統(tǒng)之間的區(qū)別在于:一般的應用程序是把問題求解的知識隱含地編碼在程序中,而基于知識的系統(tǒng)則將應用領域的問題求解知識顯式地表達,并單獨地組成一個相對獨立的程序實體。
隨著信息化進程,知識庫管理越來越受到企業(yè)的重視,但是企業(yè)在進行文檔管理的過程中,經常會碰到以下的問題:海量知識存儲,管理困難;查找緩慢,效率低下;知識庫版本管理混亂;知識庫安全缺乏保障;知識庫無法有效協(xié)作共享;知識庫管理舉步維艱等。所以知識庫管理逐漸成為國內外業(yè)界研究的熱點。
歷史
在20世紀80年代開始,許多廠商開始開發(fā)的知識庫管理系統(tǒng),以管理紙質文件為主要功能。這些系統(tǒng)管理記錄紙張文件,其中包括印刷、出版的文件、照片和版畫等。
后來開發(fā)商研發(fā)第二類知識庫管理系統(tǒng),即電子文件管理,這些文件存儲在用戶的本地計算機中。最早的電子知識庫管理系統(tǒng)的管理,由于技術限制,對文件類型和文件數(shù)量都做了限制。主要功能集中捕獲、存儲、索引和檢索的文件格式。
發(fā)展到現(xiàn)在,基于B/S架構的知識庫管理系統(tǒng)出現(xiàn),通過上傳到服務器中進行集中存儲,管理起來更加方便,查找更快,而且只要有互聯(lián)網的地方,就可以通過瀏覽器直接訪問系統(tǒng)。也增加了更多功能,包括文檔的權限管理、全文搜索、存儲加密、審批流程、文檔審計、版本管理、規(guī)則應用、在線編輯和統(tǒng)計報表等。
功能
集中存儲:為企事業(yè)單位搭建海量文檔集中存儲的平臺,實現(xiàn)統(tǒng)一的文檔共享。
目錄結構:支持樹形目錄結構,可無限創(chuàng)建文件夾和子文件夾結構。可自定義目錄排序。組織內部所有成員可輕松的實現(xiàn)文件的安全共享與查看。
文檔排序:支持根據(jù)文檔的標題、大小、日期、上傳人等屬性進行排序。
顯示模式:支持目錄以列表模式或縮略圖模式顯示。
全文搜索:全文搜索及高級搜索引擎幫您快速從海量資料中精準查找所需文件。
文檔編輯器:可直接在系統(tǒng)瀏覽器中創(chuàng)建、閱讀和編輯Office文件,無須改變現(xiàn)有的任何操作習慣,無需下載或安裝軟件。
多文件上傳:支持文件的批量上傳及壓縮包導入,實現(xiàn)文檔資料的快速輕松存儲管理,支持Office文檔、PDF、圖像、音視頻和圖紙等各類型文件。
版本管理:強大的版本管理功能,文檔關聯(lián)多版本,避免錯誤版本的使用,同時支持歷史版本的查看、回退與下載。
自動編號:系統(tǒng)提供25種變量,可自由組合設計編號規(guī)則。配合規(guī)則進行條件匹配可實現(xiàn)靈活的編號效果。
文檔審計:文檔審計信息描述了文檔生命周期全過程中的每一個動作,包括操作人、動作、日期時間等信息,通過審計跟蹤您可以全局掌握系統(tǒng)內部所有文件的操作情況。
Office集成:E6與Office無縫集成,可直接在系統(tǒng)中新建、閱讀、編輯各類Office文件,包括Word、Excel、PowerPoint、WPS、Visio等格式。
摘要及縮略圖:系統(tǒng)會自動為上傳的Office文檔、txt、pdf等類型文件生成摘要;系統(tǒng)支持為圖片、音頻、視頻類文件增加摘要及縮略圖,便于預覽查看。摘要及縮略圖功能簡化了操作,用戶無需逐個打開文檔即可快速預覽文檔內容。
鎖定保護:E6除了提供權限控制保護外,還提供鎖定保護機制,文檔作者和管理權用戶可將文檔鎖定,確保文檔不被隨意修改。當文檔需要修改或刪除時,可以解鎖,保證文檔的正常操作。
文檔鏈接:支持將文檔發(fā)送至常用文檔,用戶無需每次在打開各個目錄中查找;支持將文檔發(fā)送至目錄,方便其他部門查閱;支持將文檔發(fā)送至指定用戶從而協(xié)同完成工作;E6與電子郵件集成,支持直接將文檔發(fā)送至Email,無需登錄郵箱及手動上傳附件,操作簡便、非常實用。
關聯(lián)文檔:文檔新建或上傳后,系統(tǒng)會自動或手動為文件生成唯一編號,支持文檔的批量關聯(lián)。E6支持通過文件唯一編號,實現(xiàn)文檔與相關文檔、圖紙、圖片及其它格式附件進行關聯(lián),點擊鏈接即可一鍵快速查看。系統(tǒng)支持為圖片、音、視頻類文件增加摘要及縮略圖。
規(guī)則應用:系統(tǒng)支持為目錄設定規(guī)則,指定動作、條件和操作,當動作觸發(fā)符合設定的條件,系統(tǒng)則自動執(zhí)行規(guī)則的操作。規(guī)則兩個主要功能:一是將文檔自動歸檔到規(guī)則指定的目錄下,實現(xiàn)規(guī)范化管理;二是:文檔自動發(fā)起審批進入流程,實現(xiàn)文檔審批自動化。
權限管理:提供權限控制機制,可針對用戶、部門及崗位進行細粒度的權限控制,控制用戶的管理、瀏覽、閱讀、編輯、下載、刪除、打印、訂閱等操作,實現(xiàn)文檔安全共享。
存儲加密:文件采用加密存儲,防止文件擴散,全面保證企業(yè)級數(shù)據(jù)的安全性和可靠性。
模板管理:支持在系統(tǒng)中創(chuàng)建大量Office模板文件,授權給用戶使用。用戶在新建文檔時,可調用授權的模板。系統(tǒng)自動統(tǒng)一規(guī)則命名文檔,實現(xiàn)文件名標準化管理。
文檔借閱:支持將公共文檔和個人文檔進行借閱管理,借出過程中可控制用戶訪問權限。被借閱用戶會收到系統(tǒng)發(fā)送的即時消息通知。系統(tǒng)支持根據(jù)時間對借出的文檔自動進行收回處理。
多媒體查看器:E6除了管理文檔外,還支持多媒體數(shù)字資產的存儲及管理。您可以直接在系統(tǒng)中預覽圖片、播放視頻、音頻。支持的格式包含:gif、jpg、png、bmp、psd、ai、tif、mp3、wav、wma、flv、mpg、avi、wmv、mp4等。
CAD圖紙管理:E6為了滿足工程建筑、房地產等行業(yè)的需求,支持AutoCAD、SolidWorks、Pro/E、STL等300多種文件格式的在線預覽及管理,減少等待預覽及審核圖紙的時間。
紙質文檔電子化管理:E6除了可以管理電子文檔、多媒體文件、CAD圖紙外,還支持紙質文檔電子化管理。通過掃描儀將紙質文檔轉化為電子的圖片或者PDF存儲至系統(tǒng)。
Office無縫集成:E6與Office無縫集成,系統(tǒng)操作與本地操作無異,無需改變任何習慣,即可快速上手熟練使用系統(tǒng),可多人協(xié)同編輯文檔,多版本進行管理,提高工作效率。
掃描儀集成:與掃描儀緊密集成,通過掃描儀將紙質資料轉化為電子的圖片或PDF文件存儲。減少通過文件柜或抽屜查找紙質文檔所花費的時間,降低紙質文檔可能被損壞、丟失的風險或正在被另一用戶使用而重復復印造成大量紙質成本的浪費。