分類資料庫設計
① 如何進行文章分類和標簽的資料庫設計
幾乎在所有web項目中,都涉及文章分類和標簽的設計,應該說這是一個比較常見、典型的案例。站長並不保證我的思路就是最好的,只是分享出來大家一起交流一下,互相促進與提高。我們假設的開發項目是一個博客系統,最核心的部分就是與文章相關的,那麼我們今天討論如何設計博客系統的文章分類和標簽。1、首先,分類和標簽都是要和具體的文章相關聯的,當然也可能一些文章既沒有分類也沒有標簽,這一點是大家在寫查詢的時候容易疏忽的地方。因為我們的第一感覺就是,在查詢文章列表的時候關聯分類表,查出所有的文章和分類,對應關系一般是文章表的分類id對應分類表的id,使用where子句進行限定。這里就存在一個問題了,由於使用了where子句,那麼只能查詢有分類的文章,而沒有分類的文章就查詢不到了。這時候怎麼辦?應該使用連接查詢,left join,這要沒有分類的文章,在文章分類id那一欄會顯示null。通常我們只使用left join,而很少使用right join。2、一般,一篇文章最好只對應一個分類,當然如果你想要對應多個分類也可以。但站長並不提倡,文章在多個分類中重復會給人很不專業的感覺,即使有些文章可能確實設計到多方面的內容,那麼你應就其中的側重點來分類。而標簽就不一樣了,一篇文章可能有多個標簽。這就意味著我們無法靠一個sql語句既查出所有文章的分類和標簽,又做到查詢結果中的文章id不重復。通常我們需要把查詢出來的結果直接循環出來,那麼這個結果一般是二維數組,第二維的都存儲了唯一一篇文章的相關信息。但是,標簽和文章是多對一的關系,多個標簽對應一篇文章,如果你只用一條sql語句的話,那麼我們查詢出來的結果,當然也是多行,這不符合我們目標數據的要求。應此,需要在查詢完文章和分類之後,在前面結果的基礎上再查詢一次文章標簽,把兩次的結果結合起來,存在數組中,這是對應文章列表頁面的查詢方法。對於具體文章頁面,可以分兩次查詢。好了,還沒有給出具體的資料庫設計,就先說了如何查詢結果,相信大家也看煩了,下面就舉例說明:一、文章表:post,欄位如下:id【唯一標識】,aid【作者id】,title【標題】,content【內容】,cid【分類id】二、分類表,category,欄位如下:id【唯一標識,與post表的cid關聯】,name【分類名】三、標簽表,tag,欄位如下:id【唯一標識】,name【標簽名】四、標簽與文章對應關系表,tag_relationship,欄位如下:id【唯一標識】,postid【文章id,與post表的id關聯】,tagid【標簽id,tag表的id關聯】有朋友可能會問:為什麼要單獨用一個表來存儲文章與標簽的對應關系,為什麼不可以直接在tag表中增加一個文章id欄位呢,比如:tag表:id,postid,name這樣做的話,並不是不可以,但是,由於一篇文章對應多個標簽,所以name欄位的值會出現很多重復,比如一篇文章,假設文章id為1,有2個標簽,php和mysql,那麼在tag表會這樣存儲:id:1,postid:1,name:phpid2,postid:1,name:mysql另一篇文章,假設id為2,有2個標簽,也是php和mysql,那麼在tag表中它會這樣存儲:id:3,postid:2,name:phpid4,postid:2,name:mysql大家很快就發現了問題,這樣的設計name欄位也就是標簽的名稱在同一張表中可能會大量重復。但是這樣設計的好處是,如果你要查詢一個標簽下有多少篇文章,只要單獨查這個表就可以了,比如要查詢含有php標簽的文章有多少篇,只需要select count(name) �0�2from tag where name=』php』,就可以查出來。不好的地方是,如果要查詢所有標簽的集合,使用這種設計需要使用group by name語句來去除重復的行。如果用之前的那種,只需要select * from tag就可以了。一時之間,好像不太好取捨。這兩種設計都會有數據冢余,第一種tag_relationship表中,存在tagid欄位的重復;而這兩種設計又都有各自的好處。那麼我們到底該怎麼選擇呢?站長也說不好,所以無法為大家下結論。但是站長在研究wordpress數據結構的時候,發現wp是採用的單獨建表存儲文章與標簽對應關系的方式。另外,如何設計有時候也是取決具體功能的需求的,所以這個問題就留給大家一起來討論吧~ 標簽:分類和標簽, 博客資料庫設計
② 分類信息資料庫設計
運用Visual FoxPro開發學生管理系統摘要:學生管理系統的功能主要可分為系統、編輯、查詢及統計.為了簡化系統結構,方便使用者操作,可以採用Visual FoxPro的頁框技術.一個資料庫應用系統的優劣,在很大程度上取決於資料庫的結構設計,且數據量越大效果越明顯.關鍵詞:面向對象編程;學生管理系統;流程;Visual FoxPro目前,很多學校的學生管理工作基本上還是採用手工方式,因沒有管理軟體而沒有實現管理工作自動化.對於一些購買的軟體,由於開發者缺乏學生管理的經驗,這些軟體有的不易操作,有的功能不夠完善,升級維護也不方便.各學校如果能夠根據實際情況,充分利用新技術自行開發適合本校管理模式的學生管理系統,既可以提高工作效率,又能節省資金,升級維護也十分方便.本文探討如何運用Visual FoxPro開發學生管理系統.1系統功能及其人機界面設計1.1系統功能針對學校學生管理工作的特點,筆者認為學生管理系統應具備以下基本功能.1.1.1主要功能其中,系統功能主要實現系統資料庫的打開及關閉、自動生成庫存記錄、系統數據的備份及恢復、列印各類統計報表等;編輯功能主要實現資料庫記錄的增加、刪除和修改以及系統基本信息的設置;查詢及統計功能主要實現學生有關信息的查詢、人事綜合查詢、快速定位查詢和有關信息的分類統計.1.1.2輔助功能包括:系統作實際物理刪除時給出提示,以防止誤刪除;資料庫整理,將不符合規范的記錄自動清除;進入系統時的身份驗證.1.1.3系統資料庫主要包括:學生基本情況、學生成績、課程設置、考勤情況、任課教師情況等資料庫文件.1.2系統人機界面為了簡化系統結構以及方便使用者操作,可以不採用通常的菜單編寫方式,而採用Visual FoxPro的頁框技術,將系統幾大功能分別放置在頁框的5個Page中,使用人員可以在每一頁中對相應數據進行全面的操作和管理.這些操作包括順序查詢、綜合查詢、新增、刪除、修改等.每頁下的綜合查詢按鈕可彈出多層查詢菜單,在這些菜單中可實現一系列的綜合查詢、統計、列印統計結果、定位等功能.系統維護頁框主要實現對系統原始數據的一些操作,包括備份系統數據到指定介質中、從備份資料中恢復系統數據、自動形成歷史數據的備份記錄和修改系統基本參數.以上功能的實現可增強軟體的靈活性和數據的安全性.2系統開發工作流程運用資料庫設計應用系統時,如果把精力放在表單及報表設計上而不重視資料庫本身的設計,甚至邊進行程序編制邊修改資料庫結構,則極有可能導致存儲空間的浪費、系統效率差、數據不一致、系統維護不方便等不良後果.事實上,一個資料庫應用系統的優劣,在很大程度上取決於資料庫的結構設計,且數據量越大效果越明顯.因此,應將資料庫設計流程作為系統開發的重點.2.1系統功能目標分析本階段的工作是詳細調查研究學生管理工作的流程,整理和概括日常工作的內容、步驟、目標,明確所要開發的軟體應有的基本功能、一般功能、高級功能以及現在暫時不用但以後可能需要的補充功能.2.2設計資料庫設計資料庫是應用系統設計中很關鍵的一個工作流程.為了設計出一個高效率、易於維護和升級的資料庫,在進行資料庫設計時應該做好以下工作.2.2.1數據需求分析數據需求分析的目的是找出應用系統需要用到的所有數據項(數據表中的欄位),即要找出准備放入資料庫的所有數據項,這些數據項在將來的表單及報表設計中都要用到.為了避免日後修改數據結構,要盡可能在此階段列舉出全部、完整的數據項.2.2.2分析數據項當完成所有數據項的收集和羅列後,要找出真正需要放入數據表的數據項,也就是要確定數據表的欄位並將其放入數據表中.在確定數據表欄位時應把握以下原則:①不要包含可由其他欄位計算(推導)得來的欄位;②不要包含可自行計算得來的欄位;③以最小的邏輯組合單位儲存數據;④不可包含內容相同但名稱不同的欄位.2.2.3資料庫規范化為了避免數據重復或不一致的情況發生,可將上一步工作所得到的數據表分割成數個大小適當、相互關聯、「規范化」的數據表.2.3設計程序基本流程框圖一個簡單明了的程序流程可以極大地精簡系統編制的工作量,同時又能讓使用者操作起來得心應手.如果程序流程設計得過於復雜、交叉作業太多,必然導致操作人員使用上的不便.設計時應該明確系統使用對象和他們的工作習慣,盡量簡化流程,使操作者在當前GUI下實
③ 二級分類的資料庫怎麼設計 - 技術問答
視頻屬性: 視頻id(主鍵)key1;視頻地址;視頻名稱;視頻分類1(主分類)key2;視頻分類2(子分類)key3;
分類1(主分類)屬性: 分類id(主鍵)key2;分類名稱;
分類2(子分類)屬性: 分類id(主鍵)key3;從屬分類key2;分類名稱;
④ 1,資料庫表結構如何設計,有哪些表,分別有什麼作用
一般可將資料庫結構設計分為四個階段,即需求分析、概念結構設計、邏輯結構設計和物理設計。
數據字典(Data Dictionary DD)用於記載系統定義的或中間生成的各種數據、數據元素,以及常量、變數、數組及其他數據單位,說明它們的名字、性質、意義及各類約束條件,是系統開發與維護中不可缺少的重要文件。數據與數據元素分別用數據表、數據元素表記載。其中,數據號是設計人員給定的順序編號,用於分類清查與整理,並且與數據元素代碼相關聯。數據名是原有表格或憑證的名稱。
⑤ 商品分類的資料庫是怎麼設計的以滿足查詢的高效
這個三個表就應該夠了吧,一個是商品大類表,一個是品牌表,另外是商品詳細信息表
商品類別表:
ClassID
ClassName
ParentID //這個商品類歸屬的上個大類,也就是滿足你的多級分類要求
舉個例子 假設說你的鞋子分類id是1,那下屬的小類舉例說女涼鞋,她的ParentID就是1,明白?
品牌表:
BrandID
BrandName
BrandDescription
商品詳細信息表:
GoodId
ClassID
BrandID
GoodName
GoodDescription
GoodURl
還有其他你想加的屬性
⑥ 產品對應多個分類,資料庫如何設計最合理
這個要看產品的屬性的相似度吧,如果相似度很高用一張表就好了。如果相似度低,就抽取公共屬性建一張產品表,根據情況再建幾長擴展屬性表吧。
⑦ 如何進行文章分類和標簽的資料庫設計
舉個例子,一篇文章, 比如 《大陸 ** 明星又離婚了》 這屬於 「娛樂」 類新聞, 又屬於 「中國」 分類下的新聞, 所以文章和分類的關系一般是 1 對 N 。
資料庫表結構設計
article :
欄位名 注釋
id
title 文章標題
author 作者
create_time 創建時間
edit_time 修改時間
creator 創建者
editor 修改者
等等...
category:
欄位名 注釋
id
article_id 文章 id
category_name 分類名
subcategory_id 子分類(與分類一對多的關系, 不一定需要子分類)
子分類可以依次類推, 想分多細分多細, 看需求
就以只有分類為例(是否含子分類其實原理類似), 這樣其實 left join 就可以出來結果, 但是這樣的結果不適合展示, 因為多個分類查出的一篇文章就有幾行結果(對於 SQL 來說幾個分類就幾條數據), 所以在後台管理的文章列表頁面中, 一次查文章, 還有一次根據文章 id 查出所有分類, 兩次查詢結果和起來才能顯示一條結果,如下表格所示:
標題 分類
《大陸 ** 明星又離婚了》 「大陸」 「娛樂」
⑧ 一件商品不同分類資料庫設計
一:先抽象一個公用的「商品」實體,然後每一個具體的類型的商品繼承這個實體,可是這樣子設計的話,不同種類的商品一多的話,那麼表就越多。感覺還是很糟糕。
二:直接在」商品「這個實體里添加多一個屬性,屬性的值按約定的規則(如鍵值對)來描述包括這個商品種類信息,這樣子的話就只要一張表就行。不過這樣子做的話,在展示商品信息需要在前台對這個屬性值進行分離,感覺好像哪裡不太符合規范。
⑨ 系統資料庫和模型庫設計
(一)系統資料庫類型
資料庫是整個農用地分等信息系統的基礎,是系統開發設計要考慮的重中之重。在數據形式上,系統資料庫包括兩大塊:一是空間資料庫,二是屬性資料庫。目前的空間數據技術已從以MapInfo為代表的混合型資料庫(空間資料庫+關系型資料庫)發展到以ArcInfo的Coverage為代表的拓展型資料庫。鑒於農用地分等屬性數據量龐大,為減少數據冗餘,提高數據檢索的速度,本研究採用空間數據和屬性數據分開管理的模式,依據關鍵欄位進行綁定,進行科學索引,從而實現空間數據和屬性動態鏈接和高效整合。
1.空間資料庫
江蘇省農用地分等信息系統空間資料庫內容包括以下方面:
(1)土地利用現狀圖層:全省13個省轄市以1996年土地利用現狀圖為基礎,經變更調繪形成以2000年為基準年的土地利用現狀圖,以現行的土地分類標准按八大類分類進行信息提取並分層存儲,系統分別存儲為耕地、林地、水域、未利用地、建設用地等圖層。
(2)全省土壤類型圖層:以土屬為分類單位,比例尺為1:20萬。
(3)1996年和2000年全省行政區劃圖層:在行政區劃中精確到鄉鎮級別,分別提取存儲了市名圖層、縣(區)名圖層、鄉(鎮)名圖層、全省行政界線圖層、市級行政界線圖層、縣(區)級行政界線圖層、鄉(鎮)級行政界線圖層。
(4)評價單元圖層:通過GIS空間疊加功能,利用土地利用現狀圖、行政區劃圖和土壤類型圖疊加產生的評價單元圖層,建立分等評價單元資料庫。
2.屬性資料庫
江蘇省農用地分等信息系統屬性資料庫內容包括以下方面:
(1)土壤屬性數據:以全國第二次土壤普查為基礎,結合全省土壤監測樣點數據,建立土壤質量狀況資料庫,最小單位為土種,包括pH值、有機質含量、表層土壤質地、耕層厚度、障礙層深度、水土侵蝕程度、鹽漬化程度數據。
(2)農田水利環境數據:建立了1996~2000年間各鄉鎮農田水利環境基礎資料庫,包括灌溉保證率、排水條件數據。
(3)土地利用現狀數據:建立了全省13個省轄市的以1996年土地利用現狀圖為基礎,經變更調繪形成的以2000年為基準年的土地利用現狀資料庫,區分耕地中的詳細用地類型差異,標示水田、旱地、荒草地等納入本次評價范圍的用地內容。
(4)全省地形地貌資料庫。
(5)農業區劃數據:輸入了江蘇省農業區劃數據,把江蘇全省劃分為6大區劃,以鄉鎮為最小級別,建立全省鄉鎮的區劃歸屬資料庫。
(6)農業耕作制度數據:建立了全省各市、縣、鄉鎮的農業耕作制度資料庫,包括指定作物水稻和小麥的播種空間分布狀況資料庫。
(7)光溫生產潛力數據:建立了全省各市、縣指定作物水稻和小麥的光溫生產潛力和氣候生產潛力資料庫。
(8)農業投入-產出數據:全省13個省轄市以鄉鎮為單位,建立了1996~2000年農業生產投入-產出資料庫。
(9)作物產量數據:全省13個省轄市以鄉鎮為單位,建立了1996~2000年的指定作物水稻和小麥的產量資料庫。
(10)土地利用詳查分類面積數據:全省13個省轄市以鄉鎮為單位,建立了2000年土地利用詳查分類面積資料庫。
從數據格式上分,資料庫又可分為:①圖件資料庫:指空間數據以及綁定在空間數據上的相關屬性數據,本次江蘇省農用地分等建立了以分等單元為記錄的屬性資料庫,並通過關鍵欄位與空間數據關聯;②分類統計資料庫:包括全省13個省轄市以鄉鎮為單位的1996~2000年指定作物產量統計數據和全省13個省轄市以鄉鎮為單位的2000年土地利用詳查分類面積統計數據。
(二)系統資料庫管理模式
為減少數據存儲冗餘,同時提高索引速度,江蘇省農用地分等信息系統數據文件採用普遍的目錄樹形式進行管理,按省-市-縣行政體系分別存儲相關數據。全省建立13個省轄市分目錄,分目錄下按照各自所含的縣(區)建立子目錄。根據目前行政管理體系現狀,基礎資料大多來源於縣級行政單位,因此採用縣(區)為基本行政單位較為合理,在保證資料來源的同時,也利於資料的分類歸檔存儲。其相對應的空間圖件數據也按精度要求分割到縣級行政單位,既能減少系統調用數據的吞吐量,同時也滿足了系統的精度需求。空間數據、屬性數據、文本數據按照各自所屬的行政級別歸類存儲,同時設立數據文件管理器進行目錄文件的索引管理,見圖3-86。
圖3-86 江蘇省農用地分等信息系統數據文件管理模式圖
(三)系統資料庫結構
資料庫的結構設計決定了數據之間的調用及介面關系,清晰的邏輯調用關系和統一的數據介面格式有利於數據的組織、管理、調用。
1.空間資料庫
江蘇省農用地分等信息系統空間資料庫以矢量圖件的形式存在,以分圖層的方式管理,包括了全省行政界線、土壤類型、按八大類分別提取的土地利用現狀、分等單元等圖層。其中,分等單元圖層作為農用地分等的基礎,考慮到圖層本身信息量大,可能影響到系統運行效率,因此所在圖層的屬性表中只保留了ID欄位,通過ID欄位與外部屬性庫綁定,實現分等單元與外部屬性庫一一對應關系。ID欄位是本圖層的特徵代碼,表徵了單元的唯一性,能體現出單元的圖上位置和行政歸屬。《農用地分等定級規程》(國土資源大調查專用)和《中華人民共和國行政區劃代碼》(GB/T 2260-1999)為本研究分等單元代碼的編碼依據;本研究有1996年和2000年兩套行政區劃工作底圖,為此分等單元特徵代碼共設14位,依次為江蘇省代碼(2位)-市代碼(2位)-2000年縣或區代碼(2位)-2000年鄉鎮代碼(2位)-1996年縣或區代碼(2位)-1996年鄉鎮代碼(2位)-分等單元號(2位)。其中,省、市、縣(區)的行政代碼按國家統一代碼,鄉鎮級代碼在縣(區)范圍內根據劃分分等單元的需要依次編碼;分等單元編號的原則是不破鄉鎮界,即單元號是在同一鄉鎮內部自行編碼。示例:32011501210101,指1996年江蘇(32)南京(01)市江寧縣(21)由於2000年行政調整變更為南京(01)的江寧區(15)。按行政體系分級編碼的優點是有利於空間查詢和國土資源管理部門根據工作需求按行政級別分類匯總統計數據。
2.屬性資料庫
江蘇省農用地分等信息系統採用關系型資料庫來存儲數據,優點是結構清晰明了,數據的更新維護方便,通過索引能優化資料庫,建立快速的查詢瀏覽(表3-26~表3-30)。
表3-26 行政代碼數據結構表
表3-27 土壤屬性數據結構表
表3-28 農田水利設施數據結構表
表3.29 指定農作物投入-產出數據結構表
表3-30 農業耕作制度及農業區劃表
(四)系統模型庫
系統以《農用地分等定級規程》(國土資源大調查專用)中的相關技術方法和計算模型為基礎,在模型庫中預先內置了分等計算模型。模型庫是動態,它允許專家根據情況動態調整計算模型形式及其參數。系統主要模型的數學計算公式如下:
(1)農用地自然質量分值(Clij)計算公式見式(3-11)。
(2)樣點土地利用系數計算公式:
中國耕地質量等級調查與評定(江蘇卷)
式中:
Klj´——樣點的第j種指定作物土地利用系數;
Yj——樣點的第j種指定作物實際單產;
Yj,max——第j種指定作物最大標准糧單產。
(3)等值區土地利用系數計算公式:
中國耕地質量等級調查與評定(江蘇卷)
式中:
Klj——等值區內第j種指定作物土地利用系數;
Klj´——參與計算的同一等值區內合格樣點第j種指定作物土地利用系數;
n——排除異常數據後參與計算的樣點的個數。
(4)樣點土地經濟系數計算公式:
中國耕地質量等級調查與評定(江蘇卷)
式中:
Kcj′——樣點的第j種指定作物土地經濟系數;
Yj——樣點第j種指定作物實際單產;
Cj——樣點第j種指定作物實際成本;
Aj——第j種指定作物最高「產量-成本」指數。
(5)等值區土地經濟系數計算公式:
中國耕地質量等級調查與評定(江蘇卷)
式中:
Kcj——等值區內土地經濟系數;
Kcj´——參與計算的同一等值區內合格樣點第j種指定作物土地經濟系數;
n——排除異常數據後參與計算的樣點的個數。
(6)農用地自然質量等指數(Ri)計算公式見式(3-12)和式(3-13)。
(7)農用地利用等指數(Yi)計算公式見式(3-14)和式(3-15)。
(8)農用地經濟等指數(Gi)計算公式見式(3-16)和式(3-17)。
⑩ 資料庫設計中為什麼進行分類編碼設計分類的方法是什麼
分類演算法要解決的問題
在網站建設中,分類演算法的應用非常的普遍。在設計一個電子商店時,要涉及到商品分類;在設計發布系統時,要涉及到欄目或者頻道分類;在設計軟體下載這樣的程序時,要涉及到軟體的分類;如此等等。可以說,分類是一個很普遍的問題。
我常常面試一些程序員,而且我幾乎毫無例外地要問他們一些關於分類演算法的問題。下面的舉幾個我常常詢問的問題。你認為你可以很輕松地回答么?
1、分類演算法常常表現為樹的表示和遍歷問題。那麼,請問:如果用資料庫中的一個Table來表達樹型分類,應該有幾個欄位?
2、如何快速地從這個Table恢復出一棵樹?
3、如何判斷某個分類是否是另一個分類的子類?
4、如何查找某個分類的所有產品?
5、如何生成分類所在的路徑。
6、如何新增分類?
在不限制分類的級數和每級分類的個數時,這些問題並不是可以輕松回答的。本文試圖解決這些問題。
分類的數據結構
我們知道:分類的數據結構實際上是一棵樹。在《數據結構》課程中,大家可能學過Tree的演算法。由於在網站建設中我們大量使用資料庫,所以我們將從Tree在資料庫中的存儲談起。
為簡化問題,我們假設每個節點只需要保留Name這一個信息。我們需要為每個節點編號。編號的方法有很多種。在資料庫中常用的就是自動編號。這在Access、SQL Server、Oracle中都是這樣。假設編號欄位為ID。
為了表示某個節點ID1是另外一個節點ID2的父節點,我們需要在資料庫中再保留一個欄位,說明這個分類是屬於哪個節點的兒子。把這個欄位取名為FatherID。如這里的ID2,其FatherID就是ID1。
這樣,我們就得到了分類Catalog的數據表定義:
Create Table [Catalog](
[ID] [int] NOT NULL,
[Name] [nvarchar](50) NOT NULL,
[FatherID] [int] NOT NULL
);
約定:我們約定用-1作為最上面一層分類的父親編碼。編號為-1的分類。這是一個虛擬的分類。它在資料庫中沒有記錄。
如何恢復出一棵樹
上面的Catalog定義的最大優勢,就在於用它可以輕松地恢復出一棵樹?分類樹。為了更清楚地展示演算法,我們先考慮一個簡單的問題:怎樣顯示某個分類的下一級分類。我們知道,要查詢某個分類FID的下一級分類,SQL語句非常簡單:
select Name from catalog where FatherID=FID
顯示這些類別時,我們可以這樣:
<%
REM oConn---資料庫連接,調用GetChildren時已經打開
REM FID-----當前分類的編號
Function GetChildren(oConn,FID)
strSQL = "select ID,Name from catalog where FatherID="&FID
set rsCatalog = oConn.Execute(strSQL)
%>
<UL>
<%
Do while not rsCatalog.Eof
%>
<LI><%=rsCatalog("Name")%>
<%
Loop
%>
</UL>
<%
rsCatalog.Close
End Function
%>
現在我們來看看如何顯示FID下的所有分類。這需要用到遞歸演算法。我們只需要在GetChildren函數中簡單地對所有ID進行調用:GetChildren(oConn,Catalog(「ID」))就可以了。
<%
REM oConn---資料庫連接,已經打開
REM FID-----當前分類的編號
Function GetChildren(oConn,FID)
strSQL = "select Name from catalog where FatherID="&FID
set rsCatalog = oConn.Execute(strSQL)
%>
<UL>
<%
Do while not rsCatalog.Eof
%>
<LI><%=rsCatalog("Name")%>
<%=GetChildren(oConn,Catalog("ID"))%>
<%
Loop
%>
</UL>
<%
rsCatalog.Close
End Function
%>
修改後的GetChildren就可以完成顯示FID分類的所有子分類的任務。要顯示所有的分類,只需要如此調用就可以了:
<%
REM strConn--連接資料庫的字元串,請根據情況修改
set oConn = Server.CreateObject("ADODB.Connection")
oConn.Open strConn
=GetChildren(oConn,-1)
oConn.Close
%>
如何查找某個分類的所有產品
現在來解決我們在前面提出的第四個問題。第三個問題留作習題。我們假設產品的數據表如下定義:
Create Table Proct(
[ID] [int] NOT NULL,
[Name] [nvchar] NOT NULL,
[FatherID] [int] NOT NULL
);
其中,ID是產品的編號,Name是產品的名稱,而FatherID是產品所屬的分類。對第四個問題,很容易想到的辦法是:先找到這個分類FID的所有子類,然後查詢所有子類下的所有產品。實現這個演算法實際上很復雜。代碼大致如下:
<%
Function GetAllID(oConn,FID)
Dim strTemp
If FID=-1 then
strTemp = ""
else
strTemp =","
end if
strSQL = "select Name from catalog where FatherID="&FID
set rsCatalog = oConn.Execute(strSQL)
Do while not rsCatalog.Eof
strTemp=strTemp&rsCatalog("ID")&
GetAllID(oConn,Catalog("ID")) REM 遞歸調用
Loop
rsCatalog.Close
GetAllID = strTemp
End Function
REM strConn--連接資料庫的字元串,請根據情況修改
set oConn = Server.CreateObject("ADODB.Connection")
oConn.Open strConn
FID = Request.QueryString("FID")
strSQL = "select top 100 * from Proct
where FatherID in ("&GetAllID(oConn,FID)&")"
set rsProct=oConn.Execute(strSQL)
%>
<UL><%
Do while not rsProct.EOF
%>
<LI><%=rsProct("Name")%>
<%
Loop
%>
</UL>
<%rsProct.Close
oConn.Close
%>
這個演算法有很多缺點。試列舉幾個如下:
1、 由於我們需要查詢FID下的所有分類,當分類非常多時,演算法將非常地不經濟,而且,由於要構造一個很大的strSQL,試想如果有1000個分類,這個strSQL將很大,能否執行就是一個問題。
2、 我們知道,在SQL中使用In子句的效率是非常低的。這個演算法不可避免地要使用In子句,效率很低。
我發現80%以上的程序員鍾愛這樣的演算法,並在很多系統中大量地使用。細心的程序員會發現他們寫出了很慢的程序,但苦於找不到原因。他們反復地檢查SQL的執行效率,提高機器的檔次,但效率的增加很少。
最根本的問題就出在這個演算法本身。演算法定了,能夠再優化的機會就不多了。我們下面來介紹一種演算法,效率將是上面演算法的10倍以上。
分類編碼演算法
問題就出在前面我們採用了順序編碼,這是一種最簡單的編碼方法。大家知道,簡單並不意味著效率。實際上,編碼科學是程序員必修的課程。下面,我們通過設計一種編碼演算法,使分類的編號ID中同時包含了其父類的信息。一個五級分類的例子如下:
此例中,用32(4+7+7+7+7)位整數來編碼,其中,第一級分類有4位,可以表達16種分類。第二級到第五級分類分別有7位,可以表達128個子分類。
顯然,如果我們得到一個編碼為 1092787200 的分類,我們就知道:由於其編碼為
0100 0001001 0001010 0111000 0000000
所以它是第四級分類。其父類的二進制編碼是0100 0001001 0001010 0000000 0000000,十進制編號為1092780032。依次我們還可以知道,其父類的父類編碼是0100 0001001 0000000 0000000 0000000,其父類的父類的父類編碼是0100 0000000 0000000 0000000 0000000。
現在我們在一般的情況下來討論類別編碼問題。設類別的層次為k,第i層的編碼位數為Ni, 那麼總的編碼位數為N(N1+N2+..+Nk)。我們就得到任何一個類別的編碼形式如下:
2^(N-(N1+N2+…+Ni))*j + 父類編碼
其中,i表示第i層,j表示當前層的第j個分類。這樣我們就把任何分類的編碼分成了兩個部分,其中一部分是它的層編碼,一部分是它的父類編碼。由下面公式定一的k個編碼我們稱為特徵碼:(因為i可以取k個值,所以有k個)
2^N-2^(N-(N1+N2+…+Ni))
對於任何給定的類別ID,如果我們把ID和k個特徵碼「相與」,得到的非0編碼,就是其所有父類的編碼!
位編碼演算法
對任何順序編碼的Catalog表,我們可以設計一個位編碼演算法,將所有的類別編碼規格化為位編碼。在具體實現時,我們先創建一個臨時表:
Create TempCatalog(
[OldID] [int] NOT NULL,
[NewID] [int] NOT NULL,
[OldFatherID] [int] NOT NULL,
[NewFatherID] [int] NOT NULL
);
在這個表中,我們保留所有原來的類別編號OldID和其父類編號OldFatherID,以及重新計算的滿足位編碼要求的相應編號NewID、NewFatherID。
程序如下:
<%
REM oConn---資料庫連接,已經打開
REM OldFather---原來的父類編號
REM NewFather---新的父類編號
REM N---編碼總位數
REM Ni--每一級的編碼位數數組
REM Level--當前的級數
sub FormatAllID(oConn,OldFather,NewFather,N,Nm,Ni byref,Level)
strSQL = "select CatalogID ,
FatherID from Catalog where FatherID=" & OldFather
set rsCatalog=oConn.Execute( strSQL )
j = 1
do while not rsCatalog.EOF
i = 2 ^(N - Nm) * j
if Level then i= i + NewFather
OldCatalog = rsCatalog("CatalogID")
NewCatalog = i
REM 寫入臨時表:
strSQL = "Insert into TempCatalog (OldCatalogID ,
NewCatalogID , OldFatherID , NewFatherID)"
strSQL = strSQL & " values(" & OldCatalog & " ,
" & NewCatalog & " , " & OldFather & " , " & NewFather & ")"
Conn.Execute strSQL
REM 遞歸調用FormatAllID:
Nm = Nm + Ni(Level+1)
FormatAllID oConn,OldCatalog , NewCatalog ,N,Nm,Ni,Level + 1
rsCatalog.MoveNext
j = j+1
loop
rsCatalog.Close
end sub
%>
調用這個演算法的一個例子如下:
<%
REM 定義編碼參數,其中N為總位數,Ni為每一級的位數。
Dim N,Ni(5)
Ni(1) = 4
N = Ni(1)
for i=2 to 5
Ni(i) = 7
N = N + Ni(i)
next
REM 打開資料庫,創建臨時表:
strSQL = "Create TempCatalog( [OldID]
[int] NOT NULL, [NewID] [int] NOT NULL,
[OldFatherID] [int] NOT NULL, [NewFatherID] [int] NOT NULL);"
Set Conn = Server.CreateObject("ADODB.Connection")
Conn.Open Application("strConn")
Conn.Execute strSQL
REM 調用規格化常式:
FormatAllID Conn,-1,-1,N,Ni(1),Ni,0
REM ---------------------------------------------
REM 在此處更新所有相關表的類別編碼為新的編碼即可。
REM ----------------------------------------------
REM 關閉資料庫:
strSQL= "drop table TempCatalog;"
Conn.Execute strSQL
Conn.Close
%>
第四個問題
現在我們回頭看看第四個問題:怎樣得到某個分類下的所有產品。由於採用了位編碼,現在問題變得很簡單。我們很容易推算:某個產品屬於某個類別的條件是Proct.FatherID&(Catalog.ID的特徵碼)=Catalog.ID。其中「&」代表位與演算法。這在SQL Server中是直接支持的。
舉例來說:產品所屬的類別為:1092787200,而當前類別為1092780032。當前類別對應的特徵值為:4294950912,由於1092787200&4294950912=8537400,所以這個產品屬於分類8537400。
我們前面已經給出了計算特徵碼的公式。特徵碼並不多,而且很容易計算,可以考慮在Global.asa中Application_OnStart時間觸發時計算出來,存放在Application(「Mark」)數組中。
當然,有了特徵碼,我們還可以得到更加有效率的演算法。我們知道,雖然我們採用了位編碼,實際上還是一種順序編碼的方法。表現出第I級的分類編碼肯定比第I+1級分類的編碼要小。根據這個特點,我們還可以由FID得到兩個特徵碼,其中一個是本級位特徵碼FID0,一個是上級位特徵碼FID1。而產品屬於某個分類FID的充分必要條件是:
Proct.FatherID>FID0 and Proct.FatherID<FID1
下面的程序顯示分類FID下的所有產品。由於數據表Proct已經對FatherID進行索引,故查詢速度極快:
<%
REM oConn---資料庫連接,已經打開
REM FID---當前分類
REM FIDMark---特徵值數組,典型的情況下為Application(「Mark」)
REM k---數組元素個數,也是分類的級數
Sub GetAllProct(oConn,FID,FIDMark byref,k)
' 根據FID計算出特徵值FID0,FID1
for i=k to 1
if (FID and FIDMark = FID ) then exit
next
strSQL = "select Name from Proct where FatherID>
"FIDMark(i)&" and FatherID<"FIDMark(i-1)
set rsProct=oConn.Execute(strSQL)%>
<UL><%
Do While Not rsProct.Eof%>
<LI><%=rsProct("Name")
Loop%>
</UL><%
rsProct.Close
End Sub
%>
關於第5個問題、第6個問題,就留作習題吧。有了上面的位編碼,一切都應該迎刃而解。