時間:2022-08-17 09:21:07
序論:好文章的創作是一個不斷探索和完善的過程,我們為您推薦十篇挖掘技術論文范例,希望它們能助您一臂之力,提升您的閱讀品質,帶來更深刻的閱讀感受。
隨著科技的進步,現代挖掘機一般都采用了機電液一體化控制模式,我們在排除一些故障時,解決的多是發動機、液壓泵、分配閥、外部負荷的匹配問題。一般在挖掘機作業中,這幾方面不能匹配,經常會表現為:發動機轉速下降,工作速度變慢,挖掘無力以及一些常見問題。
一、發動機轉速下降
首先要測試發動機本身輸出功率,如果發動機輸出功率低于額定功率,則產生故障的原因可能是燃油品質差、燃油壓力低、氣門間隙不對、發動機的某缸不工作、噴油定時有錯、燃油量的調定值不對、進氣系統漏氣、制動器及其操縱桿有毛病和渦輪增壓器積炭。如果發動機輸出動力正常,就需要查看是否因為液壓泵的流量和發動機的輸出功率不匹配。
液壓挖掘機在作業中速度與負載是成反比的,就是流量和泵的輸出壓力乘積是一個不變量,泵的輸出功率恒定或近似恒定。如果泵控制系統出現了故障,就不能實現發動機、泵及閥在不同工況區域負荷優化匹配狀態,挖掘機從而將不能正常工作。此類故障要先從電器系統入手,再檢查液壓系統,最后檢查機械傳動系統。
二、工作速度變慢
挖掘機工作速度變慢主要原因是整機各部磨損造成發動機功率下降與液壓系統內泄。挖掘機的液壓泵為柱塞變量泵,工作一定時間后,泵內部液壓元件(缸體、柱塞、配流盤、九孔板、龜背等)不可避免的產生過度磨損,會造成內漏,各參數據不協調,從而導致流量不足油溫過高,工作速度緩慢。這時就需要整機大修,對磨損超限的零部件進行修復更換。
但若不是工作時間很長的挖掘機突然變慢,就需要檢查以下幾方面。先查電路保險絲是否斷路或短路,再查先導壓力是否正常,再看看伺服控制閥-伺服活塞是否卡死以及分配器合流是否故障等,最后將液壓泵拆卸進行數據測量,確認挖機問題所在。
三、挖掘機無力
挖掘無力是挖掘機典型故障之一。對于挖掘無力可分為兩種情況:一種為挖掘無力,發動機不憋車,感覺負荷很輕;第二種為挖掘無力,當動臂或斗桿伸到底時,發動機嚴重憋車,甚至熄火。
①挖掘無力但發動機不憋車。挖掘力的大小由主泵輸出壓力決定,發動機是否憋車取決于油泵吸收轉矩與發動機輸出轉矩間的關系。發動機不憋車說明油泵吸收轉矩較小,發動機負荷輕。如果挖掘機的工作速度沒有明顯異常,則應重點檢查主泵的最大輸出壓力即系統溢流壓力。如果溢流壓力測量值低于規定值,表明該機構液壓回路的過載溢流閥設定值不正確,導致該機構過早溢流,工作無力。則可以通過轉動調整螺絲來調整機器。②挖掘無力,發動機憋車。發動機憋車表明油泵的吸收轉矩大于發動機輸出轉矩,致使發動機超載。這種故障應首先檢查發動機速度傳感系統是否正常,檢查方法與前文所述發動機檢查方法類似。經過以上細致的檢查與排除故障,發動機速度傳感系統恢復正常功能,發動機憋車現象消失,挖掘力就會恢復正常。
四、挖掘作業過程中的常見故障
挖掘機在施工作業中經常出現的一些普遍的故障,如:挖機行走跑偏,原因可能為行走分配油封(又稱中心回轉接頭油封)損壞;兩個液壓泵流量大小不一;一邊行走馬達有問題。液壓缸快速下泄則可能為安全溢流閥封閉不嚴,或缸油封嚴重損壞等等。
五、挖掘機的日常保養
為了防止挖掘機的故障發生,在日常使用過程中需要十分注意對挖掘機的保養。日常保養包括檢查、清洗或更換空氣濾芯;清洗冷卻系統內部;檢查和擰緊履帶板螺栓;檢查和調節履帶反張緊度;檢查進氣加熱器;更換斗齒;調節鏟斗間隙;檢查前窗清洗液液面;檢查、調節空調;清洗駕駛室內地板;更換破碎器濾芯(選配件)。清洗冷卻系統內部時,待發動機充分冷卻后,緩慢擰松注水口蓋,釋放水箱內部壓力,然后才能放水;不要在發動機工作時進行清洗工作,高速旋轉的風扇會造成危險;當清潔或更換冷卻液時,應將機器停放在水平地面上。
同時在啟動發動機前需要檢查冷卻液的液面位置高度(加水);檢查發動機機油油位,加機油;檢查燃油油位(加燃油);檢查液壓油油位(加液壓油);檢查空氣濾芯是否堵塞;檢查電線;檢查喇叭是否正常;檢查鏟斗的;檢查油水分離器中的水和沉淀物。
挖掘機在日常工作中遇到的故障還有很多,這里只是介紹了較為常見的幾類故障的維修方法,并且為了減少故障的發生,對挖掘機的日常保養是很重要的。只有做到保養和維護的雙重保障,才能保障挖掘機更好的正常工作。
參考文獻:
根據波特的影響企業的利益相關者理論,企業有五個利益相關者,分別是客戶、競爭對手、供應商、分銷商和政府等其他利益相關者。其中,最重要的利益相關者就是客戶。現代企業的競爭優勢不僅體現在產品上,還體現在市場上,誰能獲得更大的市場份額,誰就能在競爭中占據優勢和主動。而對市場份額的爭奪實質上是對客戶的爭奪,因此,企業必須完成從“產品”導向向“客戶”導向的轉變,對企業與客戶發生的各種關系進行管理。進行有效的客戶關系管理,就要通過有效的途徑,從儲存大量客戶信息的數據倉庫中經過深層分析,獲得有利于商業運作,提高企業市場競爭力的有效信息。而實現這些有效性的關鍵技術支持就是數據挖掘,即從海量數據中挖掘出更有價值的潛在信息。正是有了數據挖掘技術的支持,才使得客戶關系管理的理念和目標得以實現,滿足現代電子商務時代的需求和挑戰。
一、客戶關系管理(CRM)
CRM是一種旨在改善企業與客戶之間關系的新型管理方法。它是企業通過富有意義的交流和溝通,理解并影響客戶行為,最終實現提高客戶獲取、客戶保留、客戶忠誠和客戶創利的目的。它包括的主要內容有客戶識別、客戶關系的建立、客戶保持、客戶流失控制和客戶挽留。通過客戶關系管理能夠提高企業銷售收入,改善企業的服務,提高客戶滿意度,同時能提高員工的生產能力。
二、數據挖掘(DM)
數據挖掘(DataMining,簡稱DM),簡單的講就是從大量數據中挖掘或抽取出知識。數據挖掘概念的定義描述有若干版本。一個通用的定義是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中提取人們感興趣的知識,這些知識是隱諱的、事先未知的、潛在有用的信息。
常用的數據挖掘方法有:(1)關聯分析。即從給定的數據集中發現頻繁出現的項集模式知識。例如,某商場通過關聯分析,可以找出若干個客戶在本商場購買商品時,哪些商品被購置率較高,進而可以發現數據庫中不同商品的聯系,進而反映客戶的購買習慣。(2)序列模式分析。它與關聯分析相似,其目的也是為了控制挖掘出的數據間的聯系。但序列模式分析的側重點在于分析數據間的前后(因果)關系。例如,可以通過分析客戶在購買A商品后,必定(或大部分情況下)隨著購買B商品,來發現客戶潛在的購買模式。(3)分類分析。是找出一組能夠描述數據集合典型特征的模型,以便能夠分類識別未知數據的歸屬或類別。例如,銀行可以根據客戶的債務水平、收入水平和工作情況,可對給定用戶進行信用風險分析。(4)聚類分析。是從給定的數據集中搜索數據對象之間所存在的有價值聯系。在商業上,聚類可以通過顧客數據將顧客信息分組,并對顧客的購買模式進行描述,找出他們的特征,制定針對性的營銷方案。(5)孤立點分析。孤立點是數據庫中與數據的一般模式不一致的數據對象,它可能是收集數據的設備出現故障、人為輸入時的輸入錯誤等。孤立點分析就是專門挖掘這些特殊信息的方法。例如,銀行可以利用孤立點分析發現信用卡詐騙,電信部門可以利用孤立點分析發現電話盜用等。
三、數據挖掘在客戶關系管理中的應用
1.進行客戶分類
客戶分類是將大量的客戶分成不同的類別,在每一類別里的客戶具有相似的屬性,而不同類別里的客戶的屬性不同。數據挖掘可以幫助企業進行客戶分類,針對不同類別的客戶,提供個性化的服務來提高客戶的滿意度,提高現有客戶的價值。細致而可行的客戶分類對企業的經營策略有很大益處。例如,保險公司在長期的保險服務中,積累了很多的數據信息,包括對客戶的服務歷史、對客戶的銷售歷史和收入,以及客戶的人口統計學資料和生活方式等。保險公司必須將這些眾多的信息資源綜合起來,以便在數據庫里建立起一個完整的客戶背景。在客戶背景信息中,大批客戶可能在保險種類、保險年份和保險金額上具有極高的相似性,因而形成了具有共性的客戶群體。經過數據挖掘的聚類分析,可以發現他們的共性,掌握他們的保險理念,提供有針對性的服務,提高保險公司的綜合服務水平,并可以降低業務服務成本,取得更高的收益。
2.進行客戶識別和保留
(1)在CRM中,首先應識別潛在客戶,然后將他們轉化為客戶
這時可以采用DM中的分類方法。首先是通過對數據庫中各數據進行分析,從而建立一個描述已知數據集類別或概念的模型,然后對每一個測試樣本,用其已知的類別與學習所獲模型的預測類別做比較,如果一個學習所獲模型的準確率經測試被認可,就可以用這個模型對未來對象進行分類。例如,圖書發行公司利用顧客郵件地址數據庫,給潛在顧客發送用于促銷的新書宣傳冊。該數據庫內容有客戶情況的描述,包括年齡、收入、職業、閱讀偏好、訂購習慣、購書資金、計劃等屬性的描述,顧客被分類為“是”或“否”會成為購買書籍的顧客。當新顧客的信息被輸入到數據庫中時,就對該新顧客的購買傾向進行分類,以決定是否給該顧客發送相應書籍的宣傳手冊。
(2)在客戶保留中的應用
客戶識別是獲取新客戶的過程,而客戶保留則是留住老顧客、防止客戶流失的過程。對企業來說,獲取一個新顧客的成本要比保留一個老顧客的成本高。在保留客戶的過程中,非常重要的一個工作就是要找出顧客流失的原因。例如,某專科學校的招生人數在逐漸減少,那么就要找出減少的原因,經過廣泛的搜集信息,發現原因在于本學校對技能培訓不夠重視,學生只能學到書本知識,沒有實際的技能,在就業市場上找工作很難。針對這種情況,學校應果斷的抽取資金,購買先進的、有針對性的實驗實訓設備,同時修改教學計劃,加大實驗實訓課時和考核力度,培訓相關專業的教師。
(3)對客戶忠誠度進行分析
客戶的忠誠意味著客戶不斷地購買公司的產品或服務。數據挖掘在客戶忠誠度分析中主要是對客戶持久性、牢固性和穩定性進行分析。比如大型超市通過會員的消費信息,如最近一次消費、消費頻率、消費金額三個指標對數據進行分析,可以預測出顧客忠誠度的變化,據此對價格、商品的種類以及銷售策略加以調整和更新,以便留住老顧客,吸引新顧客。
(4)對客戶盈利能力分析和預測
對于一個企業而言,如果不知道客戶的價值,就很難做出合適的市場策略。不同的客戶對于企業而言,其價值是不同的。研究表明,一個企業的80%的利潤是由只占客戶總數的20%的客戶創造的,這部分客戶就是有價值的優質客戶。為了弄清誰才是有價值的客戶,就需要按照客戶的創利能力來劃分客戶,進而改進客戶關系管理。數據挖掘技術可以用來分析和預測不同市場活動情況下客戶盈利能力的變化,幫助企業制定合適的市場策略。商業銀行一般會利用數據挖掘技術對客戶的資料進行分析,找出對提高企業盈利能力最重要的客戶,進而進行針對性的服務和營銷。
(5)交叉銷售和增量銷售
交叉銷售是促使客戶購買尚未使用的產品和服務的營銷手段,目的是可以拓寬企業和客戶間的關系。增量銷售是促使客戶將現有產品和服務升級的銷售活動,目的在于增強企業和客戶的關系。這兩種銷售都是建立在雙贏的基礎上的,客戶因得到更多更好符合其需求的服務而獲益,公司也因銷售增長而獲益。數據挖掘可以采用關聯性模型或預測性模型來預測什么時間會發生什么事件,判斷哪些客戶對交叉銷售和增量銷售很有意向,以達到交叉銷售和增量銷售的目的。例如,保險公司的交叉營銷策略:保險公司對已經購買某險種的客戶推薦其它保險產品和服務。這種策略成功的關鍵是要確保推銷的保險險種是用戶所感興趣的,否則會造成用戶的反感。
四、客戶關系管理應用數據挖掘的步驟
1.需求分析
只有確定需求,才有分析和預測的目標,然后才能提取數據、選擇方法,因此,需求分析是數據挖掘的基礎條件。數據挖掘的實施過程也是圍繞著這個目標進行的。在確定用戶的需求后,應該明確所要解決的問題屬于哪種應用類型,是屬于關聯分析、分類、聚類及預測,還是其他應用。應對現有資源如已有的歷史數據進行評估,確定是否能夠通過數據挖掘技術來解決用戶的需求,然后將進一步確定數據挖掘的目標和制定數據挖掘的計劃。
2.建立數據庫
這是數據挖掘中非常重要也非常復雜的一步。首先,要進行數據收集和集成,其次,要對數據進行描述和整合。數據主要有四個方面的來源:客戶信息、客戶行為、生產系統和其他相關數據。這些數據通過抽取、轉換和裝載,形成數據倉庫,并通過OLAP和報表,將客戶的整體行為結果分析等數據傳遞給數據庫用戶。
3.選擇合適的數據挖掘工具
如果從上一步的分析中發現,所要解決的問題能用數據挖掘比較好地完成,那么需要做的第三步就是選擇合適的數據挖掘技術與方法。將所要解決的問題轉化成一系列數據挖掘的任務。數據挖掘主要有五種任務:分類,估值預測,關聯規則,聚集,描述。前三種屬于直接的數據挖掘。在直接數據挖掘中,目標是應用可得到的數據建立模型,用其它可得到的數據來描述感興趣的變量。后兩種屬于間接數據挖掘。在間接數據挖掘中,沒有單一的目標變量,目標是在所有變量中發現某些聯系。
4.建立模型
建立模型是選擇合適的方法和算法對數據進行分析,得到一個數據挖掘模型的過程。一個好的模型沒必要與已有數據完全相符,但模型對未來的數據應有較好的預測。需要仔細考察不同的模型以判斷哪個模型對所需解決的問題最有用。如決策樹模型、聚類模型都是分類模型,它們將一個事件或對象歸類。回歸是通過具有已知值的變量來預測其它變量的值。時間序列是用變量過去的值來預測未來的值。這一步是數據挖掘的核心環節。建立模型是一個反復進行的過程,它需要不斷地改進或更換算法以尋找對目標分析作用最明顯的模型,最后得到一個最合理、最適用的模型。
5.模型評估
為了驗證模型的有效性、可信性和可用性,從而選擇最優的模型,需要對模型進行評估。我們可以將數據中的一部分用于模型評估,來測試模型的準確性,模型是否容易被理解模型的運行速度、輸入結果的速度、實現代價、復雜度等。模型的建立和檢驗是一個反復的過程,通過這個階段階段的工作,能使數據以用戶能理解的方式出現,直至找到最優或較優的模型。
6.部署和應用
將數據挖掘的知識歸檔和報告給需要的群體,根據數據挖掘發現的知識采取必要的行動,以及消除與先前知識可能存在的沖突,并將挖掘的知識應用于應用系統。在模型的應用過程中,也需要不斷地對模型進行評估和檢驗,并做出適當的調整,以使模型適應不斷變化的環境。
參考文獻:
[1]羅納德.S.史威福特.客戶關系管理[M].楊東龍譯.北京:中國經濟出版社,2002
[2]馬剛:客戶關系管理[M]大連:東北財經大學出版社,2008
[3]朱美珍:以數據挖掘提升客戶關系管理[J].高科技產業技術與創新管理,2006,(27)
隨著科技的進步,現代挖掘機一般都采用了機電液一體化控制模式,我們在排除一些故障時,解決的多是發動機、液壓泵、分配閥、外部負荷的匹配問題。一般在挖掘機作業中,這幾方面不能匹配,經常會表現為:發動機轉速下降,工作速度變慢,挖掘無力以及一些常見問題。
1發動機轉速下降
首先要測試發動機本身輸出功率,如果發動機輸出功率低于額定功率,則產生故障的原因可能是燃油品質差、燃油壓力低、氣門間隙不對、發動機的某缸不工作、噴油定時有錯、燃油量的調定值不對、進氣系統漏氣、制動器及其操縱桿有毛病和渦輪增壓器積炭。如果發動機輸出動力正常,就需要查看是否因為液壓泵的流量和發動機的輸出功率不匹配。
液壓挖掘機在作業中速度與負載是成反比的,就是流量和泵的輸出壓力乘積是一個不變量,泵的輸出功率恒定或近似恒定。如果泵控制系統出現了故障,就不能實現發動機、泵及閥在不同工況區域負荷優化匹配狀態,挖掘機從而將不能正常工作。此類故障要先從電器系統入手,再檢查液壓系統,最后檢查機械傳動系統。
2工作速度變慢
挖掘機工作速度變慢主要原因是整機各部磨損造成發動機功率下降與液壓系統內泄。挖掘機的液壓泵為柱塞變量泵,工作一定時間后,泵內部液壓元件(缸體、柱塞、配流盤、九孔板、龜背等)不可避免的產生過度磨損,會造成內漏,各參數據不協調,從而導致流量不足油溫過高,工作速度緩慢。這時就需要整機大修,對磨損超限的零部件進行修復更換。
但若不是工作時間很長的挖掘機突然變慢,就需要檢查以下幾方面。先查電路保險絲是否斷路或短路,再查先導壓力是否正常,再看看伺服控制閥-伺服活塞是否卡死以及分配器合流是否故障等,最后將液壓泵拆卸進行數據測量,確認挖機問題所在。
3挖掘機無力
挖掘無力是挖掘機典型故障之一。對于挖掘無力可分為兩種情況:一種為挖掘無力,發動機不憋車,感覺負荷很輕;第二種為挖掘無力,當動臂或斗桿伸到底時,發動機嚴重憋車,甚至熄火。
①挖掘無力但發動機不憋車。挖掘力的大小由主泵輸出壓力決定,發動機是否憋車取決于油泵吸收轉矩與發動機輸出轉矩間的關系。發動機不憋車說明油泵吸收轉矩較小,發動機負荷輕。如果挖掘機的工作速度沒有明顯異常,則應重點檢查主泵的最大輸出壓力即系統溢流壓力。如果溢流壓力測量值低于規定值,表明該機構液壓回路的過載溢流閥設定值不正確,導致該機構過早溢流,工作無力。則可以通過轉動調整螺絲來調整機器。②挖掘無力,發動機憋車。發動機憋車表明油泵的吸收轉矩大于發動機輸出轉矩,致使發動機超載。這種故障應首先檢查發動機速度傳感系統是否正常,檢查方法與前文所述發動機檢查方法類似。經過以上細致的檢查與排除故障,發動機速度傳感系統恢復正常功能,發動機憋車現象消失,挖掘力就會恢復正常。
4挖掘作業過程中的常見故障
挖掘機在施工作業中經常出現的一些普遍的故障,如:挖機行走跑偏,原因可能為行走分配油封(又稱中心回轉接頭油封)損壞;兩個液壓泵流量大小不一;一邊行走馬達有問題。液壓缸快速下泄則可能為安全溢流閥封閉不嚴,或缸油封嚴重損壞等等。多智網校誠招全國各地市獨家線下商,共同開發網上教育市場。多智教育()!
5挖掘機的日常保養
2數據挖掘實現過程
通常,數據挖掘過程包括4個步驟,即選擇數據、預處理、實施挖掘以及吸收數據。數據挖掘整個過程具有交互性,有時數據需要重新選擇,有時也要對數據預處理進行改進,也可能出現算法反復被調整現象,基于這種特征,數據挖掘時要設置反饋環。挖掘數據第1步是將管理和目標反映到1個(或多個)挖掘任務中,整個過程可主要劃分成為六種:1)評估、預測。評估包括對軟件產品、過程以及資源的屬性進行相應檢查就是整個評估過程,同時也需要根據這些屬性,賦值給未知屬性,當然這些未知屬性需要進行量化。評估工作完成后,要對屬性值進行預測。2)分類。檢查1個特定實體屬性,根據結果將其劃分到另1個類別或范疇(事先定義好)中。3)關聯發現。關聯發現能夠識別出特定內容中互相存在關聯某些屬性。如,可將找出在軟件開發屬性和產品屬性相互關聯的內容找出來。4)聚類。將1個結構不相同的群體劃分到另1個具有相同結構的子群集合中,這個過程叫做聚類,它的劃分依據是成員之間具有高度相似性。5)數據可視化。數據可視化是利用可視化描述方法來定義復雜信息。6)可視數據探察。可視化數據探察是對描述工作的相應拓展,可利用數據可視化交互控制來分析和檢視海量數據[3]。它應用具有可視化功能和數據挖掘技術來對數據進行處理。
3挖掘技術在軟件工程中應用
上文提及到軟件工程度量,部分可利用信息已在海量數據中被提取出來,但普遍認為更為有效且數量眾多的數據依然在軟件工程相關數據庫中隱藏,而沒有被發現。實際上,數據挖掘就是1種被公認為提升軟件工程度量的技術。圖1為數據挖掘在軟件工程中的應用。
3.1數據挖掘繁榮原因1)計算機硬件系統和軟件系統的基礎設施建立具備發現驅動、分析數據等功能;2)每種技術都在實際應用中不斷得到改進,其使用能力不斷提升。如,模式識別、神經網絡等有明顯進步趨勢;3)數據存儲、貯藏、集成成本不高,海量數據可輕松獲得。數據挖掘技術被人們認識,并在實踐中逐漸被重視,同時也給研究和進一步提高數據挖掘技術提供了便利條件。
3.2面臨挑戰軟件工程自身存在很多數據上的特殊性,給數據挖掘領域研究工作帶來制約和影響,主要表現在以下三個方面:1)數據復雜。軟件工程數據主要分為兩個組成部分,即結構化數據、非結構化數據。結構化數據主要包括缺陷報告、版本信息等內容,而非結構化數據則包含數據代碼、相應注釋以及文檔等內容。結構化數據、非結構化數據并不能同時適用一種算法,而且兩種數據間還存在對應聯系。如,1個缺陷報告中往往包括缺陷代碼段。而結構化數據里常常涵蓋部分非結構化信息,非結構化數據中亦是如此,這也是今后工作中需要重點解決的問題之一。2)非傳統分析存在局限。數據挖掘最終想實現的目標就是將轉化而來的信息傳達給用戶,實現信息共享。傳統數據挖掘技術在使用過程中,信息手段比較單一,如文字、圖表等表達形式。其實,軟件開發商對信息的要求很高,1個統計結果根本不能滿足其工作需求。為促進軟件開發不斷向上發展,開發人員需要相關信息作為參考依據,包括開發實際案例、編程所需模板、系統缺陷定位以及軟件結構設計等。研究數據挖掘技術,提升其實際使用功能,需要不斷提交新信息、新知識,并改進相應手方法。3)挖掘結果評價標準不夠具體。軟件工程數據挖掘尚未形成完善的結果表示體系,其評價體系也有待加強。人員在軟件開發過程中需要大量信心,這些信息非常具體且復雜,表示方法不盡相同,互相之間難以做出對比,也很難用定量方法去分析挖掘結果。
二、Web數據挖掘技術的工作流程
Web數據挖掘技術的主要工作流程可以分為以下幾個步驟:第一步,確立目標樣本,這一步是用戶選取目標文本,以此來作為提取用戶的特征信息;第二步,提取特征信息,這一步就是根據第一步得到的目標樣本的詞頻分布,從現有的統計詞典中獲取所要挖掘的目標的特征向量,并計算出其相應的權值;第三步,從網絡上獲取信息,這一步是利用通過搜索引擎站點選擇采集站點,然后通過Robot程序采集靜態的Web頁面,最后再獲取這些被訪問站點的網絡數據庫中的動態信息,然后生成WWW資源庫索引;第四步,進行信息特征匹配,通過提取源信息的特征向量,去和目標樣本的特征向量進行匹配,最后將符合閾值條件的信息返回個用戶。
三、Web數據挖掘技術在高校數字圖書館中的應用
高校數字圖書館為師生主要提供以下功能:查找圖書、期刊論文、會議文獻等數字資源;圖書借閱、歸還等服務;圖書信息、管理制度;導航到圖書光盤、視頻資源等數據庫系統。師生時常登錄到網站中查找其需要的信息,根據師生所學專業、研究方向不同,關注目標也不同。通常這類師生會到常用的圖書館網站上,查找自己所需要的特定領域的資源;瀏覽一下有哪些內容發生變化,是否有新知識增加,而且所有改變常常是用戶所關注的內容;另外,當目標網頁所在的位置有所改變或這個網站的組織結構、層次關系有所變動時,所有這些問題只要稍加改動,容易使用戶難以找到所需內容。本課題采用Web挖掘技術與搜索技術相結合。首先允許用戶對感興趣的內容進行定制,構造數據挖掘的先驗知識,然后通過構造瀏覽器插件,捕獲用戶在瀏覽器上的行為數據,采用Web數據挖掘的方法,深入分析用戶的瀏覽行為數據,獲得用戶的信息資料集,最終為用戶提供不同的個性化服務頁面,并提供用戶對站內信息進行搜索功能,同時可以滿足師生對于圖書館資源進行查找訪問的需求,實現高校圖書館網站資源真正意義上的個性化服務。
1、為開發網絡信息資源提供了工具
數字圖書館需要的是一種可以有效的將信息進行組織管理,同時還能夠對信息進行深層的加工管理,提供多層次的、智能化的信息服務和全方位的知識服務,提供經過加工、分析綜合等處理的高附加值的信息產品和知識產品的工具。目前許多高校數字圖書館的查詢手段還只局限于一些基本的數據操作,對數據只能進行初步的加工,不具有從這些數據中歸納出所隱含的有用信息的功能,也使得這些信息不為人知,從而得不到更好的使用,這些都是對網絡信息資源的一種浪費。而通過Web數據挖掘技術科研有效的解決這一問題。這種技術可以用于挖掘文檔的隱含的有用的內容,或者可以在其他工具搜索的基礎上進一步進行處理,得到更為有用和精確的信息。通過Web數據挖掘技術科研對數字圖書關注中的信息進行更加有效地整合。
2、為以用戶為中心的服務提供幫助
通過瀏覽器訪問數字圖書館后,可被記載下來的數據有兩類,一類是用戶信息,另一類是用戶訪問記錄。其中用戶信息包括了用戶名,用戶訪問IP地址,用戶的職業、年齡、愛好等。用戶名師用戶登錄圖書館時輸入,用戶訪問IP地址通過程序獲得,其他的信息都是用戶在注冊時所填寫的,訪問記錄則是在用戶登錄時所記錄的,也是由程序獲得。對這些用戶信息進行分析可以更加有效的了解用戶的需求通過分析服務器中用戶請求失敗的數據,結合聚集算法,可以發現信息資源的缺漏,從而指導對信息資源采集的改進,讓高校數字圖書館的信息資源體系建設的更加合理。對數字圖書館系統的在線調查、留言簿、薦書條等的數據進行收集整理,并使之轉化為標準的結構化數據庫,然后在通過數據挖掘,皆可以發現用戶所感興趣的模式,同時還可以預先發現用戶群體興趣的變遷,調整館藏方向,提前做好信息資源的采集計劃。通過Web數據挖掘,可以對用戶的信息需求和行為規律進行總結,從而為優化網絡站點的結構提供參考,還可以適當各種資源的配置更加的合理,讓用戶可以用更少的時間找到自己所需要的資源。例如可以通過路徑分析模式采掘捕捉確定用戶頻繁瀏覽訪問的路徑,調整站點結構,并在適當處加上廣告或薦書條。
3、Web數據挖掘技術在圖書館采訪工作中的應用
在圖書館的工作中有一步十分的重要,這就是采訪工作,采訪工作的做的好壞程度會直接的對圖書館的服務質量產生影響。通常情況圖書館的工作人員會根據圖書館的性質、服務對象及其任務來決定采訪的內容。但是這種采訪局限性很大,很多時候會受采訪人員的主觀意識的影響,同時這種方式也會顯得死板不靈活。很多時候會出現應該購進的文獻沒有買,不應該買的文獻卻買了很多等與讀者的需求不符的現象。這些現象的產生都是因為缺乏對讀者需求的了解和分析。要解決這些問題就必須對讀者的需求進行全面的了解和分析,而Web數據挖掘則為解決該問題提供了一種較好的方法。通過對各種日志文件和采訪時獲得的數據進行分析,可以很清楚的得到讀者需要的是什么樣的書籍、不需要的又是什么樣的書籍,從而為采購提供各種科學合理的分析報告和預測報告。根據對分析還能幫組圖書館管理人員確定各種所需書籍的比例,從而確定哪些文獻應該及時的進行補充,哪些文獻應該進行剔除,對館藏機構進行優化,真正的為高校里的師生提供所需要的文獻和資料。
4、使用Web數據挖掘技術提供個性化服務
職業教育曾利用電視教育這種很先進的技術辦學并取得了輝煌的成績,時至今日,現代信息技術不斷發展,不同程度的滲透到每一個領域,教育領域更是首當其沖。昨日先進的辦學技術,已經遠不能適應現代遠程教育的發展需要,現代教學媒體開發是實現遠程教育的重要環節之一。近幾年,隨著國外遠程教育突飛猛進的發展,以及國內高中等院校多媒體課件的開發實踐,我們應對現代教育媒體開發的應用前景,特別是對我院遠程教育發展的重要性有一個充分的認識。
一、專業教學網絡與現代教育技術媒體的開發
現代教育媒體的開發,從技術角度來看是可行的全球計算機網絡和多媒體技術的進步導致了新一代知識智能媒體的發展,產生了網絡大學(虛擬大學),這是遠程教育的重要特點和今后的發展方向。承載教學媒體的信息可簡單的分為實時性和非實時性兩類。多媒體信息則非常適應非實時性的傳輸要求,且價格較低,利用非實時性傳輸中有一定的延時的特點。像文本、圖片、聲音、動畫等形式的多媒體信息,就可以在低速網上通過電話進行傳輸。Internet和Intranet上大多采用這種非實時性信息傳輸方式瀏覽信息,這非常適合具有交互性的多媒體課件。
二、多媒體課件的應用前景以及精品課件的建立
1.2模糊集理論的應用要點該方法通過模糊集合與模糊推理兩種方法,其研究測試的對象是各類不確定性因素,屬于傳統集合理論的創新。模糊集理論在設備狀態監測和故障診斷中的應用,主要包含了兩個方面。一方面,是在相關數據概念的形成時,采用不準確和較為模糊的語言變量,根據人們習慣,對設備狀態的變化及變量變化狀態進行描述。具有較強的直觀性,且相關人員在接受該類概念時,也可以更方便的理解接受;另一方面,該方法通過提煉模糊性規則,在建模時模糊化,使得機械設備的控制、預測以及故障診斷等過程擁有更為廣闊的空間。
1.3基于實例分析的方案優化及調整該種方法擁有較為簡單的思路,在對設備未來運行情況進行預測時,系統會匹配與設備目前情況相似的實際案例,并從以往的解決方法中選出最佳的解決方案,再結合設備實際情況進行相應調整。此類方法的應用范圍較廣,且得到的計算結果也相對準確,但同時也具有一定缺陷,即無法全面整合以往設備數據及解決規律,缺乏充足的繼承性。該方法進行故障診斷的基本理念是,在選紅棗解決方法的過程中,利用歷史診斷方法成功案例為奠基,進行全面的推理工作,并采用類比和聯想法,較為全面的對故障進行診斷。
1.4多種數據挖掘法的聯合應用除上述幾種數據挖掘技術外,實際工作中還涵蓋了以傳統數據統計為基礎的統計分析方法、人工神經網絡元技術、等多種方法,考慮到每一種方法或多或少具有局限性,故為了有效提高各類方法的應用效果,可以將各類方法進行配合使用,代表性的算法組合類型如表1所示。
以遺傳算法和模糊集理論的配合采用為例。由于模糊算法,主要是利用了最大隸屬原理和閥值原理,故可以按照不同故障的發生原因以及故障征兆的相互聯系,在綜合考慮的基礎上對機械設備故障的可能原因進行全面分析。而該方法在運用的過程中,會對各類故障征兆進行約簡化從而得到較為普遍的規律,但是所得到的規律也可能存在不可靠問題。故在實際應用模糊集理論的同時,配合采用遺傳算法,通過對模糊集理論所得到的結論及規則進行全面優化,使得診斷的結果更為準確與高效。上述案例方法在渦輪機故障診斷過程中進行應用時,可先建立完善的渦輪機故障集,在此基礎上采用模糊集理論對渦輪機故障進行診斷,配合遺傳算法對渦輪機故障規律進行優化,使得最終故障診斷結果更為準確。除遺傳算法與模糊集理論課進行配合使用外,其他各類方法也可以根據設備實際情況進行搭配,使得最終診斷結果更為準確有效。
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2012)30-7150-04
隨著數字信息化社會的飛速發展,計算機技術和數據庫管理系統被廣泛應用于科學探索、商業、金融業、電子商務、企業生產等各種行業,已逐漸發展成為一種智能管理過程。數據挖掘作為一種新興的數據分析技術,它的研究成果取得了令人矚目的成就[1]。利用數據庫技術,通過對教務管理的大量數據進行多層次、多維度的加工處理,從而實現人性化管理,為科學決策提供支持。
畢業論文在教學體系中占有十分重要的位置,是本科生培養計劃中衡量教學質量的重要指標。提高畢業論文教學質量是一項系統工程,為研究在當前的教學條件下如何提高畢業論文教學質量,本文采用數據挖掘技術對影響畢業論文成績管理的多方面因素進行了深入分析和挖掘,以期發現對學校畢業論文教學管理有用的知識,將這些知識應用于本科學生畢業論文教學實踐中,為學校管理者提供有用的信息,進而獲得更好的管理效益,為學校未來的發展提供更廣闊的空間,發揮重要的作用。
1 數據挖掘簡介
數據挖掘(Data Mining),又稱數據庫中的知識發現(Knowledge discovery in Database. KDD)[2],是通過分析每一個具體數據,從大量的、有噪聲的、模糊的、隨機的海量數據中尋找其規律的技術,它是數據庫研究中的一個很有應用價值的新領域。
1.1 數據挖掘的定義
H包含如下功能:
綜上所述,數據挖掘具有三大特點:其一是處理大型數據;其二應用數據挖掘的目的是發現未知的、有意義的模式或規律;其三是一個對大量數據處理的過程,有特定的步驟[3]。
1.2 數據挖掘的主要方法
數據挖掘是一個多學科交叉領域,它由人工智能、機器學習的方法起步,并與統計分析方法、模糊數學和可視化技術相融合,以數據庫為研究對象,圍繞面對應用,為決策者提供服務。
數據挖掘的方法主要可分為六大類:統計分析方法、歸納學習方法、仿生物技術、可視化技術、聚類方法和模糊數學方法。歸納學習法是目前重點研究的方向,本文根據給定的訓練樣本數據集,采用歸納學習法中的決策樹技術構造分類模型,將事例分類成不同的類別。
2 決策樹算法基本理論
2.1 決策樹方法介紹
決策樹[4]方法是以事例學習為基礎的歸納推算法,著眼于從一組無序的,無規則的事例中推斷出類似條件下會得到什么值這類規則的方法,它是一種逼近離散值函數的方法,也可以看作一個布爾函數[5]。決策樹歸納方法是目前許多數據挖掘商用系統的基礎,可以應用于分析數據,同樣也可以用來作預測。建模過程中,即樹的生長過程是不斷的把數據進行切分,采用“自頂向下,分而治之”的方法將問題的搜索空間劃分為若干個互不交叉的子集,通常用來形成分類器和預測模型。如圖1所示,為決策樹的示意圖。
決策樹一種類似流程圖的樹形結構,是一種知識的表現形式。為了對未知樣本進行分類,生成具體的分類規則,信息樣本的各個屬性值要在決策樹上進行測試。主要分為兩個階段:在第一階段中生成樹。決策樹最上面的節點為根節點,是整個決策樹的開始,然后遞歸的進行數據分區,每次切分對應一個問題,也對應著一個節點;在第二階段中對樹進行修剪,此過程中去掉一些可能是噪音或異常的數據,防止決策樹的過匹配,進而保證生成決策樹的有效性和合理性。當一個節點中的所有數據都屬于同一類別,或者沒有屬性可以再用于數據進行分割時,分割工作停止。具體的工作流程如圖2所示。
2.2 C4.5算法
1986年Ross Quinlan首次提出了ID3決策樹算法,它是最早的決策樹算法之一。ID3算法運用信息熵理論,選擇當前樣本中具有信息增益值的屬性作為測試屬性,對樣本的劃分則依據測試屬性的取值[6]。C4.5算法是在ID3算法基礎上發展起來的,它繼承了ID3算法的全部優點,并增加了新的功能改進了ID3算法中的不足,可以進行連續值屬性處理并處理未知值的訓練樣本。在應用單機的決策樹算法中,C4.5算法不僅分類準確而且執行速度快。
C4.5通過兩個步驟來建立決策樹:第一階段樹的生成,第二階段樹的剪枝。C4.5算法采用信息增益率來記錄字段不同取值的選擇,首先計算各個屬性的信息增益率,尋找到規則信息的優劣,選出信息增益率最大的屬性作為結點,自頂向下生成決策樹。C4.5算法構造決策樹的基本策略如下:
首先計算出給定樣本所需的期望信息,設S為一個包含s個數據樣本的集合,對于類別屬性,可以取m個不同取值,分別對應于m個不同的類別[Ci(i∈1,2,...,m)]。假設類別[Ci]中的樣本個數為[si],期望信息為:
其中,[Pi]是任意樣本屬于[Ci]的概率,并用[sis]估計。
接著,計算當前樣本集合所需用的信息熵,設一個屬性A具有n個不同的值[(a1,a2,...an)],利用屬性A可以將集合S劃分為n個子集[S1,S2,...Sn],其中[Sj]包含了S集合中屬性A取[aj]值的樣本數據。如果屬性A被選作測試屬性,設[Sij]為[Sj]中屬于[Ci]類別的樣本集,根據A劃分計算的熵為:
然后利用屬性A對當前分支結點進行相應樣本集合劃分計算信息增益:
最后,求信息增益率,表達式為:
C4.5算法的偽代碼如下:
輸入:訓練樣本Samples;目標屬性Target—attribute;候選屬性的集合Attributes
輸出:一棵決策樹
1)創建根節點root;
2)If Samples都在同一類C Then;
3)返回label=類C的單結點樹root;
4)If Attributes為空Then;
5)返回單結點樹root,[label=Samples]中最普遍的Target-Atribute值;
6)Else;
7)For each測試屬性列表Attributes中的屬性;
8)IF測試屬性是連續的Then;
9)對測試屬性進行離散化處理,找出使其信息增益比率最大的分割閾值;
10)Else;
11)計算測試屬性的信息增益比率;
20)添加子樹Generate Tree C4.5;
21)對已建立的決策樹計算每個結點的分類錯誤,進行剪枝,并返回根結點Root。
3 畢業論文成績管理系統的設計和實現
利用數據挖掘技術對學生的成績數據進行提煉,所產生的結果和信息會對以后的教學管理工作提供有用的信息,進而獲得更好的管理效益。解決問題的重點在于怎樣對學生的畢業論文成績進行全面且深度的分析,從而挖掘出成績與其他因素之間隱藏的內在聯系。本文采用決策樹技術挖掘信息時,主要操作步驟如下:
1)確定挖掘來源:清晰地定義挖掘對象,明確挖掘目標是數據挖掘所有工作中重要的一步。本文中應用于挖掘的數據信息是畢業生的畢業論文成績,旨在通過對大量成績數據進行各層次的挖掘,全面了解具體影響學生畢業論文成績的各方面因素,正確的針對問題擬定分析過程。
2)獲取相關知識:數據是挖掘知識最原始的資料,根據確定的數據分析對象,抽象出數據分析中所需要的特征信息模型。領域問題的數據收集完成之后,與目標信息相關的屬性也隨之確定。這些數據有些是可以直接獲得的,有些則需要對學生進行調查才能的得到。
3)數據預處理:此過程中是對已收集的大量數據進行整合與檢查。因為存放在數據庫中的數據一般是不完整的、不一致的,通常還含有噪聲的存在。因此就需要對數據庫中數據進行清理、整理和歸并,以提高挖掘過程的精度和性能。
4)數據轉換:對預處理后的數據建立分析模型,對于特定的任務,需要選擇合適的算法來建立一個準確的適合挖掘算法的分析模型。本文采用決策樹技術進行分類建模來解決相應的問題。
5)分類挖掘知識和信息:此階段的工作目的是根據系統最終要實現的功能和任務來確定挖掘的分類模型。選擇合適的數據挖掘技術及算法,并采用恰當的程序設計語言來實現該算法,對凈化和轉換過得數據訓練集進行挖掘,獲得有價值的分析信息。
6)知識表示:將數據挖掘得到的分析信息進一步的解釋和評價,生成可用的、正確的、可理解的分類規則呈現給管理者,應用于實踐。
7)知識應用:將分析得到的規則應用到教學管理中,教師可以利用所得到的知識針對性的開展畢業設計的教學活動,進一步指導教學工作,提高教學水平和學生的畢業論文質量。
4 結論
最終發現影響學生畢業論文成績主要的因素不是指導教師的職稱,學生的基礎及感興趣程度,而是指導教師的學歷高低。根據具體分類規則的結論,學校教學管理工作應加重對教師的素質及能力培養,合理的分配每個教師的畢業論文指導工作,不僅能夠有效的完成畢業課題指導工作,更有助于學生整體論文質量的提高。
在高校教學數字化的時代趨勢下,利用數據挖掘技術來挖掘提取教學工作中的全面而有價值信息,可以為教育管理者的教學工作提供有效的參考信息,改進教學管理方法,提高教學質量和學生的綜合素質,是高校保持良好的可持續發展的有力工具。
參考文獻:
[1] 劉玉文.數據挖掘在高校招生中的研究與應用[D].上海:上海師范大學,2008.
[2] 魏萍萍,王翠茹,王保義,張振興.數據挖掘技術及其在高校教學系統中的應用[J].計算機工程,2003.29(11):87-89.
[3] 劉林東. Web挖掘在考試系統中的應用[J].計算機應用研究,2005(2):150-154.
二、在部隊食品采購系統中的應用以及其價值評價
在部隊食品采購系統實際應用工程中,其實可以運用MicrosoftSQLServerAnalysisServices來對數據進行分析,并且在數據挖掘過程中對多維數據進行描述與查找起到一定作用。因為多維數據比較復雜,增長的也比較快,因此,進行手動查找是很困難的,數據挖掘技術提供的計算模式可以很好的對數據進行分析與查找。在建設部隊食品采購倉庫數據的時候,數據內容主要包括了人員的健康、兵員的飲食以及訓練等,進行數據挖掘主要包括以下內容:第一,把每個主題信息數據進行收集、匯總、分析等,對人員情況、健康、飲食、訓練等進行合理分析;第二,多維分析數據信息。根據部隊的實際情況,利用數據挖掘技術對部隊人員健康、飲食、訓練等數據信息進行多維分析,其中包含上鉆、切片、下鉆等;第三,挖掘健康與飲食之間的內在關系。根據數據庫中許多面向主題的歷史數據,采用數據挖掘技術進行分析與演算得到部隊人員的訓練和健康情況與部隊飲食之間內在關系,以便于為部隊食品采購提供合理的、有效的保障,從而提高部隊整體人員的健康水平、身體素質以及訓練質量,對提高我國部隊戰斗力有著深遠的意義。
2交互式關聯規則挖掘算法
關聯規則挖掘算法在數據庫的記錄或對象中抽取關聯性,展示了數據間位置依賴關系,其目的是尋找在大量的數據項中隱藏著的聯系或相關性。其優越性在于能將用戶的定制信息整合到挖掘過程中,以一種友好的方式引入約束,使挖掘出更加符合用戶需要的信息,并且提高了挖掘的效率和有效性。
2.1目標數據庫的確定
數據挖掘應熟悉對象的背景知識,明確挖掘的目標,根據目標確定相關數據,以此作為目標數據庫,來完成對數據的預處理、挖掘和規則評價。
2.2交互式關聯規則挖掘算法
表示A成立則B成立,其中給出了可信度C和支持度S。可信度C是對關聯規則準確度的衡量,即在出現A的情況下出現B的概率;支持度S是對關聯規則重要性的衡量,即A和B同時出現的概率。
3熔煉機組數據挖掘的實現
本文采用的是冀某工廠于2013年5月運行的數據,采樣頻率為2~3秒/次,采樣模式為實時監測值,得到7595組數據。在分析階段,對影響機組的主要可控參數進行了提取及預處理,參數主要包括:轉速、有功功率、主蒸汽壓力、調節級壓力、中壓缸排汽壓力。以機組轉速設計值為3600r/min為例來分析。對各個可控參數數據進行曲線化處理,作為分析它們之間的關聯規則的數據表。上述關聯規則表示,在三種負荷工況下,工廠熔煉機組有功功率與主蒸汽壓力、調節級壓力、中壓缸排汽壓力三者之間最優變化區間的關聯。經分析,在機組中應用關聯規則的數據挖掘技術與傳統方法相比,優點是其可以對不同的可測參數進行挖掘,方法簡單有效、可操作性強;運用關聯規則進行挖掘,對過程能夠較靈活控制,處理后的目標值直觀,便于操作指導和提高運行效率。