激情综合啪啪6月丁香,久久久久国产精品91福利,99精品日韩欧美在线观看,91成人午夜福利在线观看国产

東碩濾清器廠

黎明液壓油濾芯,賀德克液壓油濾芯,頗爾濾芯廠家,除塵濾芯廠家,唐納森濾芯廠家

環(huán)保在線收藏該商鋪

11
 QQ交談      小標 您所在位置:首頁 > 技術(shù)文章 > 過濾方式的分析計論
產(chǎn)品搜索

請輸入產(chǎn)品關(guān)鍵字:

聯(lián)系方式
地址:河北固安林城工業(yè)園區(qū)
郵編:065501
聯(lián)系人:白金東
留言:在線留言
商鋪:http://www.hg1112.cn/st144958/
技術(shù)文章

過濾方式的分析計論

點擊次數(shù):879 發(fā)布時間:2015-9-10


  隨著Internet的發(fā)展和電子商務(wù)的應(yīng)用,網(wǎng)上已出現(xiàn)信息過載的現(xiàn)象,于是產(chǎn)生了協(xié)同過濾技術(shù)的個性化推薦系統(tǒng)。傳統(tǒng)推薦系統(tǒng)的基本思想是基于評分相似的zui近用戶鄰居的評分數(shù)據(jù)向目標用戶產(chǎn)生推薦。盡管傳統(tǒng)的推薦系統(tǒng)是當(dāng)前使用zui成功的技術(shù),但它也有許多不足之處?;陧椖繀f(xié)同過濾算法的提出雖然避免了傳統(tǒng)的協(xié)同過濾算法計算用戶之間相似性的瓶頸,但依然存在一些缺陷。關(guān)鍵性問題是:每個用戶一般都只對很少的項目感興趣,整個用戶評分數(shù)據(jù)非常稀疏,這就導(dǎo)致用戶之間的相似性不準確,產(chǎn)生的zui鄰近的鄰居用戶不可靠;難以推薦或預(yù)測一個新項目。該文提出了一種基于語義相似性的項目協(xié)同過濾算法,該方法將基于用戶平分計算項目的相似性與語義相似性組合,能很好地解決上述問題。
  1基于項目的協(xié)同過濾算法基于項目的協(xié)同過濾推薦根據(jù)用戶對相似項目的評分預(yù)測該用戶對目標項目的評分,基于該假設(shè):如果大部分用戶對一些項目的評分比較相似,則當(dāng)前用戶對這些項目的評分也比較相似?;陧椖康膮f(xié)同過濾推薦系統(tǒng)使用統(tǒng)計技術(shù)找到目標項目的若干zui近鄰居,由于當(dāng)前用戶對zui近鄰居的評分與對目標項目的評分比較類似,可以根據(jù)當(dāng)前用戶對zui近鄰居的評分預(yù)測當(dāng)前用戶對目標項目的評分,產(chǎn)生對應(yīng)的推薦列表。
  1)項目相似性計算在基于項目協(xié)同過濾算法中,關(guān)鍵是計算項目之間的相似性,然后選擇zui相似的項目。現(xiàn)在有許多不同的計算項目之間的相似性的方法,例如:余弦相似性、相關(guān)相似性、修正的余弦相似性,下面介紹修正的余弦相似性的方法。
  修正的余弦相似性:設(shè)S(i,j)表示資源i與資源j之間的相似性,項目i和項目j共同評過分的用戶集合用U表示,則項目i和項目j之間的相似性S(i,j)為S(i,j)=∑C∈U(RC,i-RC)(RC,j-RC)∑C∈U(RC,i-RC)2∑C∈U(RC,j-RC)2(1)RC,i表示用戶C對項目i的評分,RC表示用戶C對項目的平均評分。
  2)預(yù)測計算在計算項目之間的相似性之后,要選擇k個與目標項目zui相似的項目,并產(chǎn)生目標項目的預(yù)測值。采用相似資源評價的權(quán)重組合方法,生成用戶對目標資源的預(yù)測評價值。其計算式為Pa,i=∑kj=1(Pa,j×S(i,j))/∑kj=1S(i,j)(2)Pa,j表示用戶a對目標項目j的預(yù)測值,這里僅有k個預(yù)測值產(chǎn)生。
  3)基于項目的協(xié)同過濾算法不足基于項目的協(xié)同過濾算法通過計算項目之間的相似性,選擇與目標項目的zui近鄰居集合,避免了計算用戶之間相似性的瓶頸,該算法比基于用戶協(xié)同過濾算法的擴展性強,度高。但還是存在數(shù)據(jù)稀疏性和新項目預(yù)測的問題。為了解決這2個問題,將采用基于語義相似性過濾算法。在算法中,從網(wǎng)頁中自動地抽取結(jié)構(gòu)化的項目語義知識,并結(jié)合項目評分組合一種新的項目相似性方法。
  2基于本體的語義相似性的協(xié)同過濾算法在協(xié)同過濾處理過程中,為了獲取項目的語義信息,必須從多個網(wǎng)頁或中抽取具有概念層次的結(jié)構(gòu)化對象作為語義實體。但現(xiàn)在的網(wǎng)絡(luò),其信息存儲為靜態(tài)HTML頁面,用于表達Web頁面信息的HTML標記語言存在著缺點:HTML語言的標記(tag)只是告訴瀏覽器如何顯示它所定義的信息,卻不包含語義信息。針對這個問題引入了本體技術(shù)。
  1)本體與本體的學(xué)習(xí)一個本體提供了定義好的重要概念以及概念之間的語義關(guān)系的結(jié)構(gòu),目標是捕獲相關(guān)領(lǐng)域的知識,提供對該領(lǐng)域知識的共同理解,確定該領(lǐng)域內(nèi)共同認可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術(shù)語)和詞匯之間相互關(guān)系的明確定義。在特定的領(lǐng)域里,這樣一個結(jié)構(gòu)建立了很好的層次知識,對于一個,領(lǐng)域本體一般包括概念、概念之間的關(guān)系以及存在于表示的領(lǐng)域概念之間的關(guān)系。為了從網(wǎng)頁或中抽取項目的語義信息,首要任務(wù)是建立一個特定領(lǐng)域本體。對于簡單的,領(lǐng)域本體可能很容易手工建立或從內(nèi)容半自動化獲取。然而,對于大型,建造本體(特別是通用目的本體)是費時費力的過程,手工建立本體是一項艱巨的任務(wù),希望能自動化地獲取領(lǐng)域本體。提出了TextToOnto系統(tǒng)和OntoLearn系統(tǒng)。綜合起來,提出了一個本體學(xué)習(xí)的框架。
  2)基于本體的抽取項目語義信息建立了領(lǐng)域本體后,利用領(lǐng)域本體抽取項目的語義信息。在此方法中,使用特定領(lǐng)域包裝器代理結(jié)合領(lǐng)域本體抽取項目的語義信息。特定領(lǐng)域包裝器使用文本挖掘和啟發(fā)式規(guī)則從基于領(lǐng)域本體的抽取項目的語義信息。目前,不使用本體表示語言,如OWL,把本體中的類和類之間的關(guān)系看作一種關(guān)系數(shù)據(jù)庫。特定領(lǐng)域包裝器代理使用類的關(guān)系語法和基于文本線索的啟發(fā)式規(guī)則抽取類的實例和屬性,建立一個特定領(lǐng)域的語義分類樹。以一個銷售書籍為例,從書籍抽取出來的參考本體。從書籍抽取出來的實體都是這些類的實例,這些實例包含了語義信息。
  3)語義相似性與協(xié)同過濾集成為了方便計算項目語義相似性,將抽取出來的實例屬性轉(zhuǎn)換為向量表示,使用向量空間模型表示項目的屬性,項目可以表示為Ti={(t1,W1),(t2,W2),…,(ti,Wi)},其中ti是項目Ti的一個屬性,Wi表示屬性ti對應(yīng)于項目賦予的權(quán)重,描述屬性在項目中的重要程度。項目之間的相似性使用向量之間的距離度量,計算公式為S(i,j)=(∑Mk=1Wik×Wjk)/(∑Mk=1W2ik)(∑Mk=1W2jk)(3)采用TF2IDF公式計算屬性的權(quán)重值。其中ti是項目Tj的一個屬性。
  W(ti,Tj)=tf(ti,Tj)×log(N/n1 0。01)/∑ti∈Tj[tf(ti,Tj)×log(N/n1 0。01)]2(4)其中W(ti,Tj)表示ti在項目Ti的權(quán)重,項目tf(ti,Tj)是ti在項目Tj中出現(xiàn)的頻率,N是項目總個數(shù),n1為在項目集中出現(xiàn)ti的數(shù)目。zui終,對于一對項目,可以把語義相似性與協(xié)同過濾集成,組合成一個線性方式來度量項目的相似性。
  SInte(i,j)=αSSem(Ti,Tj) (1-α)SRat(i,j)(5)其中α(0≤α≤1)是權(quán)重參數(shù),當(dāng)α=0時,組合的相似度SInte(i,j)=SRat(i,j);α=1時,組合的相似度SInte(i,j)=SSem(i,j)。從公式(5)看出,組合相似性算法具有2個優(yōu)點:組合相似性算法能進一步說明用戶對特定的項目是否感興趣;在評分數(shù)據(jù)稀疏或沒有評分的情況下,依然可以使用語義相似性提供合理的推薦產(chǎn)品。利用該文組合相似性算法的思想,可以得到相應(yīng)的預(yù)測評分或推薦,Pa,i是用戶對目標項目的預(yù)測評分值。
  Pa,i為Pa,i=∑kj=1(Pa,j×SInte(i,j))/∑kj=1SInte(i,j)(6)3結(jié)果分析1)數(shù)據(jù)集采用一個銷售書籍的數(shù)據(jù)來測試算法,比較基于語義相似性和標準的項目協(xié)同過濾算法。該已有1600個用戶對3000本書籍評分數(shù)據(jù),每個用戶對每本書的評分范圍為1―5,隨機抽取4000條數(shù)據(jù)作為實驗數(shù)據(jù)。為了實現(xiàn)基于語義相似性算法,使用本體學(xué)習(xí)框架方法從書籍抽取出書籍本體,利用包裝器代理從基于書籍本體的網(wǎng)絡(luò)書籍?dāng)?shù)據(jù)庫中抽取書籍實例,每個實例包含語義屬性。
  2)評價標準評價推薦系統(tǒng)推薦質(zhì)量的度量標準主要包括統(tǒng)計精度度量方法和決策支持精度度量方法2類。采用統(tǒng)計精度度量方法中的平均偏差MAE(meanabsoluteerror)進行度量。平均偏差MAE通過計算預(yù)測的用戶評分與實際的用戶評分之間的偏差來度量預(yù)測的準確性,MEA越小,推薦質(zhì)量越高。
  假設(shè)預(yù)測的用戶評分集合表示為{p1,p2,…,pn},對應(yīng)的實際用戶評分集{t1,t2,…,tn},則平均偏差MAE定義為MAE=∑ni=1|ti-pi|/N(7)3)實驗結(jié)果分析考慮組合相似性算法中的α權(quán)重參數(shù)對MAE的影響,在使用組合相似性算法預(yù)測時,找出*α值的范圍。實驗的結(jié)果,由此得出結(jié)論,α的取值范圍在0。3―0。
  5是*的。為了說明組合相似性算法能解決標準項目協(xié)同算法的2個缺點:數(shù)據(jù)的稀疏性問題;新項目預(yù)測問題(冷開始問題)。做了2個實驗比較這2種方法,2個實驗的α取值為0。
  4.顯示了在預(yù)測項目都已評分的情況下2種算法的平均偏差結(jié)果,可以看出,組合相似性算法使用公式(4)計算項目的相似性比標準項目協(xié)同算法使用公式(1)計算項目相似性更。
  解釋了組合相似性算法可以解決新項目問題。在預(yù)測項目沒有評分的情況下,基于項目協(xié)同過濾算法使用式(1)和式(2)無法預(yù)測,但組合相似性算法利用式(4)和式(5)依然可以進行預(yù)測。
  從上述分析,通過語義相似性與標準項目協(xié)同算法集成,挖掘出項目之間的語義關(guān)系,抽取出項目的語義信息,不僅能很好的解決標準項目協(xié)同算法的項目評分的稀疏性問題、新項目預(yù)測問題以及提高推薦精度,還能進一步解釋說明用戶對特定的項目是否感興趣。
  4結(jié)語通過集成項目的結(jié)構(gòu)化語義信息計算項目的相似性,擴展了基于項目協(xié)同的過濾算法。通過本體學(xué)習(xí)建立了特定領(lǐng)域本體,并使用特定領(lǐng)域本體從中抽取項目的特性和聚集類的實例。相似性測量的方法是把基于領(lǐng)域的語義相似性與基于用戶與項目映射的項目相似性組合。實驗結(jié)果顯示了組合相似性算法的3個優(yōu)點:1)保持了基于項目協(xié)同算法的計算優(yōu)勢,組合相似性算法改善了預(yù)測精度。2)對于新項目或未評分的項目,能產(chǎn)生合理地的推薦,可以減輕標準項目協(xié)同過濾算法帶來的新項目問題。3)在數(shù)據(jù)非常稀疏的情況下,提供了較高的預(yù)測質(zhì)量。
  下一步工作任務(wù)是:1)將使用領(lǐng)域特征和機器學(xué)習(xí)技術(shù),實現(xiàn)自動地確定語義組合參數(shù)值。2)深入研究對語義相似性自動抽取以及度量。3)進一步考慮領(lǐng)域本體結(jié)構(gòu)使用其他語義相似性組合方法產(chǎn)生推薦

[ 打印 ] [ 返回頂部 ] [ 關(guān)閉

| 商鋪首頁 | 公司檔案 | 產(chǎn)品展示 |公司動態(tài) | 詢價留言 | 聯(lián)系我們 | 會員管理 |
環(huán)保在線 設(shè)計制作,未經(jīng)允許翻錄必究.Copyright(C) http://www.hg1112.cn, All rights reserved.
以上信息由企業(yè)自行提供,信息內(nèi)容的真實性、準確性和合法性由相關(guān)企業(yè)負責(zé),環(huán)保在線對此不承擔(dān)任何保證責(zé)任。
溫馨提示:為規(guī)避購買風(fēng)險,建議您在購買產(chǎn)品前務(wù)必確認供應(yīng)商資質(zhì)及產(chǎn)品質(zhì)量。
二維碼

掃一掃訪問手機站
日本 日韩 欧美| 精品久久久久久不卡亚洲| 五月天国产成人免费视频| 日本十八禁大骚逼| 熟妇人妻无乱码中文字幕| 啊啊啊好爽高潮啦| 找个日韩操逼的看看| 高颜值美女视频在线观看| 男生用鸡巴操女生的视频| 99热这里只有精品亚洲| 久久亚洲精品无码AV宋| 中文字幕在线观视频| 插我舔内射18免费视频| 神马我不卡手机在线观看| 欧美亚洲综合一区二区三区| 淫荡淫水逼操烂视频| 国产精品一区二区在线观看91| 国产精品亚洲一区二区三区下载| 男生狂操女生污视频| 国产精品无码av在线一区| 国产精品熟女视频播放| 99国产精品一区二区| 美国毛片亚洲社区成人看| 顶的速度越来越快越| 好想大鸡巴插进阴道视频| 亚洲av午夜一区二区| 猛哥操女人B视频| 国产精品久久久69粉嫩| 色男人天堂亚洲男人天堂| 免费骚逼潮吹av| 精品人妻少妇一区二区三区不卡| 国产亚洲一区白丝在线观看| 让女人下面出水视频| 亚洲欧美中文字幕第二十| 黄色亚洲一级大片| 白丝袜子宫啊啊啊不要了| 激情亚洲人妻精品| 午夜场射精嗯嗯啊啊视频| 青青河边草直播免费观看| 日韩 欧美 成人 免费| 欧美日韩欧美国产中文字幕|