知識(shí)普及 ? 目前個(gè)性化搜索的不足點(diǎn) | ||||
目前個(gè)性化搜索的不足點(diǎn) |
||||
|
||||
總體而言,應(yīng)用于搜索引擎中的Web個(gè)性化信息推薦服務(wù)可以借鑒傳統(tǒng)電子商務(wù)領(lǐng)域中的Web個(gè)性化信息推薦服務(wù)。但是,具有和現(xiàn)代電子商務(wù)領(lǐng)域中個(gè)性化推薦系統(tǒng)相似功能的搜索引擎卻很少受到人們的注意。也就是說(shuō),現(xiàn)代搜索引擎尚不能廣泛地提供個(gè)性化搜索結(jié)果,對(duì)不同用戶的一個(gè)相同查詢的搜索結(jié)果總是相同的,它與提交查詢的用戶無(wú)關(guān)。因此,由于在檢索階段忽略了用戶的個(gè)性化需求特征,所以對(duì)特定用戶而言,搜索引擎經(jīng)常返回大量的無(wú)用信息。造成這種現(xiàn)象的主要原因在于現(xiàn)代搜索引擎面臨一些和傳統(tǒng)個(gè)性化信息推薦系統(tǒng)相似的問(wèn)題,具體如下。 首先,用戶需求難以有效表達(dá)。這主要有兩個(gè)原因:一方面,由于一般非專業(yè)用戶都缺乏需求表達(dá)的訓(xùn)練,所以不能有效理解和表達(dá)自己的信息需求,產(chǎn)生的后果就是用戶的主觀理解往往就并不明確。形象地說(shuō),這種現(xiàn)象就是“用戶無(wú)法描述他要找什么,除非讓他看到想找的東西”。另一方面,這也來(lái)自于系統(tǒng)無(wú)法正確地獲取相關(guān)用戶個(gè)性化信息,這主要是由于網(wǎng)絡(luò)信息檢索系統(tǒng)中通常不具有主動(dòng)獲取用戶個(gè)性化特征的功能,同時(shí)也沒(méi)有要求用戶必須提交個(gè)性化信息才能使用的限制。上述兩個(gè)方面的最終效果都會(huì)產(chǎn)生系統(tǒng)無(wú)法有效獲取用戶個(gè)性化特征信息的現(xiàn)象。 其次,檢索結(jié)果準(zhǔn)確化和檢索快速化之間存在矛盾。在處理搜索引擎的海量數(shù)據(jù)時(shí),很多傳統(tǒng)的個(gè)性化推薦技術(shù)通常會(huì)產(chǎn)生嚴(yán)重的性能問(wèn)題,這些主要適用于傳統(tǒng)小型商務(wù)網(wǎng)站中的個(gè)性化算法和技術(shù)往往缺乏良好的縮放性。當(dāng)然,人們也提出了一些解決方法,如維數(shù)約減、聚類分析和貝葉斯網(wǎng)絡(luò)等,雖然在一定程度上能夠解決縮放性問(wèn)題,然而這些技術(shù)往往是通過(guò)在離線階段抽取出原始數(shù)據(jù)中的模式信息,并于在線階段使用這些模式來(lái)得到推薦集合,所以這些方法雖然可以減少在線的處理開(kāi)銷,但是常常產(chǎn)生推薦結(jié)果不準(zhǔn)確的情況,同時(shí)在線計(jì)算的復(fù)雜度也會(huì)隨著模式的增多而增加。 最后,現(xiàn)代搜索引擎的檢索智能化水平仍然較低。由于搜索引擎無(wú)法真正理解網(wǎng)頁(yè)內(nèi)容的語(yǔ)義,所以單純地利用詞語(yǔ)匹配和統(tǒng)計(jì)分析方法,在一定程度上會(huì)造成不可避免的理解錯(cuò)誤。應(yīng)該說(shuō),即使是能夠使用某些智能語(yǔ)義分析功能,也由于處理時(shí)間和空間的耗費(fèi)驚人,所以在商用搜索引擎系統(tǒng)中尚不能廣泛普及。 |
||||
目前個(gè)性化搜索的不足點(diǎn)相關(guān)標(biāo)簽:制作網(wǎng)站,企業(yè)做網(wǎng)站,設(shè)計(jì)網(wǎng)站,企業(yè)網(wǎng)站制作
|