0
首頁 精品范文 個性化推薦系統

個性化推薦系統

時間:2022-08-25 12:22:49

開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇個性化推薦系統,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。

個性化推薦系統

第1篇

關鍵詞:云計算;技術;個性化;系統

中圖分類號: TP3 文獻標識碼: A 文章編號: 1673-1069(2016)32-166-2

0 引言

如今,互聯網技術的深入發展,開始與各個領域實現有機融合,更多的人開始參與到在線購物、社交網絡等網絡活動中,網絡給人們提供了一個無限的信息資源空間,這個資源庫中包含了各式各樣的信息,隨之發展起來的信息檢索技術便捷了人們對信息的搜索需求,搜索引擎成為用戶獲取信息的主要渠道,但該技術無法為用戶提供個性化的興趣服務,這就需要建立基于云計算的個性化推薦系統,這也是本文所要分析的主要內容。

1 云計算技術與個性化推薦系統概述

1.1 云計算技術

云計算技術依托的是互聯網,將互聯網的相關服務以動態化、易擴展、虛擬化的資源提供給用戶。云計算的定義有很多種,目前較為認可的是云計算技術是根據用戶使用量來進行相應交易的計算模式,云計算能夠為用戶提供便捷、按需的網絡訪問,進入網絡、服務器、應用軟件等可配置的計算資源共享區域,這些可以快速提供的資源,無須進行過多的管理,并與服務供應商交互不多[1]。云計算平臺所擁有的超強計算能力,可以應用在模擬核爆炸、預測市場發展趨勢及氣候變化等活動中。

1.2 個性化推薦系統

推薦系統就是結合用戶或顧客的購買行為規律以及興趣特點來推薦相應的信息或商品,使用戶滿意。現如今,電子商務發展態勢迅猛,商品的種類和數量與日俱增,網絡信息是冗雜的,用戶或顧客需要花費大量的時間找尋目標信息與商品,信息過載問題直接影響了用戶或顧客的滿意度,導致用戶的流失。個性化推薦系統在此形勢下應運而生,所謂個性化推薦系統是利用海量數據挖掘技術,通過云計算平臺構建的一種高級商務智能平臺,主要服務于網站,為用戶提供完全個性化的決策支持和信息服務[2]。

2 基于云計算技術的個性化推薦系統分析

2.1 推薦算法與推薦策略

2.1.1 推薦算法

推薦系統利用各個網頁間、網頁與關鍵詞之間的粗粒度關聯和排序,實現為用戶推薦相應信息與商品的服務。隨著系統的不斷發展,其也開始利用網絡化計算能力,注重用戶興趣與模型的分析,而個性化推薦系統是在推薦系統的基礎上建立的更高級的信息導向系統。個性化推薦系統的構建需要推薦算法的支持,常用的有協同過濾推薦算法、基于內容的推薦算法、關聯規則推薦算法、混合推薦算法等。其中協同過濾推薦算法還可以細分,根據不同的算法特征分為基于用戶的推薦算法(也叫作基于存儲的算法、基于鄰居的算法)、基于項目的推薦算法、基于模型的推薦算法等。這些推薦算法都具有自身的優缺點(詳見表1),為了彌補各類推薦算法的缺陷,可以將兩種互補的算法結合起來[3]。例如基于內容的算法和協同過濾算法這兩種算法,我們可以為用戶直接展示用不同算法得出的推薦結果集,也可以先用第一種算法得出一種結果集,再用第二種算法計算第一種結果集,進而得到更加精確的結果,更好地滿足用戶的需求。

2.1.2 推薦策略

以往許多的推薦系統都是結合單一的推薦算法和推薦策略建立的,在使用的過程中逐步暴露除了系統個性化與適應性方面的缺陷,無法結合實際的應用優化推薦策略。因此,在構建個性化推薦系統時要充分結合當下推薦系統的優勢以及瞬息萬變的市場需求,制定出綜合化、系統化、合理化、可行性較高的推薦策略。

前文分析了各類推薦算法的優缺點及應用場景,基于此,本文提出的個性化推薦系統中應用的推薦策略是根據推薦系統數據量的大小制定的,當數據量偏小時系統會采用傳統的個性化推薦算法;當數據量偏大時系統會利用云計算平臺進行計算,具體就是將數據集發送到云平臺的各個節點來實現多節點分布式大規模數據計算。

2.2 系統架構及流程設計

2.2.1 系統架構

云計算技術集成了分布式計算、網格計算、并行計算和網絡存儲等先進的技術,其有機整合了多個經濟性較好的計算實體,逐步形成了具有超強計算能力的分布式系統。為了充分發揮出云計算技術的優勢,本文設計的基于Google云計算平臺的個性化推薦系統架構如圖1所示,該系統能夠對大規模數據進行快速、準確地處理,并且可以根據業務規模的不斷擴大進行相應的拓展,充分展示了較高的通用性與擴展性[4]。

基于云計算技術的個性化推薦系統主要包括以下幾部分:①推薦計算子系統,該子系統由數據預處理模塊、數據挖掘模塊、推薦模塊組成,其中數據預處理模塊的功能包括異構數據的過濾、統計、轉換等;數據挖掘模塊主要是計算推薦結果的聚類,需要充分利用聚類、關聯規則算法進行分別計算;推薦模塊則是利用各類算法計算出精準的推薦結果,已達到用戶的需求。②業務應用子系統,該子系統主要是為后期的系統擴展服務,根據業務需求的變化轉變系統的功能,并為系統需求制定合理的推薦規則。③基礎云計算平臺,其充分利用集群提供的大容量計算能力,在不同節點上進行大量的計算。

2.2.2 個性化推薦系統的操作流程

本系統的推薦流程是依據Map Reduce軟件架構,其是處理海量數據的并行編程模式,主要適合應用于大規模數據集的并行運算,其封裝了并行處理、容錯處理、本地化計算、負載均衡等細節,還提供可以把大容量的計算自動并發和分布執行的簡單通用接口。具體如圖2所示[5]。

3 結束語

綜上所述,開發設計基于云計算技術的個性化推薦系統是適應時展需求的,其能夠更好地滿足和引導用戶信息需求。本文設計的系統還不完善,還需在以后的運行實踐過程中不斷的改進。

參 考 文 獻

[1] 肖理釧.基于云計算模式的圖書文獻個性化推薦技術研究[J].科技廣場,2015(08):22-27.

[2] 毅,劉亞軍,陳誠.基于云計算技術的個性化推薦系統[J].計算機工程與應用,2015(13):111-117.

[3] 谷瑞.基于云計算的個性化推薦系統的研究[J].蘇州市職業大學學報,2013(04):14-16+21.

第2篇

關鍵詞:個性化;采集;推薦

中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2013)36-8222-03

基于社會計算的個性化推薦系統的設計,主要以新浪博客網頁作為數據源來采集設計的,繼而為其網頁文檔信息創建索引。主要模塊包括網頁文本信息采集,lucene索引庫,搜索推薦主干,系統管理等。

為了實現網頁文檔信息的自動采集功能,本系統將采集模塊設置了后臺管理參數,來實現信息的自動“爬蟲”功能,而為了使推薦模塊能夠基于用戶的信息關鍵詞來搜索并提高效率,就必須實現用戶信息的即時搜索和反饋推薦功能。其詳細設計如下:

1 系統流程分析

1)系統業務處理流程:首先,管理員利用爬蟲進行數據的采集,并將采集到的數據(博客網頁文檔)存儲進入本地數據庫。采集完成即可對數據庫中的文檔建立索引。用戶登錄系統前臺輸入關鍵詞進行搜索之后,服務器下達命令于搜索引擎,進行搜索并且對與關鍵字相關的數據進行協同過濾,最后推薦出用戶感興趣的信息,其處理流程如圖1示,系統業務流程分析圖。

2)系統數據處理流程:管理員登入系統后臺爬蟲參數設置界面,設置好采集數據參數,進而在數據采集頁面進行抓取網頁文檔,在數據采集完成之對采集到的數據建立索引,其中包括博文的題目、作者、采集時間等。用戶登錄系統前臺主頁,輸入搜索的數據,即關鍵詞進行搜索,程序服務器往后臺數據庫發送命令,數據庫返回協同過濾后的搜索結果給程序服務器,再完成所搜索到的博文以及其作者的反饋推薦。其處理流程如圖2示,系統數據流程分析圖。

2 系統概要設計

1)系統概念結構設計:概念結構設計就是根據需求分析的結果,以規定的方法將其轉化為一個概念數據模型。而概念數據模型,是根據系統的需求點來對數據和信息進行建模,采用E-R關系圖來描述。其系統總體E-R圖,如圖3示。

2)系統數據庫設計:本系統選用Mysql數據庫。從個性化推薦系統的功能需求點出發,在系統中設計了采集信息配置表(如圖4示)、信息推薦表等數據庫表(如圖5示),可以準確有效地存儲采集到的數據。

3)安全性設計:為了系統安全,采用身份和密碼雙重登陸驗證機制,來確保系統后臺管理只有管理員能夠才能夠登陸,進行爬蟲參數設置、數據采集、索引建立以及采集信息查看等操作,保證了系統數據的安全性。

此外,還加設了數據庫的安全工具策略,如對數據庫中表字段或內容的編輯功能等操作,需要特定的數據庫管理工具配合才能進行,從而進一步提高數據的安全性。

3 系統詳細設計

1)系統功能結構設計:根據系統概要設計,將本系統分為前臺交互和后臺數據處理,由四個模塊共同組成:爬蟲采集網頁文檔和信息、lucene索引的創建,以及操控數據庫、搜索主干、前臺輸入輸出處理。各個模塊分工協作運行。其系統功能結構如圖6示。

本系統管理和界面設計,包含了前臺和后臺相聯構建的內容,采用了Eclipse Tomcat服務器和JSP技術。以lucene創建索引,數據庫應用了mysql,并使用JDBC來實現編程的友好交互,從而設計出友好的用戶界面。此外,在整個系統的設計上,采用了 B/S 三層體系結構(如圖7示)。管理員使用網頁瀏覽工具向應用服務器發送服務請求,應用服務器接收請求,并且執行業務邏輯,將操作人員想要的信息返回瀏覽工具顯示,確保整個系統使用過程的開放性與安全性。

本系統中抓取網頁文檔是系統的信息數據基礎,也是數據的來源,只有有了豐富的數據源,才能夠提供有效的服務。因此,本系統測試過程,主要以新浪博客網頁作為數據源,來抓取其頁面的文本, heritrix爬蟲具有良好的擴充功能,可以通過編程進行過濾來抓取另外的文本。通過采集網頁的信息,來對網頁中有價值的數據實行提取,過濾掉那些無作用的數據,只留下有效性的文本信息,來提高存儲的利用效率,其數據采集結果主要包括該博客網頁文檔以及該博客的地址,博客的題目、內容、作者以及采集的時間等,如圖8數據采集過程圖和圖9數據采集查看圖所示。而搜索推薦主干同樣是利用lucene實現,搜索的關鍵字在已經創建的索引庫中搜查對應的文本。

4 系統實現

基于社會計算的個性化推薦系統使用軟件MyEclipse 8.5集成開發實現,采用JAVA語言來進行開發,頁面采用jsp語言來設計實現,而數據庫則是利用Mysql來實現,從而實現了根據用戶的需求和興趣為用戶推薦出有價值的結果集,使用戶能夠在更短的時間獲取到自己想要的信息,其結果轉換如圖10 系統推薦實現圖所示。

參考文獻:

[1] 陳諾言.基于個性化推薦引擎組合的推薦系統的設計與實現[D].廣州:華南理工大學,2012.

[2] 梁弼,王光瓊,鄧小青.基于 Lucene 的全文檢索系統模型的研究及應用[J]. 微型機與應用, 2011(3).

第3篇

【關鍵詞】電子商務 專家系統 電子商務個性化推薦技術

電子商務個性化推薦技術是指在電子商務網站在客戶進行電子商務交易的過程中,根據用戶的個性化完成對用戶產品的推薦工作,通過對其網站系統內部超多的數據挖掘來有效的匹配到客戶心目中的理想產品類型,為客戶提供符合其個性化要求的產品購買信息以及相關服務功能。事實上,隨著電子商務行業的不斷進步以及發展,電子商務個性化推薦技術已經形成了專業成熟的電子商務個性化推薦系統,在電子商務網站的運營過程為客戶的購買行為提供者非常重要和直觀的技術支撐,保證客戶個性化要求的滿足。而在電子商務個性化推薦技術的組成結構中添加相應的專家系統模式,能夠更加有效的分析出客戶在電子商務購買行為中的購買需求、購買期望、購買目的,更好的幫助電子商務個性化推薦系統完成對不同客戶的定位和識別,促進客戶完成交易過程。

1 專家系統的主要內容

專家系統指的是一種專用的智能計算機程序系統,其內部含有大量的某一領域的專家水平的知識與經驗,能夠通過對這種經驗的分析和應用有效的解決這一領域中出現的諸多問題。事實上,專家系統的組成結構與電子商務個性化推薦系統的組成結構是較為相似的,其二者都共同存在輸入模塊、數據收集以及分析處理模塊和最終的輸出模塊等等,在電子商務個性化推薦系統中添加關于專家系統的智能程序,能夠有效的提升電子商務個性化推薦系統中的智能型,使其能夠更加充分的面對客戶在電子商務交易行為中的種種決策并提供相應的信息幫助。

2 基于專家系統的電子商務個性化推薦系統的主要組成

正如上文所述,專家系統的強大之處在于其可以利用某一領域的專家知識,模擬專家決策時候的決策方式以及相應的推理和判斷方式來解決某一領域中出現的諸多問題。在電子商務個性化推薦系統中應用專家系統這一程序,首先應該確定專家系統的主要領域以及相關的信息知識內容。具體來講,電子商務個性化推薦系統中專家系統應該包含的領域和知識內容應該包括消費領域以及心理領域等等,其具體的知識內容應該包括電子商務客戶的行為需求特征分析、電子商務客戶的行為適宜行為需求特征分析、電子商務客戶的決策行為需求特征分析等等,而專家系統在電子商務個性化推薦系統中的主要應用流程應該包括消費者描述自身的需求、專家系統分析適合消費者的需求、專家系統提取相應的產品信息滿足消費者的需求以及專家系統在最后的過程中對于產品的優點介紹和競爭優勢介紹等等,為消費者的最終決策提供信息幫助。

根據上述分析,基于專家系統的電子商務個性化推薦系統的主要結構應該包含專家系統的核心規則數據庫(靜態數據庫)和電子商務網站的商品數據庫以及客戶數據庫(動態數據庫),同時使用咨詢子系統、規則子系統以及結果子系統來實現專家系統核心規則數據庫以及電子商務網站動態數據庫之間的有效銜接和運用。

2.1 專家系統核心規則數據庫

邏輯上個性化推薦系統的靜態數據庫可以使用專家系統的核心規則數據庫作為程序建立的核心內容,用來存放專家系統運行的領域知識結構以及內容,并設置相應的輔助參數保證專家系統核心規則數據庫的良好運行。

2.1.1 規則特性

每一個規則包括四個特性,例如PREMISE規則的前提部分、ACTION規則的操作部分等等,同時注意CATEGORY規則按照上下文分類,每條規則只能用于某幾個上下文,以便調用;

2.1.2 設置參數

每個設置參數應該各自存儲一組屬性,用來咨詢以及程序調用,同時規定好每一個參數的參數組名稱、參數取值范圍、參數的類型結構。

2.2 動態數據庫

電子商務網站的用戶數據庫以及產品數據庫都隸屬于動態數據庫的存儲范圍,每一次客戶登錄或者登出的過程中,電子商務網站的動態數據庫都會隨之實時更新一次,添加相應的動態數據內容。動態數據庫對數據的主要存儲方式是根據相關對象、相關對象的具體屬性以及相關對象的具體參數數值(對象可信度、對象參數、對象跟蹤次數)來確定對該對象的信息存儲、追蹤和使用過程。

2.2.1 電子商務用戶數據庫

電子商務用戶數據庫的存儲信息主要是商務網站瀏覽和登錄登出過程中各個用戶的主要信息,包括用戶的性別、年齡、職位、愛好、收藏、收入、購物經歷以及其他相關信息等等。

2.2.2 電子商務商品數據庫

電子商務商品數據庫的存儲信息主要是諸多網站商戶的產品細細,包括產品的名稱、品牌、價格、尺寸、重量、功能、材料、生產日期、保質期、售后服務以及其他相關的產品信息等等。

2.3 資訊子系統

資訊子系統的主要功能是根據客戶在電子商務網站上的登錄、訪問、收藏、購物等一系列信息對網站的客戶數據庫提供對客戶的定位信息,更好的做好客戶個性化產品的推薦工作,同時有效的滿足客戶產品咨詢的功能。

2.4 規則子系統

規則子系統的主要功能是專家系統的核心規則內容,專家智能系統能夠憑借自身的核心規則以及規則子系統的有效連接來實現客戶的產品推薦工作。

2.5 結果子系統

結果子系統的主要功能是記錄客戶瀏覽、咨詢以及最終購買的過程,為客戶的可信度數值提供相應的資訊信息,并記錄下客戶本次的操作內容,為客戶的下次購買提供信息支持。

3 結語

綜上所述,本文對基于專家系統的電子商務個性化推薦系統的主要組成結構以及相關功能進行了分析,電子商務網站在應用專家系統的過程中仍然需要注意對專家系統智能模塊以及網站個性化推薦模塊兩者之間的有效連接和應用,使專家系統能夠有效的融入在電子商務個性化推薦系統中并發揮功用。

參考文獻

[1]馬麗.電子商務個性化推薦技術分析及比較[J].計算機系統應用.

第4篇

關鍵詞:個性化服務 Web使用挖掘 頻繁訪問模式 在線推薦

中圖分類號:TP311.52 文獻標識碼:A 文章編號:1007-9416(2012)07-0141-02

1、引言

互聯網已經成為日常生活不可或缺的重要組成部分,然而隨著近年來爆炸式地增長,信息過載與信息迷失正逐漸制約著人們利用互聯網來高效地獲取有價值的信息。面對浩如煙海的網絡空間,如何快速定位到個人真正感興趣的資源是一個迫切需要解決的問題,個性化服務應運而生。本文采用當前網絡開發的較為成熟的主流技術,設計了一個基于Web使用數據挖掘的個性化推薦系統。

2、個性化服務的概述

2.1 個性化服務的主要方式

個性化服務是以用戶為中心的,解決和滿足用戶的信息服務的需要。目前,個性化服務方式主要有以下幾種:

(1)信息分類定制服務:主要面對大眾提供可以定制的 web 頁面,具有為用戶創立和管理個人信息的功能,用戶可根據自己的需要定制個性化的界面設置、信息資源和服務形式,而系統會根據用戶的定制要求完成個性化的頁面設計,自動呈現用戶需要的信息類別。

(2)個性化信息檢索服務:根據用戶的興趣和特點進行檢索,返回與用戶需求相關的檢索結果。這就要求個性化信息系統增加優化查詢功能,通過內容過濾等技術,在檢索的同時考慮用戶的個性化差異,從而提高檢索質量。

(3)個性化推薦服務:主要是根據用戶的信息例如用戶的喜好,為滿足用戶的信息需求向用戶推送用戶喜好相關的信息,在這個過程中就是根據用戶的需求和目前的信息數據庫進行不斷的配對,將相關的信息推送給用戶。

2.2 個性化服務的相關技術

(1)數據挖掘是從大量的、不完整的、有噪聲的、模糊的和隨機的數據中,提取隱含在其中的、人們事先不知道的、但又是可信的、潛在的和有價值的信息和知識的過程。

(2)信息推送技術是通過一定的標準和協議,在網絡上按照用戶的需求,定期主動傳送用戶需要的信息的一項計算機技術。推送技術的核心思想是建立一個信息機制,把由客戶端擔負的責任轉給服務器,由服務器將用戶定制好的感興趣的網上信息以推送或網播的方式直接傳送到用戶面前。

(3)信息過濾是指從動態的信息流中獲取符合用戶靜態需求的信息,或者根據需要禁止滿足特定條件的信息流入。

(4)Web挖掘技術它可以從網絡瀏覽行為中抽取用戶感興趣的模式。通過對用戶瀏覽網站的日志數據進行收集、分析和處理,建立起用戶的行為和興趣模型,這些模型可以幫助理解用戶行為,改進站點結構以及為用戶提供良好的個性化信息服務。

3、系統分析和設計

3.1 個性化服務的內涵及特征

個性化信息服務是“信息爆炸”的背景下針對“信息過載”和“信息迷向”問題的重要解決方案之一。它基于用戶的學科、興趣和使用習慣等特征,利用網絡等信息技術,通過用戶個人信息定制、系統推薦和信息推送等功能,針對不同的用戶需求,采用不同的服務方式,提供不同的信息內容,實現多層面的個性化。從理論層面講,個性化信息服務是一種服務理念,從技術層面講,個性化信息服務是一個實現個性化服務的平臺。具休地說,個性化信息服務具有如下特征:

3.1.1 以用戶需求為中心

以用戶需求為中心包含兩層含義:一是以用戶的需求為導向設計與安排服務功能與設施;二是創建個性化的信息環境,按照用戶或用戶群的特點組織信息資源,提供多樣化的信息服務。

3.1.2 信息資源多元化

通過對各種館藏資源的有效組織、管理與配置,建立多元化的信息資源組織體系,為讀者利用館藏資源提供最大的便利。支持個性化服務系統的數據庫包含指向豐富信息內容的鏈接,力爭達到讓用戶即需即得的效果。

3.1.3 具有智能化分析和挖掘用戶需求的功能

智能化分析是指主動采集并跟蹤用戶瀏覽的信息,一方面從用戶日常檢索瀏覽中主動學習用戶的興趣,推理并預測用戶需求,及時處理推薦信息;另一方面可根據不同用戶的相同點或相似性進行信息推薦,使需求相同的用戶之間共享查詢結果。

3.1.4 推薦信息的準確性、高效性

由個性化服務推薦給用戶的信息必須是準確的、高效的、適合用戶的。能通過使用信息過濾等技術,屏蔽無關、無用的冗余信息,推薦精確、真實可用的信息;能自動地、智能地將大量的數據信息轉換為用戶所要求的或用戶可接受的系統知識形式,從而節約用戶時間,提高服務效率。

3.2 系統結構設計

在Web使用挖掘的一般過程中,主要將其劃分為三個階段:數據預處理;模式發現;模式分析與應用,如圖1所示。

由于服務器日志并非專門用于數據挖掘,因此在進行Web使用挖掘之前必須對其進行處理過濾,解決數據的不一致性、不完整性等問題,使之符合Web挖掘的需要,這就是數據預處理階段,預處理的結果會直接影響到挖掘算法產生的規則和模式;模式發現階段即挖掘算法實施階段,是對預處理后的數據使用數據挖掘中的算法如關聯規則,聚類分析等來產生規則和模式;模式分析與應用階段是整個Web使用挖掘過程的最后一步,此階段的主要目的是通過一定的技術和方法過濾掉模式發現階段產生的“不感興趣”的規則和模式。

3.3 系統功能模塊設計

整個系統框架包括離線和在線推薦引擎兩部分。離線部分又包括數據準備、用戶興趣建模等模塊;在線部分則由建立推薦池、產生初步推薦集、融合離線部分產生結果推薦集模塊組成。離線部分承擔數據準備和知識挖掘等功能,該部分面向的數據源通常為系統內存儲的各種海量歷史數據,挖掘處理需要較長時間,因此被設計為離線部分,以避免對實時性要求的影響;在線部分則承擔向當前用戶提供實時個性化服務推薦等功能,該部分是建立在離線部分的基礎上,直接參照其所生成的基于用戶興趣的頁面推薦集,針對不同用戶快速生成各種推薦服務。基于Web挖掘的個性化推薦系統的功能框架圖如圖2所示。

圖2 基于Web挖掘的個性化推薦系統框架圖

各子模塊功能如下:

(1)數據準備模塊。該模塊是對原始的用戶訪問日志進行數據采集、數據清洗和事務標識,生成對挖掘階段有用的用戶會話文件、事務數據庫及將站點的相關文件生成站點數據文件。

(2)建立用戶興趣模型庫模塊。該模塊使用Web挖掘技術對用戶訪問頁面內容和用戶訪問行為進行分析,抽取用戶興趣,結合信息資源的相關性,形成用戶興趣的矢量描述,并能隨著用戶的訪問的推進和用戶興趣的改變,及時更新用戶模型。

(3)建立推薦池模塊。該模塊就是通過獲取用戶評價,得到帶有用戶訪問時長的用戶訪問頁面集合。

(4)產生初步推薦集模塊。該模塊通過對當前用戶訪問頁面的相似度計算,繼而進行用戶聚類分析,再對聚類用戶進行關聯規則發現,產生初步推薦頁面集。

(5)融合離線部分產生個性化推薦集模塊。該模塊將產生的初步推薦頁面集與離線部分的用戶興趣模型相匹配。通過比較產生出最適合用戶的個性化推薦頁面集,并把這些頁面的地址附加到當前訪問頁面的底部,以進行推薦(圖3)。

4、結語

綜上所述,本文在對web服務技術及數據挖掘語言實施了分析和研究后,提出一個基于Web使用挖掘的個性化系統架構,該系統通過挖掘用戶Web訪問信息,生成了獨立的用戶興趣模型庫,可以更全面地反映用戶的興趣偏好,從而為用戶提供更詳細的信息推薦。

參考文獻

[1]韓家煒,孟小峰.Web挖掘研究.計算機研究與發展,38(4):405-414,2001.

[2]崔林,宋瀚濤,龔永罡,陸玉昌.基于Web使用挖掘的個性化服務技術研究.計算機系統應用,第三期:23-26,2005.

[3]王彤,何丕謙.Web日志挖掘及AprioriAll算法的改進.天津理工大學學報,23(1):13-17,2007.

第5篇

本文參考社會學和心理學將人們之間信任的產生來源分為三個方面:外部來源、交互來源和內部信任,如圖 1.1所示。外部信任是由于當前用戶在公共環境中的聲譽而使得其他用戶對其產生的信任,它是一種全局信任,獨立于單個用戶。交互信任是系統中用戶之間的交互所產生的信任關系,這是一種本地信任度。內部信任,是由于兩個人之間內在的相似性(如愛好等)產生的信任關系。

圖 1.1 分層信任模型示意圖

1 基于層次的信任度計算模型

本文提出基于層次的信任度計算模型如(1.1)所,其中Reputation表示外部信任,InteractiveTrust表示交互信任,Similarity表示內部信任。a,b,c是加權平均系數,滿足a+b+c=1。這三個系數分別應對不同類型的用戶:冷啟動用戶、常規用戶,爭議用戶。

(1.1)

在本文接下來的篇幅中將詳細介紹三種信任的計算方法以及a,b,c三個參數對于不同用戶的取值情況。

1.1 外部信任

本文使用的PageRank算法來計算外部信任。PageRank將指向一個網頁的鏈接看成是對于這個網頁的投票,本文將這種鏈接稱之為回指鏈接,而將一個網頁指向其他網頁的鏈接稱之為外向鏈接。例如在圖 2.1中,將用戶看作是網絡中的結點,將用戶之間的信任關系看做他們之間的信任,對于用戶A來說,從其他用戶到用戶A的鏈接如(B->A)等都是用戶A的回指鏈接;而從用戶A到其他用戶的鏈接如(A->B)等都是用戶A的外向鏈接。

圖 2.1 信任網絡初始狀態示意圖

PageRank在計算網頁排名的時候不單單考慮了網頁的回指鏈接的數量,更重要的是它還考慮了回指鏈接源網頁的價值。也就是說,一個高等級的頁面可以讓它所指向的低等級的頁面的等級提升。PageRank中,一個頁面的重要性是由鏈向它的所有頁面的重要性經過遞歸算法得到的,如等式(2.2)所示是RageRank的數學表達式:

(2.2)

Reputation(u)表示用戶u的信譽度,Bu表示指向用戶u的所有用戶的集合,Nv表示以用戶v為源用戶的所有鏈接的數目,也就是用戶v的外向鏈接數。

1.2 交互信任

本文使用MoleTrust來作為度量交互信任值的算法,之所以選擇MoleTrust有兩個原因:1. 它具有省時高效的特點;2. 該算法對信任的計算是按照層次順序進行的,這與我們的社交習慣非常類似。接下來將詳細介紹MoleTrust的計算過程及其缺點以及對MoleTrust的改進措施。

1.2.1 MoleTrust

MoleTrust的整個計算過程可以分為兩步完成:1.從源節點出發遍歷整個信任網絡,去除網絡中多余的信息和循環信任,構造一個單向無循環的信任網絡;2.在第一步的基礎上,從源節點出發開始傳播信任值,計算當前用戶對于網絡中其他用戶的信任。如Step 1和Step 2所示,是MoleTrust的具體運算過程:

MoleTrust的Step 1過程有一個非常重要的參數:trust_propagation_distance,該參數用來控制信任傳播的距離。圖 2.1經過MoleTrust的Step 1階段后得到圖 2.2所示信任網絡。將該信任網絡視為一個有向圖,在圖的第0層是當前用戶A,第1層,為用戶A的直接朋友,以此類推。

圖 2.2 經MoleTrust的Step 1后的信任網絡

在MoleTrust的Step 2階段,同樣有一個非常重要的參數:trust_threshold。只有信任值大于trust_threshod的用戶才會被加入到信任網絡中,該策略可以有效防止惡意用戶對于推薦系統的影響。

1.2.2 Modified MoleTrust

MoleTrust在計算信任值的過程中存在一個很大的漏洞,如Tr(A,G)=7,但這和我們的直覺是相悖的,因為G的上層用戶C的信任值只有3。為了彌補上述漏洞,本文提出一種修正的MoleTrust:Modified-MoleTrust。本文在在MoleTrust的Step 2階段引入一個遞減因子ω,其計算方式如等式(2.5)所示。

1.3 內部信任

本文認為用戶對項目的評分是用戶內部屬性的綜合體現,所以本文選擇用戶對項目的評分矩陣來作為內部信任的計算依據。有學者證明了在眾多衡量用戶相似性的指標中,Person相關系數的綜合表現最好,所以本文選擇Person相關系數作為內部信任的衡量指標。

Person相關系數的取值范圍是[-1,1],若Person相關系數的取值為正,則說明兩個用戶之間存在著相似性,反之當其取為負時說明兩個人之間的興趣可能是相悖的。Person相關系數的計算公式如等式(2.6)所示。其中n表示用戶A和用戶W共同評分的項目數,r(K,i)表示用戶K對項目i的評分。

2 實驗結果說明

本文利用Epinions網站的數據和Apache的Mahout平臺對所提出的模型進行了驗證。面對不同類型的用戶,對參數進行調整后,該模型總能得到較為理想的推薦準確度和覆蓋率,具體數3 結束語

第6篇

摘要:隨著移動技術的發展,社交網絡已經成為互聯網產品中的主體,而社交網絡產生的大量關系數據可以被用來進行個性化推薦的研

>> 基于網絡數據挖掘的個性化電子商務推薦系統研究 基于大數據的社團個性化推薦系統 基于swarm平臺和社交網絡的電子商務個性化推薦系統仿真模型的理論構建 網絡數據挖掘在圖書館個性化推薦中的應用研究 基于個性化推薦的網絡營銷 基于數據挖掘的電子政務個性化推薦服務框架研究 基于數據挖掘的個性化智能推薦系統應用研究 基于社交網絡的個性化知識服務模型研究 基于免疫進化的網絡教學資源個性化推薦系統研究 移動社會網絡中基于位置的個性化餐館推薦建模研究 基于IPTV的個性化推薦技術的研究 個性化好友推薦系統在社交網站上的應用研究 基于社交網絡的社會化推薦算法研究 基于個性化混合推薦算法的網絡推薦系統 基于數據挖掘的個性化推薦在SNS中的應用 基于Web使用數據挖掘的個性化推薦系統設計 基于小數據的高校圖書館個性化推薦 基于個性化推薦學習的網絡培訓教學課程平臺的設計與實現 基于網絡學習行為的個性化評價研究 社會化標簽系統中基于本體的個性化推薦方法研究 常見問題解答 當前所在位置:l

[2]張婷婷. 社會化網絡中人際關系與人際傳播研究[D].長沙:湖南大學,碩士學位論文,2012

[3]王萍. 社會化網絡的信息擴散研究[J]. 情報雜志,2009,28(10):39-42

[4]《2013-2017年中國社交網絡行業發展前景預測與投資機會分析報告》:前瞻產業研究院,2013

[5]項亮. 推薦系統實踐[M].北京:人民郵電出版社,2012

第7篇

[關鍵詞] 電子商務個性化信息服務個性化推薦系統

一、個性化信息服務

隨著網絡技術的不斷發展和電子商務的盛行,個性化信息服務成為了各商家在激烈的競爭中立于不敗之地的重要法寶。DELL公司的成功,就證實了個性化信息服務的重要性。個性化信息服務是指互聯網絡使用者可以按照自己的目的和需求,在某種特定的網絡功能和服務方式中,自己設定網上信息的來源方式、表現形式、特定網上功能以及其他的網上服務方式等,以達到最為快捷地獲取自己所需的網上信息服務內容的目的,強調“以用戶為中心”盡可能的滿足用戶的需求。個性化信息服務應用于電子商務中,通過捕獲用戶的興趣來提高商品的銷售量。

二、個性化信息服務的主要特點

1.以用戶為中心,以滿足用戶個性化的價值追求為目標。個性化信息服務應主動為用戶選擇最需要的資源與服務,根據用戶需求的變化,動態的改變所提供的信息,讓用戶得到個性化的服務。它以滿足特定用戶的特定需求為主旨,以給用戶提供最快捷、最方便、最易用的服務為目標,它是“以用戶為中心”的服務,可以是以用戶的信息需求為依據,面向用戶開展的一切服務性活動,也可以是針對特定需求向用戶提供特定信息的有計劃、有目的的活動,服務的基礎就是用戶的信息需求。

2.具備智能化信息分析與處理功能。個性化信息服務中的智能化信息分析與處理功能一方面表現在系統的主動性推薦和協同推薦上,另一方面表現在對用戶綜合行為的挖掘中。主動推薦是指主動采集并跟蹤用戶瀏覽的信息,從用戶日常檢索瀏覽中主動學習用戶的興趣,推理并預測用戶需求,及時處理推薦信息;協同推薦是指根據不同用戶的相同點或相似性進行信息推薦,使需求相同的用戶之間共享查詢結果。用戶綜合行為的挖掘是針對用戶所有可能被記錄下來的行為進行數據挖掘,實現資源的深層挖掘并提供有效的服務。

3.推薦精確、系統的知識。個性化信息服務通過過濾、屏蔽無關無用的冗余信息,推薦精確、有效、真正具有針對性的信息,:能自動地、智能地將大量的數據轉換為具有規律性、系統性的知識,形成具有內在關聯的信息鏈和知識鏈,并以易于理解的模式推薦給用戶。

4.主動性、高效性、靈活性。個性化信息服務采用“push”技術,其主動性主要是指服務不需要用戶及時請求而主動地將數據傳給用戶,與傳統的瀏覽器的“pull”技術的被動服務形成鮮明的對比;高效性主要是指可在網絡空閑時啟動,能夠有效的利用網絡帶寬,比較適合傳送大量的多媒體信息;靈活性主要體現在用戶能夠完全根據自己的方便和需要,靈活地設置連接時間,通過E-mail、對話框、音頻、視頻等方式獲取網上特定信息資源。

5.允許用戶充分表達個性化需求。個性化信息服務系統不僅提供友好的界面,而且方便用戶交互、描述自己的需求、反饋對服務結果的評價等。

三、個性化信息服務研究的基本問題

個性化信息服務研究的基本問題包括個性化的具體應用:個性化應用分為資源的個性化入口和過濾/排序;用戶信息需求定義文件的表示與創建:用戶信息需求或興趣的描述和存儲;協同過濾與單獨過濾:針對一個或一組用戶對信息文檔根據文件進行的相關度排序;系統的體系結構:用戶信息需求定義文件放在服務器還是客戶計算機上,或者處于二者之間的服務器上;個性化系統的評估:包括信息需求定義文件的收斂分析和信息需求定義文件是否反映用戶的實際興趣分析。這些問題也是設計一個具體的應用必須要明確的問題,而且它們之間是互相關聯、互相制約的。

四、個性化信息推薦系統

推薦系統是一種在特定類型數據庫中進行知識發現的應用技術,使用多種數據分析技術為用戶更好的服務,向用戶主動、及時、準確地提供所需信息,并能根據用戶對推薦內容的反饋進一步改進推薦結果。不僅要對用戶提出的要求提供最貼切的信息服務,還要能依據個體個性特征,主動收集個體可能感興趣的信息,甚至預測個體可能的個性發展,提前收集相應的信息,最后以個性化方式顯示給個體。是實現個性化信息服務的關鍵。

1.個性化信息推薦系統的關鍵技術。個性化信息服務推薦系統是實現個性化信息服務的主要途徑,主要是通過信息過濾和協同過濾等技術將用戶需要的信息推薦給用戶的。其關鍵技術有:

(1)內容過濾技術:試圖跟蹤和把握用戶的潛在信息需求,比較資源和用戶描述文件,對動態信息流進行過濾,盡量屏蔽無用信息,向用戶主動提供信息資源列表,從而提高用戶獲取信息的效率。

(2)協同過濾技術:利用用戶的訪問信息,通過用戶群的相似性進行內容推薦,不依賴于內容僅依賴于用戶之間的相互推薦,避免了內容過濾的不足,保證信息推薦的質量。

(3)聚類分析技術:對數據對象進行分類,把一組數據對象分到不同簇中,簇是一組數據對象的集合,使簇內各對象間具有較高的相似度,而不同組的對象差別較大。

2.個性化信息推薦系統的基本要求。個性化信息服務是為用戶打造量身訂制的服務,是為了更好的滿足用戶的需求。個性化信息服務推薦系統應該滿足個性化、主動性、新穎性、準確性的基本要求。

(1)個性化:根據不同用戶的不同背景、不同需求,為不同用戶提供不同的信息,存在一定程度的個性差異。

(2)主動性:系統主動根據用戶的信息需求向用戶提供信息,實現“信息找人”的過程,而不是“人找信息”。

(3)新穎性:系統向用戶提供的信息是用戶以往所不具有的,未曾訪問的卻又是需要的。

(4)準確性:在相同或相近的信息資源中,對兩個不同用戶的相似要求返回不同的信息結果,以滿足不同用戶的不同需求。

3.個性化信息推薦系統體系結構。目前,個性化信息推薦系統總的來說可以分為基于規則的和基于過濾的兩種推薦系統。基于關聯規則的個性化信息服務,主要針對特定的站點組織結構,采用最大向前訪問路徑輔助內容事務方法。制定一系列規則并利用這些規則為特定用戶提供服務。利用規則來推薦信息依賴于規則的質量和數量,基于規則的技術缺點是隨著規則的數量增多,系統將變得越來難以管理。基于過濾的個性化推薦服務分為基于內容過濾的推薦服務和基于協同過濾的推薦服務。基于內容過濾是通過比較資源和用戶信息描述文件,推薦與用戶興趣相似的資源。基于協同過濾的推薦系統則是利用用戶群的訪問信息,通過用戶群之間的相似性進行內容推薦。

結合以上兩類系統,為了能夠為用戶主動提供所需信息,個性化信息服務推薦系統一般需要通過用戶接口模塊、需求信息模塊、信息檢索模塊、用戶分析模塊、信息過濾模塊、信息推送模塊6個功能模塊來實現。

(1)用戶接口模塊:是用戶與系統之間的接口。負責處理用戶初次輸入的用戶信息,并將它存儲在用戶信息庫中;接收用戶輸入的認證信息,與用戶信息庫中的個人認證信息比較,完成用戶身份認證;處理用戶的檢索需求;將用戶輸入的興趣、愛好信息及用戶對于推薦信息的評價提交給需求分析模塊,接收信息推送模塊送來的信息,最終將其提交給用戶。

(2)需求分析模塊:是對用戶接口模塊送來的用戶初始興趣信息進行分析,建立用戶模型,并根據用戶反饋修改用戶模型。

(3)信息檢索模塊:是接收用戶接口模塊處理過的用戶檢索需求,檢索本地數據庫和網絡數據庫,并將檢索結果送到信息過濾模塊,并將其存儲到本地信息庫中。

(4)用戶分析模塊:是負責比較該用戶模型與其它用戶模型之間的相似度,找出有相同或相似興趣的其他用戶,相互推薦信息,實現信息資源共享。

(5)信息過濾模塊:是根據用戶模型對信息檢索模塊返回的檢索結果進行過濾并將過濾的結果送到信息推薦模塊;此外,如果用戶分析模塊找到了具有相同或相似興趣的用戶,信息過濾模塊也將這些用戶的個性化信息傳送到信息推薦模塊。

(6)信息推薦模塊:是負責實現主動信息服務,根據用戶信息庫中對于信息推送的時間、數量等設置,將經過信息過濾模塊過濾的信息推送到用戶接口模塊。

五、結束語

傳統的定題服務所具有的主動性是有限的,從根本上講仍是“用戶找信息”,而個性化信息服務是依托網絡環境的,可以在較高程度上改變信息與用戶的關系,能夠滿足網絡環境下真正實現“信息找用戶”。個性化信息服務以其交互性好、不受時間地域的限制、針對性強、資源豐富等優點,將成為電子商務發展的方向。

參考文獻:

[1]曾春:信息過濾的概念表示與算法研究[D].北京:清華大學,2003

[2]劉偉成焦玉英:網絡信息過濾的方法與相關技術研究[J].現代圖書情報技術,2002(4):48~50

第8篇

電子商務推薦系統(RecommendationSystemsforE-Commerce)定義是:“它是利用電子商務網站向客戶提供商品信息和建議,幫助用戶決定應該購買什么產品,模擬銷售人員幫助客戶完成購買過程”。

推薦系統面對的是用戶(user),任務是為用戶提供對項目(item)的推薦。用戶是指推薦系統的使用者,也就是電子商務活動中的客戶。項目是被推薦的對象,是指電子商務活動中提供給客戶選擇的產品和服務,也就是最終推薦系統返回給用戶的推薦內容。在一個電子商務活動中,用戶數和項目數是非常多的。推薦系統面對的當前用戶,稱為目標用戶或者活動用戶。推薦系統的當前工作,就是為根據一定的算法,給出對目標用戶的推薦項目。

電子商務推薦系統主要由三大部分構成:輸入模塊、推薦方法模塊和輸出模塊。輸入模塊用來接受用戶的輸入信息,用戶的輸入信息中最重要的是用戶對項目的評價(rating)數據;推薦方法模塊用來根據一定算法,根據用戶數據,得出對目標用戶的推薦,該模塊是整個推薦系統的核心部分,個性化推薦方面的研究的很大一部分,都集中在找到好的推薦方法。輸出模塊主要是指得到的推薦以何種形式反饋給用戶。

根據項目的特點,目前主要有兩種類型的推薦系統,一種是以網頁為對象的個性化推薦系統,主要采用Web數據挖掘的方法與技術,為用戶推薦符合其興趣愛好的網頁;另一種是網上購物環境下的、以商品為推薦對象的個性化推薦系統,為用戶推薦符合其興趣愛好的各類產品,如各種書籍,音像等,這種推薦系統也稱電子商務個性化推薦系統。

二、電子商務個性化推薦系統的作用

電子商務推薦系統的最大的優點在于它能收集用戶興趣資料并根據用戶興趣偏好為用戶主動作出個性化的推薦,也就是說,當用戶每次輸入用戶名和密碼登錄電子商務網站后,推薦系統就會按照目標用戶偏好程度的高低推薦用戶最喜愛的N個產品,而且系統給出的推薦是實時更新的,也就是說當系統中的產品庫和用戶興趣資料發生改變時,給出的推薦序列會自動改變,大大方便了用戶,也提高了企業的服務水平。

總體說來,電子商務推薦系統的作用主要表現在以下幾個方面:一方面,使用戶從無限的網絡資源和商品世界中解脫出來,大大節約了用戶采購商品的時間和成本;與此同時,推薦系統的個性化推薦服務,提高了客戶對電子商務網站的忠誠度(BuildingLoyalty),將更多的電子商務網站瀏覽者轉變為商品的購買者,從而提高電子商務網站的交叉銷售能力(Cross-Selling),為電子商務企業贏得了更多的發展機會。

研究表明,在基于電子商務的銷售行業使用個性化推薦系統后,能提高銷售額2%-8%,尤其在書籍、電影、CD音像、日用百貨等產品相對較為低廉且商品種類繁多的行業,以及用戶使用個性化推薦系統的程度高的行業,推薦系統能大大提高企業的銷售額。

電子商務推薦系統和銷售系統(MarketingSystems)、供應鏈決策支持系統(Supply-ChainDecision-SupportSystems)既相似又有不同。銷售系統是幫助銷售人員如何把產品銷售出去;推薦系統最終目的幫助用戶,輔助用戶購買什么產品做出決策。供應鏈決策支持系統是幫助生產者決定什么時候生產多少什么產品,以及倉庫應該存貯多少各類產品,其最終目的是為企業生產者服務的,而同樣推薦系統是面向用戶的系統。

三、電子商務個性化推薦系統的研究內容

電子商務個性化推薦的研究有四方面的問題:首先,要解決推薦系統的信息來源問題——推薦系統的基礎是用戶興趣資料信息,如何在電子商務環境下盡可能獲得更多用戶的相關信息,并以合適的形式表示是進行個性化推薦的前提;其次,要實現被顧客接受和認可的個性化推薦,設計準確、高效率的個性化推薦算法是核心;另外,要讓推薦系統為廣大用戶所接受,必須對推薦系統作出客觀、綜合的評價,尤其要注意從準確率、個性化、安全性、用戶滿意度等多方面進行評價;推薦系統的應用是最終研究的落腳點,推薦系統不僅能為用戶提供完全個性化購物環境,更應為企業的銷售決策和客戶關系管理提供支持。

在電子商務環境下,用戶信息收集表示是電子商務個性化推薦的基礎。根據當前對電子商務環境下用戶信息收集表示的研究來看,主要著眼于研究如何有效地收集能反映用戶興趣偏好的信息,以及如何通過網絡數據挖掘等的方法更自動化地收集用戶的隱式信息,解決用戶信息收集過多的依賴于顯式評價數據的問題。

個性化推薦技術是電子商務自動化推薦系統的核心問題。目前的推薦技術有協同過濾推薦(包括基于用戶的和基于項目的)、基于用戶人口統計信息的推薦、基于內容的推薦、基于效用的推薦、基于知識的推薦、基于規則的推薦等等。協同過濾推薦是個性化推薦中研究和應用最多的方法,廣泛應用于電子商務網站、數字圖書館、網頁搜索、新聞過濾等,著名的推薦系統有Tapestry、GroupLens/NetPerceptions、Ringo/Firefly等,其前提假設是存在具有相似興趣愛好的用戶群,每個用戶都有與其興趣愛好相似的鄰居用戶。預測用戶對某一項目的偏好是根據鄰居用戶對該項目的偏好程度計算的,也就是說如果其鄰居用戶喜愛某項目,則該用戶也很可能會喜愛該項目。協同過濾最大優點是不需要分析對象的特征屬性,所以對推薦對象沒有特殊的要求,能處理非結構化的復雜對象,如音樂、電影等。

對推薦系統總體性能的評價是推薦系統研究的重要組成部分。目前大都只是采用準確率、召回率等評判尺度對推薦算法進行評價,并沒有真正意義上的、提升到對整個推薦系統進行的評價,尤其缺乏從個性化程度、持久性程度、系統的安全性以及用戶接受程度等多方面對推薦系統進行綜合的評價。

四、研究現狀

推薦行為產品或其它項目的軟件已經在許多應用中使用在電子商務領域,為了增加購買經驗并滿足客戶需求,已經推出了充分利用消費者的訪問和購買行為的推薦系統。推薦者通常通過給用戶展示他們可能感興趣的產品或服務來促進購買。例如,諸如就是通過利用偏好或其他用戶購買信息來介紹書籍或者其它產品給用戶的推薦系統。然而,使用的技術相當簡單,而且并非很精確和有效。基本上,程序將當前客戶購買的一系列產品與其他客戶購買的一系列產品作比較,選擇客戶購買較多的產品與當前客戶購買的產品集合的交集,最后從中選出一些尚未被客戶所購買而仍然在顧客購物籃中的產品,并將它們作為推薦列表呈現給客戶。該技術也用于類似于協作過濾的文本文檔的信息抽取。電影或音樂唱片的推薦,例如,通過預知一個人的偏好與其他人偏好的線性權重集合,并運用協作過濾技術來實現。

對于推薦系統的研究可分為三個種類:技術系統開發研究,用戶行為研究和隱私問題研究。其中技術系統開發是重點。目前各種推薦技術,例如數據挖掘,和推理,都已經應用到了推薦系統中。現存的推薦系統從廣義上可以劃分為基于規則的系統和信息過濾系統。信息過濾系統又可分為基于內容過濾的系統和協作過濾系統兩種。

基于規則的系統,N1如:IBM的WebSphere,BroadVi-sion,ILOG等。他們允許系統管理員根據用戶的靜態特征和和動態屬性來制定規則,一個規則本質上是一個if-then語句,規則決定了在不同的情況下提供不同的服務。基于規則的系統,其優點是簡單、直接,缺點是規則質量很難保證,而且不能動態更新。此外,隨著規則的數量增多,系統將變得越來越難以管理。

基于內容過濾的系統,例如:PersonalWebWather,SysKill&Webert,Letizia,CiteSeer,ifWeb,SIFTER,PVA,WebMate,WebACE,ELFI和WebPersonalizer等。他們利用資源與用戶興趣的相似性來過濾信息。基于內容的推薦系統通過將顧客的偏好與產品內容自動匹配來給顧客提供建議,例如網頁和消息條目的推薦。在基于內容的系統中,產品由其普通屬性描述。顧客偏好通過分析產品比率以及相應的產品屬性來預測。基于內容過濾的系統,其優點是簡單、有效。缺點是難以區分資源內容的品質和風格,而且不能為用戶發現新的感興趣的資源,只能發現和用戶已有興趣相似的資源。在基于內容的推薦系統中,一個核心問題是識別關鍵屬性集合。如果該集合太小,顯然,這對于識別用戶剖面是不充分的。因此,基于內容的推薦系統不能用于僅僅實施一次購買行為新顧客,或者訪問了該網站,卻沒有實施任何購買行為的潛在顧客,以及購買他不是特別經常購買的一種產品的顧客。

協作過濾系統如:WebWather,Let'sBrowse,Tapestry,GroupLens,Fab,Alexa,Firefly,SELECT,LikeMinds和Site-Seer等。他們利用用戶之間的相似性來過濾信息。協作性的推薦系統估計顧客對特定產品的偏好是根據顧客對該產品的偏好率以及其他顧客對同一產品的偏好率的比較來實現的。協作性的推薦系統與基于內容的推薦系統之間的主要區別是協作性的推薦系統通過跟蹤一組顧客過去的行為來給該組中的個別顧客提供建議。使用該方法,顧客現在就可以接受建議,而在基于內容的推薦系統中,只要具有相似意向的其他顧客的偏好,顧客就己經具有先前預測了。基于協作過濾系統的優點是能為用Web數據挖掘的研究及其在網絡學習個性化推薦中的應用戶發現的新的感興趣的信息,缺點是存在兩個很難解決的問題,一個是稀疏性,亦即在系統使用初期,由于系統資源還未獲得足夠多的評價,系統很難利用這些評價來發現相似的用戶;另一個是可擴展性,亦即隨著系統用戶和資源的增多,系統的性能會越來越低。協作性的過濾方法用來識別與既定客戶具有相似興趣的顧客,所推薦的產品也是這些給定客戶喜歡的產品。該方法的一個主要局限是稀疏問題。在基于協作過濾的推薦系統中,很難精確確定下相似客戶和識別要推薦的產品。不僅如此,系數問題的極端形式是first-rater問題,當市場引入一種新產品時,不存在可用的先前估計信息。

還有一些個性化服務系統如:WebSIFT,FAB,Anatagon-omy和DynamicProfiler等,同時采用了基于內容過濾和協作過濾這兩種技術。結合這兩種過濾技術可以克服各自的一些缺點,為了克服協作過濾的稀疏性問題,可以利用用戶瀏覽過的資源內容預期用戶對其他資源的評價,這樣可以增加資源評價的密度,利用這些評價再進行協作過濾,從而提高協作過濾的性能。

近來,許多因特網公司還引進了有關信息產品的推薦系統,它包括Web站點推薦,音樂推薦,視頻推薦,書籍推薦等等(例如,以及等等)。因特網行銷機構運用推薦系統對某一廣告公司推薦用戶(例如Ac-tiveAgentWerbenetz。

通過將書籍推薦給已經購買過特定書籍的顧客實現個性化推薦的。.所推薦書籍概括的分為有兩種:小說書籍和非小說書籍。小說書籍的推薦很簡單,就是將同一作者的其它小說書籍推薦給特定用戶,這樣最終就將由該作者撰寫的相似類別的小說書籍推薦給了有相似背景的用戶。而非小說書籍的推薦將是將每個作者的相似類別的小說書籍推薦給了有相似背景的用戶。

五、電子商務推薦技術存在的問題和發展方向

綜合目前電子商務中個性化推薦系統的現狀可以看出,現存的個性化推薦系統技術大都是基于規則的系統,基于內容過濾的系統,以及協作過濾系統三種。而且,這些個性化推薦系統所運用的技術也僅僅限于基于內容的過濾,KNN(L-NearestNeighboring)技術,基于聚類的(Clustering-based)協作過濾,基于項目的(Item-based)協作過濾,序列模式,規則分析等等。由于這些推薦系統各自應用范圍的局限,而且都不同程度的需要人工參與,因而導致目前推薦系統的推薦精確度較低。不僅如此,大多數個性化推薦系統只是給用戶推薦一些不同類別的資源,這與普通的搜索引擎比較相似,而且對用戶正確行為的推薦卻比較少。

未來電子商務推薦技術研究的發展主要體現在以下幾個方面:

1.組合推薦技術的研究

眾所周知,現存的推薦技術已經得到推廣和應用,但各種技術都存在一些缺陷,能否將各種推薦技術融合起來作到取長補短是未來電子商務推薦技術研究的重要課題。

2.推薦技術準確度的研究

目前的推薦技術推薦的準確性還得不到保證,準確度的研究還局限在手工實驗階段,因此,研究出自動的準確性驗證理論模型就顯得非常重要。

3.數據獲取方面,主要還是依賴用戶的顯式評價,在自動獲得用戶的隱式信息方面做得不夠。

4.研究過于集中解決推薦算法性能的提高,對推薦系統的開發與應用,尤其是與企業其它系統的集成應用,在輔助企業的市場銷售,客戶管理和企業商務智能方面缺乏研究。

參考文獻:

[1]CooleyR,MobasherB,SrivastavaJ.Dataprepara2tionforminingworldwideWebbrowsingpatterns.JournalofKnowledgeandInformationSystems,1999(1):230~241

[2]GoldbergD,NicholsD,OkiBM,TerryD.Usingcol-muni-cationsoftheACM,1992,35(12):61~70.

[3]ResnickandVarian.RecommendationsystemsCommu-nicationsoftheACM,40(3):56C58,1997.98-122

[4]R.D.Lawrence,G.S.Almasi,V.Kotlyar,M.S.Viveros,S.S.Duri,Personalizationofsupermarketproductrecommenda-tions,IBMResearchRport,2000.43-75.

[5]鄧愛林,朱揚勇,施伯樂.基于項目評分預測的協同過濾推薦算法[J].軟件學報,2003,(9).

[6]曾春,邢春曉,周立柱.個性化服務技術綜述[J].軟件學報,2002,(10).

[7]趙亮,胡乃靜,張守志.個性化推薦算法設計[J].計算機研究與發展,2002,(8).

第9篇

關鍵詞:感知價值;采納意愿;VAM模型;移動個性化推薦

一、 引言

學者們關于用戶互聯網產品或服務接受意愿和使用行為的研究經常采用Davis等提出的TAM模型(Technology Adoption Model),或者在TAM模型的基礎上增加一些影響用戶態度和行為的因素形成擴展的TAM模型。但是,有研究表明TAM模型在研究用戶自愿購物方面的解釋力度不高(朱閣等,2010)。移動互聯網的使用者扮演著用戶和消費者的雙重角色,對移動互聯網的使用費用由自己承擔,是否接受具有自愿性。移動個性化推薦作為移動商務發展的重要產物,是電子商務網站向移動用戶推薦商品或服務信息的主要手段,這些信息能否引起用戶態度和行為主要取決于用戶對推薦信息的價值感知(Sabiote et al.,2012)。本文從感知價值相關理論出發,基于Kim等提出的VAM模型(Value-based Adoption Model),將用戶對移動個性化推薦的價值感知分為功能價值、體驗價值和安全價值三個維度,試圖從收益和損失兩個方面來分析影響用戶移動個性化推薦感知價值的因素,并測量后者對其采納意愿的作用路徑。

二、 相關理論綜述

1. VAM模型。VAM模型是Kim等(2007)基于價值最大化視角,針對用戶關于移動互聯網(M-Internet)的接受態度而構建的模型。該模型認為用戶對移動互聯網的感知價值是影響其接受意愿的主要因素,其它因素通過感知價值的中介作用影響接受意愿。在該模型中,Kim等將影響用戶移動互聯網感知價值的因素分為收益和損失兩個維度,并進一步將感知有用性和感知娛樂納入收益維度,將技術特性和感知費用納入損失維度;同時研究了感知價值對用戶移動互聯網接受意愿的影響。

2. 感知價值。Zeithaml(1988)認為感知價值是消費者基于感知利得和感知損失兩個角度,對產品效用做出的總體評價。根據研究情境的不同,學者們認為感知價值應該是一個多維度的概念。如,Sheth等(1991)提出了Sheth-Newman-Gross消費價值模型,該模型將影響用戶行為的感知價值分為社會價值、條件價值、情感價值、功能價值和認知價值五個維度。在Sheth-Newman-Gross消費價值模型的基礎上,Sweeney和Soutar(2001)將價格從功能價值中剝離出來,同時去掉了條件價值和認知價值,進而形成了包括質量/表現、社會價值、情感價值和價格/金錢價值四個維度的消費者感知價值模型。陳潔等(2012)把感知價值劃分為功利主義價值和享樂主義價值,并進一步將前者劃分為價格和品質兩個子維度,后者劃分為自我延伸、自我享樂和社交價值三個子維度。基于前人的研究成果,考慮到用戶移動個性化推薦使用的實際情況,筆者主要從功能價值、安全價值和體驗價值三個維度對用戶移動個性化推薦感知價值進行測量。功能價值類似于TAM理論中的感知有用性,是用戶對移動個性化推薦功能性、實用性、自然屬性等方面的感知;安全價值是用戶對移動個性化推薦的內容和系統基于正直、友善、可靠等方面的感知;體驗價值是用戶感知移動個性化推薦帶來的愉悅感、滿足感等。

三、 研究假設和模型

1. 感知價值與移動個性化推薦采納意愿。移動個性化推薦是商家根據目標消費者自身或者相似消費者的消費行為和偏好,為其推薦符合當前興趣和偏好的商品或服務信息。戴德寶等(2015)基于Sheth-Newman-Gross消費價值模型的研究表明,感知r值各個維度對用戶網絡個性化推薦的采納意愿都影響顯著,且VAM理論也證明了用戶對移動互聯網的感知價值影響其采納意向。基于此,本文認為用戶對移動個性化推薦感知價值的三個維度均正向影響其采納意愿。考慮到用戶使用移動個性化推薦主要是為了解決信息超載問題,享受移動個性化推薦帶來的愉悅體驗,提出假設:

H1:用戶移動個性化推薦感知價值的三個維度均正向影響采納意愿,且功能價值和體驗價值對采納意愿的影響更為顯著。

2. 收益與感知價值。TAM理論中的“感知有用性”和“感知易用性”分別是指用戶主觀上感知信息系統提高其工作績效的程度和使用信息系統所需付出的努力程度。移動個性化推薦的感知有用性和感知易用性主要涉及用戶對產品或服務功能屬性和享樂屬性的感知。基于此,提出以下假設:

H2:感知有用性正向影響用戶移動個性化推薦感知價值的三個維度,且對功能價值的影響最大;

H3:感知易用性正向影響用戶移動個性化推薦感知價值的三個維度,且對體驗價值的影響最大。

網絡個性化推薦系統是商家為了解決種類繁多的商品選擇同顧客相對單一的需求之間的矛盾而采用的信息工具和技術(Ricci et al.,2011)。受到移動設備屏幕小、資源有限、鏈接不穩定等因素的制約,移動個性化推薦系統如果不能在正確的時間、合適的地點為目標用戶推薦符合其興趣和偏好的信息,就會引起用戶的心理抗拒(萬君等,2015)。因此移動個性化推薦的界面設計、推薦信息數量、推薦時間和地點等情境特性都會影響用戶對其的價值認知。基于此,提出假設:

H4:情境特性正向影響用戶移動個性化推薦感知價值的三個維度,且對功能價值和體驗價值的影響均比較大。

3. 損失與感知價值。移動個性化推薦系統在一定程度上降低了用戶搜索商品或服務的時間和精力成本,但是,瀏覽移動個性化推薦過程中會產生流量費用、交易費用等費用,且移動個性化推涉及到了用戶的隱私信息泄露問題(Bandyopadhyay,2012)。已有研究表明,移動商務環境下感知費用和安全風險顯著影響用戶的感知價值(周濤等,2009)。基于此,提出以下假設:

H5:感知M用負向影響用戶移動個性化推薦感知價值的三個維度,且對體驗價值的影響最大;

H6:感知風險負向影響用戶移動個性化推薦感知價值的三個維度,且對安全價值的影響最大。

四、 實證研究

1. 問卷設計與發放。本文采用問卷調研的方式對提出的假設和模型進行檢驗,為保證問卷的信度和效度,問卷的測試題項均來自已有文獻,通過深度訪談和預調研對問卷進行修正,最終形成本研究的正式測量量表。正式調研于2016年6月底開始,7月中旬結束。正式調研均采用李克特5級量表,從“1”到“5”分別代表“非常不同意”到“非常同意”。共收回問卷221份,剔除無效問卷17份,共得到有效問卷204份,有效回收率為92.3%。有效問卷中,男女比例接近1∶1;20歲~30歲的人群占比90.2%;擁有大學學歷的人群占比67.2%,碩士及以上人群占比28.9%;手機上網年限大部分在2年以上占比超過90.0%;每天都上網的人群占比96.1%;有76%的人瀏覽移動個性化推薦。

2. 信度和效度分析。本文采用探索性因子分析(EFA)和驗證性因子分析(CFA)對測量量表進行信度和效度檢驗。結果顯示,整個量表的KMO值為0.877,巴特利特球形檢驗的結果為Sig=0.000。如表1所示,9個因子的Cronbanch's 值和組合信度(CR)值均大于0.7,說明量表的信度良好;各個測量題項的因子載荷均大于0.5,平均方差提取量(AVE)大于0.5,說明測量量表的效度良好。

3. 假設檢驗。本文采用AMOS21.0對研究模型進行了結構方程檢驗。各擬合指標值如表2所示,所有的擬合指標均在可接受范圍內,可以對概念模型進行假設檢驗。

檢驗結果顯示,研究模型對功能價值、體驗價值、安全價值和用戶移動個性化推薦采納意愿的解釋率分別為73.3%(R2=0.733)、57.3%(R2=0.573)、36.6%(R2=0.366)和89.5%(R2=0.895)。在收益對用戶移動個性化推薦感知價值的影響方面:感知有用性對功能價值(0.244)、體驗價值(0.205)、安全價值(0.235)均有顯著正向影響,對功能價值的影響最大(P<0.001),假設H2得到完全支持;感知易用性對體驗價值和安全價值的影響不明顯,在0.05的顯著性水平上影響功能價值(0.160),假設H3未得到實證支持;情境特性對功能價值(0.424)和體驗價值(0.247)均有產生正向影響,且對功能價值的影響最大(P<0.001),對安全價值的影響不顯著,假設H4得到部分支持。在損失對用戶移動個性化推薦感知價值影響方面,感知費用對功能價值(-0.260)、體驗價值(-0.490)和安全價值(-0.307)均產生負向影響,且對體驗價值的影響最大(P<0.001),假設H5得到完全支持;感知風險對用戶感知移動個性化推薦的功能價值影響不明顯,對體驗價值(-0.162)和安全價值(-0.311)均產生負向影響,其中對安全價值的影響最大(P<0.001),假設H6得到部分支持。在用戶移動個性化推薦感知價值對采納意愿的影響中,功能價值和體驗價值對接受意愿影響顯著,路徑系數分別為0.426和0.578,安全價值在0.1的顯著性水平上影響接受意愿,即相較于安全價值,功能價值和體驗價值對接受意愿的影響更大,假設H1得到完全支持。

五、 結論與啟示

1. 提升用戶體驗,形成用戶習慣。在自愿采納的環境中,用戶對信息技術的采納除了受到功能價值的影響外,還受到其它類型感知價值的影響。在需要付出時間和精力的移動個性化推薦情境中,用戶十分在意移動個性化推薦帶來的體驗價值。即企業在推送商品或服務信息時,不僅要根據用戶的興趣愛好為其推薦適宜的產品或服務信息,還要注重推送信息能給用戶帶來的愉悅感,通過優質的推薦信息喚醒用戶對移動個性化推薦積極的情感反應,進而提升用戶使用移動個性化推薦的頻率并最終形成用戶使用習慣。

2. 關注用戶收益感知。本研究發現用戶對移動個性化推薦的感知易用性對體驗價值和安全價值的影響不顯著,這可能是由于在移動個性化推薦較為普遍的移動商務環境中,用戶使用個性化推薦的難度小,更多的從其它方面來考慮移動個性化推薦帶來的價值。此外,研究發現用戶對移動個性化推薦的感知有用性對感知價值的三個維度均有顯著影響,情境特性對功能價值和體驗價值影響顯著,且兩者對功能價值的影響都最大;感知易用性對功能價值也有顯著影響。這進一步表明:一方面功能價值對用戶移動個性化推薦接受意愿起到了決定性作用;另一方面在功能滿足需求的情況下,用戶會追求個性化推薦帶來的情感體驗。分析認為:首先,企業必須切實保障移動個性化推薦的功能屬性,通過優化個性化推薦的技術特性,推送準確、適時的信息為用戶解決信息過載問題;其次,設計方便快捷的操作界面,用戶在瀏覽現有信息的同時可以隨時了解已有資源;最后,在關注推送信息質量和數量的同時,還要注重推送信息的界面設計、新穎性和個性化等,提升移動個性化推薦的享樂屬性。

3. 降低用戶損失感知。研究發現用戶使用移動個性化推薦的感知費用對感知價值三個維度均產生顯著影響,感知風險對安全價值和體驗價值影響顯著。相較于傳統互聯網推薦,受到移動設備屏幕顯示以及移動設備個人信息存儲的影響,用戶瀏覽和使用移動個性化推薦的過程中,除了需要付出大量時間、精力和金錢以外,還可能遭受隱私、財產信息泄露的風險。分析認為:首先,企業要同移動數據服務商合作,降低用戶接入互聯網的成本;其次,信息推薦商家、應用提供商家、支付機構等要注重對用戶信息的保護,不能隨意泄露和使用用戶信息;最后,構建用戶對移動個性化推薦基于正直和友善的信任,降低隱私風險感知。

參考文獻:

[1] 朱閣,馬龍,Sangwan Sunanda,等.基于社會認知理論的消費者采用模型與實證研究[J].南開管理評論,2010,13(3):12-21.

[2] 周濤,魯耀斌,張金隆.基于感知價值與信任的移動商務用戶接受行為研究[J].管理學報,2009,6(10):1407-1412.

[3] 陳潔,王方華.感知價值對不同商品類別消費者購買意愿影響的差異[J].系統管理學報,2012,21(6): 802-810.

[4] 戴德寶,劉西洋,范體軍.“互聯網+”時代網絡個性化推薦采納意愿影響因素研究[J].中國軟科學, 2015,(8):163-172.

[5] 萬君,郭婷婷,吳正祥,等.用戶對移動互聯網主動式推薦信息的心理抗拒與接受意愿研究[J].北京郵電大學學報:社會科學版,2015,17(5):47-53.

基金項目:國家自然科學基金項目(項目號:71172218);高等學校博士學科點專項科研基金項目(項目號:20122121110005)。

第10篇

[關鍵詞]Web挖掘;物流信息平臺;個性化推薦

[DOI]10.13939/ki.zgsc.2015.20.019

1 引 言

隨著網絡技術的發展,網絡已經成為人們獲取信息的一個重要途徑。為了提高物流服務的運作效率,各種類型的物流信息平臺紛紛建立。一般認為,凡是能夠支持或者進行物流服務供需信息的交互或交換的網站,均可視為物流信息平臺。物流信息平臺匯集了物流行業各方面的信息,通過Web頁面大量的物流資訊、物流人才、貨運信息、物流服務等內容,給用戶提供了獲取更快捷、更便宜的物流服務的手段。然而,隨著物流信息平臺整合信息資源種類和數量的增多,如何讓用戶在訪問網站時更準確、更快捷地獲得自己需要的信息,是物流信息平臺發展面臨的一個問題。而目前來說,物流信息平臺通常是以系統內搜索引擎或檢索工具幫助用戶檢索網站信息,但是大多數檢索功能缺少主動性,沒有考慮用戶的興趣偏好和用戶間的差異,所以無法滿足用戶對信息的個性化需求,物流信息平臺亟待改進其服務質量。

借鑒電子商務網站個性化服務的應用,個性化推薦服務可以作為物流信息平臺提高服務質量的一個有效途徑。個性化推薦服務是根據用戶的信息需求、興趣或行為模式,將用戶感興趣的信息、產品和服務推薦給用戶,這樣就可以避免用戶花費較多的時間進行信息篩選,使用戶在更短的時間內更準確地獲得自己真正感興趣的信息。

實現個性化推薦,關鍵是獲知和描述用戶的個性特征以及興趣偏好。考慮到物流信息平臺是通過Web頁面大量的信息和服務資訊,用戶的訪問情況可以很容易地反映出其個性特征和興趣偏好,因此對于物流信息平臺的個性化推薦服務可以通過Web挖掘技術來實現。

2 基于Web挖掘的物流信息平臺個性化推薦系統

2.1 系統基本功能

個性化推薦系統的基本功能是:通過分析用戶對Web訪問的規律,尋找行為模式相似的用戶,形成虛擬用戶社區,并建立用戶興趣庫,在對Web內容挖掘的基礎上,將符合用戶興趣的信息資源(包括新聞、供求信息、物流服務等)推薦給當前用戶。同時,利用系統建立的用戶興趣庫,當用戶輸入關鍵詞進行檢索時,將用戶檢索的結果按用戶的興趣程度排序,將用戶最有可能關注的信息或服務提供給用戶。

2.2 系統體系結構

該系統的體系結構主要由三個部分組成:數據采集及預處理、生成推薦模型與在線推薦部分。如圖1所示。

圖1 基于Web挖掘的物流信息平臺個性化推薦系統體系結構

數據預處理模塊負責從Web服務器日志、Web使用記錄等中提取、分解、合并、轉換相關的數據,供數據挖掘、偏好分析及推薦引擎使用,為實現個性化推薦任務提供必要的數據。為保證提供數據的準確性,因此該模塊一般要經過數據清洗(數據凈化)、用戶識別、會話識別、路徑補充、事務識別等過程。

模式生成是指用于個性化推薦的推薦模型的生成,該階段是推薦系統的主要部分,主要負責建立用戶興趣庫和虛擬用戶社區。該工作框架基于聚類算法。挖掘、創建模式數據庫是一個循環往復的過程。該階段也是離線進行,為在線實時推薦提供支撐。

在線推薦是根據用戶的訪問情況,將其與系統挖掘生成的模型進行匹配,找到與當前用戶行為相似的虛擬社區,按照該虛擬社區用戶的興趣庫實時地為用戶進行在線推薦。通常采用的推薦方法為用戶登錄時以頁面的形式給出推薦頁面,也可將推薦內容發送到用戶郵箱中。針對用戶群建立的虛擬用戶社區,可將相同的信息推薦給同一社區中的所有用戶。

2.3 系統的技術實現思路

個性化推薦服務以Web內容挖掘為支撐,首先對物流信息平臺上出現的物流信息進行分析,提取出關鍵詞;根據關鍵詞確定該資源所屬的類別,對用戶興趣中對應類別的權重達到設定閾值的用戶進行推薦。

個性化檢索服務的工作主要是對檢索結果進行2次處理。將頁面內容按標題提取關鍵詞后,根據關鍵詞將內容歸為某一類,然后根據用戶的興趣,將檢索結果按與用戶興趣匹配程度從大到小排序后,再提供給用戶。

3 系統關鍵技術

3.1 Web使用記錄數據的處理

Web使用記錄是用戶興趣及虛擬社區建立的關鍵。它所包含的內容主要來源于兩個方面:一方面是Web服務器日志記錄,另一方面是用戶在客戶端操作的記錄。前者可直接從服務器日志文件中獲得,但數據量龐大,需要經過數據清洗(數據凈化)、用戶識別、會話識別、路徑補充、事務識別等一系列預處理過程;后者則必須通過對用戶的瀏覽操作進行跟蹤記錄,可在網頁上增加對用戶下載、保存等與興趣程度相關操作的記錄,用小型的形式實現。

3.2 Web內容挖掘中頁面內容的表達與分類

在個性化推薦及個性化檢索服務中,首先要對待處理的資源進行分類。若考慮整個頁面的內容,則雖然能得到精確的內容表達,但對正文進行處理費時太多,所以采用對標題進行關鍵詞提取,再根據關鍵詞進行分類的方法。分詞采用分詞軟件完成。頁面分類工作流程如圖2所示。

圖2 Web頁面分類工作流程

分類算法有決策樹分類、貝葉斯分類、基于遺傳算法的分類等。該系統采用KNN分類算法。分類過程中,將訓練頁面及測試頁面經過標題提取及分詞后,形成相應的矢量。

3.3 用戶興趣的表示

用戶興趣根據用戶對Web進行訪問的各種瀏覽行為進行挖掘而得。一些典型的操作,如用戶下載、較長時間的瀏覽、添加至收藏夾等行為,反映出用戶對相關內容感興趣。用戶興趣采用向量空間描述,形如{(A1,W1),(A2,W2),…,(An,Wn)}。Wi取值范圍為[0,1],Wi值越大,說明相應的興趣度越高。如,某用戶的興趣向量空間為{(貨源,0.8),(車源,0.2)},說明該用戶在貨源關鍵詞上的興趣值為0.8,而在車源關鍵詞上興趣值為0.2,興趣度較低。用戶興趣的向量空間中,每個關鍵詞對應的權重是動態變化的。當用戶進行相關內容的下載、長時間瀏覽等操作時,權重增加(增加至1時不再遞增);若長時間未進行相關內容的瀏覽操作,則權重值減少。設定一個閾值,當某一關鍵詞對應的權重低于該閾值時,將相應分項從向量空間中去除,同樣,當某一新增關鍵詞的權重高于該閾值時,要在向量空間中增加對應分項,使向量空間反映出用戶興趣的實際變化情況。

3.4 虛擬用戶社區的建立與維護

虛擬用戶社區的建立采用聚類的方法,將用戶聚合在不同社區中。常用的聚類算法有基于劃分方法、基于層次方法、基于密度方法、基于網格方法等。該系統采用較為簡單的K平均劃分方法進行聚類處理,設聚類后簇的數目為K,具體操作步驟是:①隨機選取K個對象作為初始的K個簇的質心;②將其余對象根據其與各個簇質心的距離分配到最近的簇,再求新形成的簇的質心;③上述迭代過程不斷重復,直至目標函數最小化。

為簡化算法,選擇最能體現用戶興趣的網絡訪問活動進行分析。主要考慮以下用戶行為:下載資源、瀏覽資源。分別構建下載和瀏覽行為的相異度矩陣,再通過聚類算法生成虛擬用戶社區。

首先構建下載行為的相異度矩陣。將下載活動表示為(userid,KJ),其中userid為用戶標識,KJ為下載的資源號以及下載時間。以在一段時間內用戶下載相同資源的相同程度為基礎,構建相異度矩陣。如,有10個物流信息資源,編號分別為1~10,在同一段時間內用戶A、B下載資源的情況為:A下載的資源集合為(1,2,5,7),B下載的資源集合為(1,2,4),A下載資源中與B相同的比例為50%,B與A相同的比例為66%,綜合考慮,得A、B兩個用戶下載資源活動的相近程度為58%,則相異度為42%。經過處理后,得到用戶下載情況的相異度矩陣。

然后構建瀏覽行為的相異度矩陣。用戶的瀏覽行為與其興趣的相關程度在很大程度上取決于瀏覽時間,即用戶對某個頁面瀏覽時間越長,說明該用戶對頁面的興趣度越大。在以瀏覽行為為評價對象進行用戶相似性聚類時,除了考慮用戶瀏覽頁面的相同程度之外,還應考慮瀏覽時間。為方便處理,將瀏覽時間按長短分為若干個等級,如瀏覽時間在1min之內,1~5min,5~10min,10min以上等。以用戶在一段時間內訪問相同頁面時間長度等級的差異情況為主,構建相異度矩陣。

分別對上述2個相異度矩陣采用K平均劃分方法進行聚類,也可以將2個相異度矩陣合并,然后進行聚類處理。合并時可以加上一定的權重,如側重瀏覽行為,則對瀏覽情況的相異值乘上一個較大的系數B(0

用戶的興趣是動態變化的。相應的虛擬社區應根據用戶的興趣變化而變動。若某個用戶的興趣發生變化,某類興趣值下降至設定的閾值,則將該用戶從相應的社區中刪除;若用戶某類興趣值增加至設定的閾值,則將該用戶加入到對應的社區中。對新用戶經過一段時間的瀏覽行為跟蹤后,分配至合適的社區中。

4 結 論

隨著物流信息平臺整合資源和信息的增多,用戶訪問網站及時獲取所需信息的難度越來越大,而大多數物流信息平臺所具備的搜索功能又缺乏主動性。本文主要針對網站的普通用戶獲取信息的問題,將電子商務的個性化推薦技術應用其中。主要以Web挖掘技術從用戶的瀏覽行為間接地獲取用戶興趣進而完成個性化推薦。系統中所用的算法只是選用了相關挖掘算法中比較典型的,具體選用算法還可以進一步研究。

參考文獻:

[1]趙影.基于Web使用挖掘的個性化推薦服務研究[D].大連:東北財經大學,2009.

[2]張紅霞.基于Web挖掘的電子商務個性化推薦系統[J].遼寧工程技術大學學報(社會科學版),2009,11(6).

[3]陳基漓,牛秦洲.Web挖掘在農業信息網站個性化服務中的應用[J].安徽農業科學,2008,36(35).

第11篇

關鍵詞:智慧旅游;數字旅游;旅游智能推薦

1 引言

隨著城市智慧旅游的建設,旅游系統的旅游資源庫也逐漸龐大。如何整合這些旅游資源為游客提供一個智能化、個性化的服務,讓游客在短時間內找到自己想要的旅游信息,這就需要利用數據挖掘技術開發一個數字旅游服務智能推薦系統。該系統能夠根據游客的喜好、歷史訪問記錄或其他相似客戶信息為游客提供個性化的旅游服務。

2 系統設計

構建一個能充分利用秦皇島旅游資源,為游客推薦具有秦皇島特色旅游服務的系統是秦皇島旅游資訊服務實現個性信息化服務的有效手段。該系統運用數據挖掘技術根據需求信息結合歷史訪問記錄向游客推薦更符合用戶需求的旅游資源。通過該系統游客可以在世界的任何地方根據自己的喜好得到實時、動態和準確的旅游資源。

2.1 系統結構

該系統是基于java、Servlet、jsp、JDBC、數據庫等技術實現的以 Web 技術為核心的瀏覽器/服務器(B/S)模式的與平臺無關的大型旅游推薦系統。系統基于J2EE三層結構設計的,分為邏輯層、表達層和數據層。系統分為GUI(圖形用戶接口)、智能分析、推薦引擎、旅游資源庫、數據挖掘處理等幾個模塊。游客登錄網站后,系統智能分析模塊調用嵌入的Web挖掘算法根據游客以往的瀏覽記錄為用戶提供貼合用戶喜好的個性化頁面。而當用戶通過頁面輸入自己要查詢的信息關鍵詞提交后,智能分析模塊對用戶輸入的關鍵字進行分析,分析結果交給推薦引擎,經過數據挖掘處理模塊對系統用戶信息庫和旅游資源庫進行挖掘,得出推薦頁面集,最后將推薦內容返回給用戶。系統各個模塊之間相互依賴,互相交互得到個性化的推薦結果集。系統結構圖如圖1所示:

圖1 系統結構圖

2.2 系統功能

旅游智能推薦系統是秦皇島旅數字旅游系統的一個子系統,系統中嵌入了數據挖掘等技術實現了智能推薦功能,使系統可以根據用戶輸入需要的關鍵詞及用戶的訪問記錄為用戶感興趣的個性化推薦頁面集。具有以下方面的功能:

a.旅游詳細信息瀏覽。b.旅游資源庫更新。c.用戶查詢功能。

此功能包括兩個子功能:

a.分析輸入的檢索詞及用戶以往瀏覽記錄 b.通過嵌入的數據挖掘技術對數據進行分攤返回給用戶端感興趣的個性化頁面。

2.3 智能分析模塊設計

(1)獲取用戶需求,分析用戶訪問記錄;(2)響應用戶提交的搜索請求,通過關聯規則挖掘分析將列出對應的搜索結果以及相關鏈接返回給用戶。

2.4 推薦引擎設計

用戶與數據庫之間是通過推薦引擎模塊連接的,推薦引擎作為系統的一部分實施簡單運行在服務器端,推薦引擎模塊應用系統協同過濾推薦法來實現初始推薦功能。推薦引擎通過GUI模塊接受用戶需求,經過處理得到的數據立方體,在數據立方體上進行聯機分析。

2.5 數據挖掘處理模塊設計

系統實現智能推薦功能的主要模塊為數據挖掘處理模塊,此模塊繼承了多種成熟的數據挖掘算法。該模塊應用合理的數據挖掘算法通過對已有數據及資源庫進行數據收集、數據預處理、數據分析給用戶提供個性化的旅游服務。

2.5.1 數據收集

數據預處理的前提就是做好數據收集,收集的數據源包括頁面、日志以及用戶的訪問記錄和旅游資源庫的數據,分析這些數據,為數據挖掘做好充分準備。

2.5.2 數據預處理

數據分析之前需要對收集到的數據做預處理,處理成符合算法的數據集。數據預處理包括數據清洗、數據集成、數據選擇和數據變換四部分。數據清洗是對收集的數據進行預處理、抽取、過濾和組織重構等操作,通過數據清洗將數據整理成具有一定主題的主題數據庫,如中原山水、紅色之旅等,為進一步數據挖掘提供數據基礎。數據集成將不同的數據源合并成一致的數據存儲,對不同城市的旅游資源包括旅游路線、就去景點、酒店預訂、車票預訂等進行數據分析,按照數據的相似性進行集成。數據選擇通過一定的算法刪除數據集中的冗余數據,達到壓縮數據的目的。數據轉換將數據經過合適的規范化算法整理成適合不同數據挖掘算法合適的數據形式。通過對數據進行預處理可以降低數據挖掘處理的時間,提高數據挖掘的質量,進而提高系統的效率。數據預處理是數據挖掘模塊必不可少的階段,預處理的結果直接影響著系統推薦的質量。

2.5.3 數據分析

數據分析主要由成熟數據挖掘算法組成。通過數據挖掘算法對處理好的數據進行挖掘,挖掘出符合用戶需求的規則,并通過推薦引擎將分析的結果處理成個性化的推薦頁面返回給瀏覽器端。我們的系統暫時集成了聚類和關聯規則挖掘算法。

2.6 開放性智能推薦系統接口設計

為了提高系統的可擴展性,使系統可以不斷的集成先進的數據挖掘算法,我們定義一組標準的接口供各類人員繼承和調用。接口依據Java 語言中的 interface 類型來進行定義了,所有實現此接口的算法實例都必須實現相應的方法,從而為各種算法的實現提供了統一的規范,使得不同數據算法可以方便快速的集成。系統中的接口定義如下:

public interface IRSystem {

public String getAlgorithmName();// 數據挖掘算法名稱

public String getCName();//獲取所屬公司名稱

public String getAlgorithmDescription();// 獲取算法詳細描述

public String[] getRecoSets ();//獲取推薦結果

public String[] getRecoSets(String[]Keys); // 根據輸入的關鍵詞獲取推薦結果

public void init(String configFile); // 根據配置文件對當前推薦方法進行初始化

}

3 結束語

基于數據挖掘技術的旅游智能推薦系統,能夠滿足用戶的個性化需求,可以智能化的向用戶推薦感興趣的旅游服務,對建設智慧旅游有著重要的意義。現有系統僅僅集成了K-聚類、貝葉斯、關聯規則等幾種成熟的推薦算法,隨著數據挖掘算法人員的研究會有更好更有效率的挖掘算法出現,為了使系統能夠很好的擴展這些算法,我們提供了標準的接口來實現這一功能,提高了系統的可擴展性。

參考文獻

[1]張晗,潘正運,張燕玲.智能“旅游電子超市”的研究與設計[J].微計算機信息.2005.12,3.

[2]黃解軍,潘和平,萬幼川.數據挖掘技術的應用研究[J].計算機工程與應用,2003.2,45-48.

[3]錢衛寧,魏藜,王焱,錢海蕾,周傲英.一個面向大規模數據庫的數據挖掘系統[J].軟件學報,2002.8,1540-1545頁.

[4]姚罡,麥永浩,黨選舉,數據挖掘在電子商務推薦系統中的應用設計[J].計算機與自動化,2002.12,39-41頁.

第12篇

【關鍵詞】 個性化推薦 移動學習 混合式推薦

近年來,我國英語教學經歷了一系列的改革,教學理念和教學方法都發生了巨大的變化,然而,大班教學的現狀卻始終未能改變。在大班條件下,有限的課堂時間使教師只能講授語言知識,而不能為學生提供充足的語料和運用英語的機會,學生的學習需求無法得到滿足。移動技術的發展為解決這一問題提供了一個契機。利用移動設備,學生可以隨時隨地從網上獲取大量的學習資源。然而,網上海量的資源卻容易造成“網絡迷航”和注意力分散現象。在這種情勢下,個性化推薦技術應運而生。

一、個性化學習理論

個性化學習是指學習者可以自主制定學習計劃、選擇學習內容,確定學習時間和學習地點的學習方式。個性化學習是在多元智能理論和元認知理論的基礎上提出的。多元認知理論認為人的智力是多元的,學習者之間個體差異巨大,因此,教師應了解并尊重個體間的差異。元認知理論認為每個學習者都有獨特的認知風格和認知方式,因此,教師應提供多樣化的學習資源,以滿足不同的認知需求。個性化學習具有學習資源的多維性、學習價值追求的多重性、學習風格的獨特性、學習過程的終身性和學習方式的自主性、合作性與探究性特征[1]。

二、個性化推薦

個性化推薦是指利用用戶以往的選擇或相似性關系發掘用戶潛在的興趣對象,通過過濾信息為用戶提供滿足個性化需求的產品。個性化推薦系統通常由3部分組成:用戶行為記錄模塊、用戶偏好模塊和推薦算法模塊。推薦算法主要包括基于內容的推薦、協同過濾推薦、基于網絡結構的推薦、基于知識的推薦、混合推薦等。

三、移動英語學習平臺設計

設計移動英語學習平臺是為了滿足學習者個性化的學習需求,因此首先要分析用戶的特點和用戶的偏好以及用戶間的相似關系。其次要對學習資源進行分析,包括資源的類型、特征、屬性等。在此基礎上利用混合式推薦,為學習者提供需要的學習材料。

3.1 平臺總體結構

個性化移動英語學習平臺主要由服務器和移動終端兩部分組成。服務器端包括web服務器和數據庫服務器。數據庫服務器用于存儲用戶信息和學習資源,Web服務器用于上傳資源和修改數據庫。移動終端是指接入互聯網,可以向Web服務器提出學習請求或接收資源的智能手機、平板電腦等設備。個性化移動英語學習平臺架構分為三層:數據層、業務層和表現層。具體如下圖所示:

數據層采集、存儲學習者的基本信息和學習行為信息以及學習資源信息,并通過預加工為業務層提供信息。業務層是整個平臺最核心的一層,通過數據挖掘和數據分析,對數據層傳遞來的信息進行過濾、分析、加工、建模以建立用戶偏好模型。應用層接受用戶偏好模型,并為學習者推薦個性化的學習內容。

3.2用戶偏好模塊

要建立用戶偏好模型首先要采集和整理用戶信息。用戶信息包括基本信息和學習行為信息。基本信息是指用戶在注冊時填寫的個人信息,學習行為信息是通過用戶的各種學習行為采集的信息,如點擊、瀏覽、搜索、下載、收藏、分享、評價等行為數據。服務器端對用戶信息進行數據分析和建模。對于新用戶基本信息的簡單處理可采用決策樹算法。該算法不需要了解用戶背景知識,只需要對用戶進行分類就可以初步預測用戶對學習材料的態度。例如,兒童可能對英語兒歌感興趣,高中生可能對語法知識感興趣。利用決策樹進行數據分類首先需用一組訓練數據集來訓練分類器,然后用已建好的分類器對真實用戶數據進行分類。在對用戶基本信息簡單處理后,通過對用戶的學習行為數據的分析,來建立用戶偏好模型。具體方法是用關鍵詞和相應的權值來表示偏好,對關鍵詞權值的計算有多種方法,其中TF-IDF(詞頻-逆文檔頻率)算法簡單且容易實現。

3. 3學習資源分析模塊

聽、說、讀、寫、譯是英語基本技能,其中說、寫屬于輸出性技能,聽、讀屬于輸入性技能,譯則是各種技能實現的基礎。為學生提供個性化推薦,主要是推薦輸入性的語言材料,即聽力材料和閱讀材料,同時為了提高寫作能力,教師也可為學生提供作文的范文。在為學生提供閱讀材料和作文范文前,教師首先要了解材料中詞匯的難度。詞匯的難度取決于詞匯的長度、音節數和使用頻率。Chin-Ming Chen總結了詞匯難度公式[2]:

bj =( Lj×0.7+Pj×0.3) ×Gj

其中, bj表示第j個詞匯的難度, Lj表示第j個詞匯的長度系數, Pj表示第j個詞匯的音節長度系數, Gj表示根據詞頻確定的第j個詞匯的難度系數。

詞匯的難度對文章難度有影響,文章的類別、主題對文章的難度也有影響。最常用的文本表示方法是向量空間模型。在向量空間模型中,每個特征項對分類有不同的貢獻,因此需要進行權重計算。為了使用戶描述文件和學習資源描述文件的表達方式一致,對學習資源文件也采用TF-IDF算法來計算。

同樣,在向學生推薦寫作范文時,也需要了解文檔的相似度,也可采用TF-IDF算法來進行相似度判斷[3]。為學習者提供聽力材料的過程較為復雜,由于計算機不具備人腦的智能,因此難以分析音、視頻材料的難度和主題。因此需要教師為聽力材料標注難度、主題、類型等,系統在結合用戶學習需求的基礎上為用戶提供個性化的聽力材料。

3.4個性化推薦模塊

由于移動終端數據存儲、處理能力有限,因此本平臺的個性化推薦模塊在服務器端實現。推薦算法選擇基于內容的推薦算法。該算法對用戶和學習資料分別建立配置文件,通過分析用戶瀏覽的內容,建立用戶的配置文件,通過比較用戶與學習資料的相似度,向用戶推薦與其最匹配的學習資料。基于內容的推薦可以處理冷啟動問題,而且本平臺的學習資料多為文本資料,多媒體資料經過標識,已便于計算機識別和處理,因此基于內容的推薦算法更為適用。

本文將個性化推薦技術應用于移動英語學習中。通過對學習者基本信息和學習行為信息的采集和處理,建立用戶偏好模型,通過對學習資料的分析建立學習資料模型,運用基于內容的推薦算法將用戶信息與學習資料信息相匹配,并將最匹配的材料發送至用戶的移動設備上。本平臺節約了學習者大量的資料搜索和選擇時間,緩解了“網絡迷航”狀況,提高了英語學習效率。

參 考 文 獻

[1]李廣,姜英杰.個性化學習的理論建構與特征分析[J].東北師大學報(哲學社會科學2005,(3):152

亚洲精品无码久久久久久久性色,淫荡人妻一区二区三区在线视频,精品一级片高清无码,国产一区中文字幕无码
日本中文一二区精品在线 | 自拍视频一区二区三区在线 | 久久永久免费精品视频网站 | 在线免费播放AV片 | 在线观看免费大黄美女片 | 久久久久久综合岛国免费观看 |