0
首頁 精品范文 數(shù)據(jù)挖掘技術(shù)探討論文

數(shù)據(jù)挖掘技術(shù)探討論文

時間:2022-12-25 11:10:22

開篇:寫作不僅是一種記錄,更是一種創(chuàng)造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇數(shù)據(jù)挖掘技術(shù)探討論文,希望這些內(nèi)容能成為您創(chuàng)作過程中的良師益友,陪伴您不斷探索和進步。

數(shù)據(jù)挖掘技術(shù)探討論文

第1篇

大數(shù)據(jù)背景下的機器算法

專業(yè)

計算機科學(xué)與技術(shù)

學(xué)生姓名

楊宇瀟

學(xué)號

181719251864

一、 選題的背景、研究現(xiàn)狀與意義

為什么大數(shù)據(jù)分析很重要?大數(shù)據(jù)分析可幫助組織利用其數(shù)據(jù)并使用它來識別新的機會。反過來,這將導(dǎo)致更明智的業(yè)務(wù)移動,更有效的運營,更高的利潤和更快樂的客戶。

在許多早期的互聯(lián)網(wǎng)和技術(shù)公司的支持下,大數(shù)據(jù)在2000年代初的數(shù)據(jù)熱潮期間出現(xiàn)。有史以來第一次,軟件和硬件功能是消費者產(chǎn)生的大量非結(jié)構(gòu)化信息。搜索引擎,移動設(shè)備和工業(yè)機械等新技術(shù)可提供公司可以處理并持續(xù)增長的數(shù)據(jù)。隨著可以收集的天文數(shù)據(jù)數(shù)量的增長,很明顯,傳統(tǒng)數(shù)據(jù)技術(shù)(例如數(shù)據(jù)倉庫和關(guān)系數(shù)據(jù)庫)不適合與大量非結(jié)構(gòu)化數(shù)據(jù)一起使用。 Apache軟件基金會啟動了第一個大數(shù)據(jù)創(chuàng)新項目。最重要的貢獻來自Google,Yahoo,F(xiàn)acebook,IBM,Academia等。最常用的引擎是:ApacheHive / Hadoop是復(fù)雜數(shù)據(jù)準(zhǔn)備和ETL的旗艦,可以為許多數(shù)據(jù)存儲或分析環(huán)境提供信息以進行深入分析。 Apache Spark(由加州大學(xué)伯克利分校開發(fā))通常用于大容量計算任務(wù)。這些任務(wù)通常是批處理ETL和ML工作負(fù)載,但與Apache Kafka等技術(shù)結(jié)合使用。

隨著數(shù)據(jù)呈指數(shù)級增長,企業(yè)必須不斷擴展其基礎(chǔ)架構(gòu)以最大化其數(shù)據(jù)的經(jīng)濟價值。在大數(shù)據(jù)的早期(大約2008年),Hadoop被大公司首次認(rèn)可時,維護有用的生產(chǎn)系統(tǒng)非常昂貴且效率低下。要使用大數(shù)據(jù),您還需要適當(dāng)?shù)娜藛T和軟件技能,以及用于處理數(shù)據(jù)和查詢速度的硬件。協(xié)調(diào)所有內(nèi)容同時運行是一項艱巨的任務(wù),許多大數(shù)據(jù)項目都將失敗。如今,云計算已成為市場瞬息萬變的趨勢。因為各種規(guī)模的公司都可以通過單擊幾下立即訪問復(fù)雜的基礎(chǔ)架構(gòu)和技術(shù)。在這里,云提供了強大的基礎(chǔ)架構(gòu),使企業(yè)能夠勝過現(xiàn)有系統(tǒng)。

二、 擬研究的主要內(nèi)容(提綱)和預(yù)期目標(biāo)

隨著行業(yè)中數(shù)據(jù)量的爆炸性增長,大數(shù)據(jù)的概念越來越受到關(guān)注。 由于大數(shù)據(jù)的大,復(fù)雜和快速變化的性質(zhì),許多用于小數(shù)據(jù)的傳統(tǒng)機器學(xué)習(xí)算法不再適用于大數(shù)據(jù)環(huán)境中的應(yīng)用程序問題。 因此,在大數(shù)據(jù)環(huán)境下研究機器學(xué)習(xí)算法已成為學(xué)術(shù)界和業(yè)界的普遍關(guān)注。 本文主要討論和總結(jié)用于處理大數(shù)據(jù)的機器學(xué)習(xí)算法的研究現(xiàn)狀。 另外,由于并行處理是處理大數(shù)據(jù)的主要方法,因此我們介紹了一些并行算法,介紹了大數(shù)據(jù)環(huán)境中機器學(xué)習(xí)研究所面臨的問題,最后介紹了機器學(xué)習(xí)的研究趨勢,我們的目標(biāo)就是研究數(shù)據(jù)量大的情況下算法和模型的關(guān)系,同時也會探討大部分細(xì)分行業(yè)數(shù)據(jù)量不大不小的情況下算法的關(guān)系。

三、 擬采用的研究方法(思路、技術(shù)路線、可行性分析論證等)

 1.視覺分析。大數(shù)據(jù)分析用戶包括大數(shù)據(jù)分析專業(yè)人士和一般用戶,但是大數(shù)據(jù)分析的最基本要求是視覺分析。視覺分析直觀地介紹了大數(shù)據(jù)的特征,并像閱讀照片的讀者一樣容易接受。 2.數(shù)據(jù)挖掘算法。大數(shù)據(jù)分析的理論中心是數(shù)據(jù)挖掘算法。不同的數(shù)據(jù)挖掘算法依賴于不同的數(shù)據(jù)類型和格式來更科學(xué)地表征數(shù)據(jù)本身。由于它們被全世界的統(tǒng)計學(xué)家所公認(rèn),因此各種統(tǒng)計方法(稱為真值)可以深入到數(shù)據(jù)中并挖掘公認(rèn)的值。另一方面是這些數(shù)據(jù)挖掘算法可以更快地處理大數(shù)據(jù)。如果該算法需要花費幾年時間才能得出結(jié)論,那么大數(shù)據(jù)的價值是未知的。 3.預(yù)測分析。大數(shù)據(jù)分析的最后一個應(yīng)用領(lǐng)域是預(yù)測分析,發(fā)現(xiàn)大數(shù)據(jù)功能,科學(xué)地建立模型以及通過模型吸收新數(shù)據(jù)以預(yù)測未來數(shù)據(jù)。 4.語義引擎。非結(jié)構(gòu)化數(shù)據(jù)的多樣化為數(shù)據(jù)分析提出了新的挑戰(zhàn)。您需要一套工具來分析和調(diào)整數(shù)據(jù)。語義引擎必須設(shè)計有足夠的人工智能,以主動從數(shù)據(jù)中提取信息。 5.數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理。大數(shù)據(jù)分析是數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理的組成部分。高質(zhì)量的數(shù)據(jù)和有效的數(shù)據(jù)管理確保了分析結(jié)果在學(xué)術(shù)研究和商業(yè)應(yīng)用中的可靠性和價值。大數(shù)據(jù)分析的基礎(chǔ)是前五個方面。當(dāng)然,如果您更深入地研究大數(shù)據(jù)分析,則還有更多特征,更深入,更專業(yè)的大數(shù)據(jù)分析方法。

四、 論文(設(shè)計)的工作進度安排

2020.03.18-2020.03.20 明確論文內(nèi)容,進行相關(guān)論文資料的查找與翻譯。2020.04.04-2020.04.27:撰寫開題報告 。

2020.04.28-2020.04.30 :設(shè)計實驗。

2020.05.01-2020.05.07 :開展實驗。

2020.05.08-2020.05.15 :準(zhǔn)備中期檢查。

2020.05.16-2020.05.23:根據(jù)中期檢查的問題,進一步完善實驗2020.05.24-2020.05.28 :完成論文初稿。

2020.05.29-2020.06.26 :論文修改完善。

 

五、 參考文獻(不少于5篇)

1 . 王偉,王珊,杜小勇,覃雄派,王會舉.大數(shù)據(jù)分析——rdbms與mapreduce的競爭與共生 .計算機光盤軟件與應(yīng)用,2012.被引量:273.

2 . 喻國明. 大數(shù)據(jù)分析下的中國社會輿情:總體態(tài)勢與結(jié)構(gòu)性特征——基于百度熱搜詞(2009—2 012)的輿情模型構(gòu)建.中國人民大學(xué)學(xué)報,2013.被引量:9. 3 . 李廣建,化柏林.大數(shù)據(jù)分析與情報分析關(guān)系辨析.中國圖書館學(xué)報,2014.被引量:16.

4 . 王智,于戈,郭朝鵬,張一川,宋杰.大數(shù)據(jù)分析的分布式molap技術(shù) .軟件學(xué)報,2014.被引量:6.

5 . 王德文,孫志偉.電力用戶側(cè)大數(shù)據(jù)分析與并行負(fù)荷預(yù)測 .中國電機工程學(xué)報,2015.被引量:19.

6 . 江秀臣,杜修明,嚴(yán)英杰,盛戈皞,陳玉峰 ,郭志紅.基于大數(shù)據(jù)分析的輸變電設(shè)備狀態(tài)數(shù)據(jù)異常檢測方法 .中國電機工程學(xué)報,2015.被引量:8.

7 . 喻國明. 呼喚“社會最大公約數(shù)”:2012年社會輿情運行態(tài)勢研究——基于百度熱搜詞的大 數(shù)據(jù)分析.編輯之友,2013.被引量:4.

六、指導(dǎo)教師意見

 

 

 

 

 

 

 

 

簽字:                  年     月    日

七、學(xué)院院長意見及簽字

 

 

 

 

 

 

 

第2篇

【關(guān)鍵詞】 共享數(shù)據(jù)時代; 數(shù)據(jù)挖掘; 應(yīng)用統(tǒng)計

【中圖分類號】 C81 【文獻標(biāo)識碼】 A 【文章編號】 1004-5937(2016)22-0024-02

第八屆國際數(shù)據(jù)挖掘與應(yīng)用統(tǒng)計研究會年會于2016年7月23―26日在油城大慶隆重召開。本屆會議由國際數(shù)據(jù)挖掘與應(yīng)用統(tǒng)計研究會主辦,東北石油大學(xué)、廈門大學(xué)數(shù)據(jù)挖掘研究中心、臺北醫(yī)學(xué)大學(xué)大數(shù)據(jù)研究中心、重慶允升科技大數(shù)據(jù)研究中心和重慶譽鋒宸數(shù)據(jù)信息技術(shù)有限公司聯(lián)合承辦。會議主題為“卓越數(shù)據(jù)共享統(tǒng)計的理論及應(yīng)用研究”。來自國內(nèi)外近百所高校、政府和企事業(yè)單位的200多位專家學(xué)者參會。

會議開幕式由東北石油大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院院長王玉學(xué)教授主持。東北石油大學(xué)副校長呂延防教授介紹了大慶市貌、學(xué)校環(huán)境和鐵人精神等,對本次會議的作用和意義進行了高度評價。教育部統(tǒng)計學(xué)類專業(yè)教學(xué)指導(dǎo)委員會主任、廈門大學(xué)曾五一教授從統(tǒng)計學(xué)科如何適應(yīng)大數(shù)據(jù)時代的發(fā)展角度,對會議的召開提出了進一步的期望。臺北醫(yī)學(xué)大學(xué)謝邦昌教授結(jié)合大慶石油,暢談了大數(shù)據(jù)的應(yīng)用前景。廈門大學(xué)朱建平教授從學(xué)會的起源到現(xiàn)狀,對學(xué)會未來的發(fā)展前景作了展望。

本屆大會除特邀報告外,入選論文52篇。按照論文所涉及的理論領(lǐng)域和方法應(yīng)用,將入選論文分為數(shù)據(jù)挖掘與大數(shù)據(jù)應(yīng)用、統(tǒng)計理論、統(tǒng)計方法應(yīng)用及實證分析等專題進行了分組交流討論。主要學(xué)術(shù)觀點綜述如下:

一、數(shù)據(jù)挖掘與大數(shù)據(jù)研究現(xiàn)狀及未來趨勢研究

謝邦昌教授在《大數(shù)據(jù)發(fā)展現(xiàn)況與未來發(fā)展趨勢》中首先闡述了何謂BIG DATA。當(dāng)你連上臉書按贊打卡、上傳照片到網(wǎng)絡(luò)相簿與朋友分享、上班收發(fā)e-mail、用悠游卡買杯咖啡、通過ATM領(lǐng)錢、走進大賣場刷卡購物甚至是進家門開燈,都正在源源不斷地創(chuàng)造“海量數(shù)據(jù)”。這正是云端時代的新金脈。其次是BIG DATA的理論及其應(yīng)用。最重要的是如何對大數(shù)據(jù)進行分析,其基本方面如下:(1)數(shù)據(jù)可視化分析。決策者需要的不是數(shù)據(jù)本身及分析后的數(shù)值,而是龐大數(shù)據(jù)經(jīng)分析之后的結(jié)果、趨勢或現(xiàn)象,利用可視化效果易于被接受。(2)Data Mining算法。這是大數(shù)據(jù)分析的理論核心,而深入挖掘和快速處理是兩大重要課題。(3)預(yù)測性分析。如何找出特性、科學(xué)建模、預(yù)測未來。(4)語義引擎。非結(jié)構(gòu)化數(shù)據(jù)的多元化給數(shù)據(jù)分析帶來新的挑戰(zhàn),要提高語義引擎設(shè)計的智能化水平。(5)數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理。高質(zhì)量的數(shù)據(jù)和有效的數(shù)據(jù)管理可保證分析結(jié)果的真實和有價值。最后,真正制約或者成為大數(shù)據(jù)發(fā)展和應(yīng)用的三個瓶頸:數(shù)據(jù)收集的合法性、產(chǎn)業(yè)鏈各個環(huán)節(jié)企業(yè)的均衡、大數(shù)據(jù)有效解讀。

國家統(tǒng)計局潘[博士在《我看當(dāng)前對大數(shù)據(jù)的一些非議――兼議大數(shù)據(jù)應(yīng)用面臨的問題》中指出近幾年中國的大數(shù)據(jù)應(yīng)用取得了一定的進展,但面臨的諸多障礙依然存在,且不斷出現(xiàn)一些對大數(shù)據(jù)的非議之聲。這些非議有的有一定道理,有的則失之偏頗。潘[博士針對這些非議指出大數(shù)據(jù)是科學(xué)技術(shù)及社會生產(chǎn)力發(fā)展到特定階段的必然。盡管其發(fā)展進程中確實出現(xiàn)了失密、造假等嚴(yán)重問題,但這正說明必須正視大數(shù)據(jù)的撲面而來,并盡快制定各種應(yīng)對措施,抓住機遇,保存價值,著力解決出現(xiàn)的各種問題。最后,提出完善法律法規(guī)、明確牽頭單位、統(tǒng)籌各部門和規(guī)范標(biāo)準(zhǔn)等措施。

重慶工商大學(xué)李勇在《網(wǎng)絡(luò)輿情數(shù)據(jù)挖掘方法及其在意識形態(tài)傳播新特點中的應(yīng)用研究》中系統(tǒng)研究了當(dāng)前網(wǎng)絡(luò)輿情數(shù)據(jù)挖掘的主要方法,并將這些方法應(yīng)用于網(wǎng)上意識形態(tài)傳播新特點的研究中。對互聯(lián)網(wǎng)出現(xiàn)前后意識形態(tài)傳播呈現(xiàn)的不同特點進行了對比分析,提煉出意識形態(tài)傳播在當(dāng)前DT時代的本質(zhì)特征,結(jié)合主流意識形態(tài)提出相應(yīng)的有效傳播方式和防范措施。

東北石油大學(xué)辛華博士在《基于密度分布的聚類算法研究》中通過密度聚類方法DBSCAN二次聚類提高了聚類精度。湖北經(jīng)濟學(xué)院陳戰(zhàn)波、陶前功、黃小舟和王磊的《基于阿里云音樂平臺大數(shù)據(jù)的歌手流行趨勢預(yù)測及推薦研究》,山西財經(jīng)大學(xué)舒居安、趙麗琴、劉逸萌的《基于網(wǎng)絡(luò)輿情的居民購買力傾向指數(shù)構(gòu)造研究》和重慶工商大學(xué)李禹鋒的《基于網(wǎng)絡(luò)團購的重慶火鍋消費行為分析》等進行了大數(shù)據(jù)的應(yīng)用研究。光環(huán)國際楊恩博的《大數(shù)據(jù)人才發(fā)展與培養(yǎng)》、廣州泰迪智能科技趙云龍的《大數(shù)據(jù)形勢下數(shù)據(jù)科學(xué)人才培養(yǎng)初探》和劉彬的《大數(shù)據(jù)雙創(chuàng)實踐探索與服務(wù)體系》,從業(yè)界不同角度探索了大數(shù)據(jù)人才培養(yǎng)。

二、統(tǒng)計基本理論及應(yīng)用研究

臺灣淡江大學(xué)蔡宗儒教授在《Accelerated Degradation Tests》中,回顧了可靠度分析近期的發(fā)展,指出隨著制造技術(shù)的進步,產(chǎn)品可靠度大幅提升,進而提升了對產(chǎn)品可靠度分析的難度。而傳統(tǒng)設(shè)限方法和近代加速壽命測試法具有一定局限性,通過研究加速退化測試方法,指出如何針對加速退化數(shù)據(jù)進行統(tǒng)計推斷、評價其可靠度,如何在成本的考察下對加速退化測試實驗進行設(shè)計,以利后續(xù)的測試實驗參考。

北京大學(xué)房祥忠教授在《EM算法及其在置信推斷中的作用》中指出醫(yī)學(xué)或產(chǎn)品試驗費用昂貴等小樣本情況,其精確置信推斷尤為重要;Buehler置信限在多維參數(shù)或刪失數(shù)據(jù)時,難以計算,并將EM算法用于求精確置信限,給出了可靠性領(lǐng)域中的實證。

重慶工商大學(xué)李勇在《灰色統(tǒng)計基本理論及其應(yīng)用》中系統(tǒng)研究了灰數(shù)的統(tǒng)計學(xué)基本理論和方法。他從隨機樣本產(chǎn)生灰色估計量和直接從灰色數(shù)據(jù)開始,構(gòu)建了一套從數(shù)理統(tǒng)計逐步過渡到主要以灰色系統(tǒng)為研究對象的灰色統(tǒng)計方法,如灰數(shù)的區(qū)間估計、灰數(shù)的假設(shè)檢驗、灰數(shù)的相關(guān)分析和回歸分析等,并進行了實例分析。

哈爾濱工業(yè)大學(xué)張孟琦、田波平在《空間模型參數(shù)擬極大似然估計量的漸近性和實證》中提出了雙權(quán)重矩陣空間回歸模型參數(shù)的極大似然估計量,包括對數(shù)似然函數(shù)、集中似然函數(shù)和參數(shù)估計;證明了相合性和漸進分布性質(zhì),并實例進行了空間自相關(guān)檢驗和空間計量模型分析。

天津財經(jīng)大學(xué)楊貴軍、于洋、孟杰的《基于AIC的粗糙集擇優(yōu)方法》和楊貴軍、孫玲莉、董世杰的《三種線性回歸多重插補法的模擬研究對比分析》分別從粗糙集擇優(yōu)和回歸插補進行了研究。云南財經(jīng)大學(xué)張敏博士在《基于高層次結(jié)構(gòu)的多水平發(fā)展模型的統(tǒng)計建模及應(yīng)用》中研究了擬合高層次嵌套數(shù)據(jù)的多水平發(fā)展建模問題。集美大學(xué)紀(jì)的《模糊數(shù)據(jù)Jonckheere-Terpstra檢驗法及應(yīng)用》探討了模糊數(shù)據(jù)檢驗。廣東財經(jīng)大學(xué)的劉照德、林海明在《因子分析五個爭議的解答》中定量分析了因子分析的爭議問題。湖南大學(xué)周四軍、王佳星、羅丹在《基于門限面板模型的我國能源利用效率研究》中,基于柯布―道格拉斯生產(chǎn)函數(shù)理論構(gòu)建了我國能源利用效率門限面板模型,并進行了實證分析。

三、統(tǒng)計方法及實證研究

天津財經(jīng)大學(xué)楊貴軍、孟杰、鄒文慧在《基于模型平均的中國總和生育率估計》中指出目前國內(nèi)學(xué)者對中國總和生育率的估計尚未形成一致性的結(jié)論,缺少高質(zhì)量的數(shù)據(jù)源以及不完善的估計方法是影響總和生育率估計的主要問題;提出使用社會和經(jīng)濟等“人口系統(tǒng)”外部數(shù)據(jù),引入當(dāng)前統(tǒng)計學(xué)和計量經(jīng)濟學(xué)前沿的模型平均方法對中國總和生育率進行估計。

華僑大學(xué)項后軍和浙江財經(jīng)大學(xué)何康在《自貿(mào)區(qū)的影響與資本流動――以上海為例的“自然實驗”估計》中,從自然實驗角度考察了樣本期內(nèi)上海自貿(mào)區(qū)的設(shè)立對上海地區(qū)資本流動的影響。得出:基于雙重差分模型估計的自貿(mào)區(qū)對上海資本流動的影響顯著;基于改進后合成控制法得到的“合成上海”對上海設(shè)立自貿(mào)區(qū)之前的模擬程度更高;基于安慰劑檢驗,證實了自貿(mào)區(qū)政策的有效性。

湖南大學(xué)晏艷陽、鄧嘉宜、文丹艷在《鄰里效應(yīng)與居民政治信任――基于中國家庭追蹤調(diào)查(CFPS)的證據(jù)》中,指出近年來居民對政府的信任危機頻發(fā),矛盾不斷出現(xiàn),嚴(yán)重制約著政府的行政效率;基于中國家庭追蹤調(diào)查(CFPS)截面數(shù)據(jù),建立回歸模型進行實證分析,證實了其他信息獲取渠道與社會互動之間具有相互替代的關(guān)系,有效解決了關(guān)聯(lián)效應(yīng)和反射性問題對鄰里效應(yīng)估計帶來的影響。

中國南方電網(wǎng)科學(xué)研究院冷媛、傅薔、陳政和廈門大學(xué)范新妍在《基于MCP,Group MPC的先行、一致、滯后指標(biāo)篩選》中,提出了基于MCP懲罰法的單一指標(biāo)先行、一致、滯后性的判定方法和基于Group MCP的多指標(biāo)系統(tǒng)下各個指標(biāo)的先行、一致、滯后性的判定方法。冷媛、傅薔和廈門大學(xué)孫俊歌、梁振杰在《經(jīng)濟景氣指數(shù)研究比較及思考》中梳理了國內(nèi)外景氣指數(shù)的研究狀況。遼寧大學(xué)馬樹才、宋琪在《中國人口年齡結(jié)構(gòu)變動對資本投入及經(jīng)濟增長影響研究》中通過構(gòu)建數(shù)理模型,就人口年齡結(jié)構(gòu)對資本投入及經(jīng)濟增長的影響進行研究,得出充足的勞動供給會提高教育人力資本和物質(zhì)資本的使用效率,促進經(jīng)濟增長,政府公共教育支出增加會提高教育人力資本對經(jīng)濟增長的貢獻;并對面板數(shù)據(jù)進行實證分析。廈門大學(xué)劉云霞在《我國高技術(shù)產(chǎn)業(yè)創(chuàng)新績效影響因素動態(tài)比較研究――基于狀態(tài)空間和門檻模型相結(jié)合的研究》中確定了反映創(chuàng)新績效的指標(biāo)以及影響創(chuàng)新績效的因素,再將狀態(tài)空間模型和門口模型進行有機結(jié)合,找出了各影響因素對創(chuàng)新績效的動態(tài)影響軌跡以及軌跡改變的關(guān)鍵點,并提出對策建議。

第3篇

2Web數(shù)據(jù)挖掘

2.1Web數(shù)據(jù)挖掘概述

數(shù)據(jù)挖掘(DataMining)是從大量的、不完全的、有噪聲的、模糊的和隨機的數(shù)據(jù)中提取人們事先不知道的、潛在有用的信息和知識的非平凡過程。

Web數(shù)據(jù)挖掘(WebMining)是從Web文檔和Web活動中抽取感興趣的、潛在的有用模式和隱藏的信息,是數(shù)據(jù)庫、數(shù)據(jù)挖掘、人工智能、信息檢索、自然語言理解等技術(shù)的綜合應(yīng)用,是在一定基礎(chǔ)上應(yīng)用數(shù)據(jù)挖掘的方法以發(fā)現(xiàn)有用的知識來幫助人們從WWW中提取知識。Web數(shù)據(jù)挖掘可以分為Web內(nèi)容挖掘(WebContentMining)、Web結(jié)構(gòu)挖掘(WebStructureMining)、Web使用記錄挖掘(WebUsageMining)三類。Web內(nèi)容挖掘是指從文檔內(nèi)容或其描述中抽取知識的過程,又可以分為基于文本的挖掘和基于多媒體的挖掘兩種。Web文本挖掘可以對Web上大量文檔集合的內(nèi)容進行總結(jié)、分類、聚類、關(guān)聯(lián)分析等。Web結(jié)構(gòu)挖掘是指從Web組織結(jié)構(gòu)和鏈接關(guān)系中推導(dǎo)知識。通過對Web結(jié)構(gòu)的挖掘,可以用來指導(dǎo)對頁面進行分類和聚類,找到權(quán)威頁面,從而提高檢索的性能,同時還可以用來指導(dǎo)網(wǎng)頁采集工作,提高采集效率。Web使用記錄挖掘是指從服務(wù)器端記錄的客戶訪問日志或從客戶的瀏覽信息中抽取感興趣的模式。

基于Web的數(shù)據(jù)挖掘技術(shù)的出現(xiàn)不僅為商家做出正確的商業(yè)決策提供了強有力的工具,也為商家更加深入地了解客戶需求信息和購物行為的特征提供了可能性。

2.2電子商務(wù)中Web數(shù)據(jù)挖掘的步驟

電子商務(wù)中Web數(shù)據(jù)挖掘的步驟如下:

①明確數(shù)據(jù)挖掘的對象—業(yè)務(wù)對象,確定商業(yè)應(yīng)用主題,不能盲目地進行挖掘;

②將與業(yè)務(wù)對象的各類原始數(shù)據(jù)收集起來作為挖掘的數(shù)據(jù)源泉;

③對收集的數(shù)據(jù)進行預(yù)處理,一般包括數(shù)據(jù)凈化、用戶識別、會話識別、路徑補充、事務(wù)識別和格式化等階段,以提高挖掘效率,剔除無用、無關(guān)信息并對信息進行必要的整理。

④根據(jù)需要解決的問題建立合適的數(shù)據(jù)挖掘模型,然后利用已知數(shù)據(jù)對模型進行訓(xùn)練和測試,并應(yīng)用該模型得到挖掘結(jié)果;

⑤利用可視化技術(shù),驗證、解釋挖掘的結(jié)果,并據(jù)此做出決策或豐富知識,即進行模式分析與應(yīng)用。

在整個Web數(shù)據(jù)挖掘的過程中,被明確的業(yè)務(wù)對象是挖掘過程的基礎(chǔ),它驅(qū)動整個Web數(shù)據(jù)挖掘的全過程;同時,也是檢驗挖掘結(jié)果和引導(dǎo)分析人員完成挖掘的依據(jù)。

2.3電子商務(wù)中Web數(shù)據(jù)挖掘的數(shù)據(jù)源

在電子商務(wù)中,可以用來作為數(shù)據(jù)挖掘分析的數(shù)據(jù)量比較大,而且類型眾多,總結(jié)起來有以下幾種類型的數(shù)據(jù)可用于Web數(shù)據(jù)挖掘技術(shù)產(chǎn)生各種知識模式。

①服務(wù)器數(shù)據(jù)。客戶訪問站點時會在Web服務(wù)器上留下相應(yīng)的日志數(shù)據(jù),這些日志數(shù)據(jù)通常以文本文件的形式存儲在服務(wù)器上。一般包括serverslogs、errorlogs、cookieslogs等。

②查詢數(shù)據(jù)。它是電子商務(wù)站點在服務(wù)器上產(chǎn)生的一種典型數(shù)據(jù)。例如,對于再現(xiàn)存儲的客戶也許會搜索一些產(chǎn)品或某些廣告信息,這些查詢信息就是通過cookie或是登記信息連接到服務(wù)器的訪問日志上。

③在線市場數(shù)據(jù)。這類數(shù)據(jù)主要是傳統(tǒng)關(guān)系數(shù)據(jù)庫里存儲的有關(guān)電子商務(wù)站點信息、用戶購買信息、商品信息等數(shù)據(jù)。

④Web頁面。主要是指HTML和XML頁面的內(nèi)容,包括文本、圖片、語音、圖像等。

⑤Web頁面超級鏈接關(guān)系。主要是指頁面之間存在的超級鏈接關(guān)系,這也是一種重要的資源。

⑥客戶登記信息。客戶登記信息是指客戶通過Web頁輸入的、要提交給服務(wù)器的相關(guān)用戶信息,這些信息通常是關(guān)于用戶的人口特征。在Web的數(shù)據(jù)挖掘中,客戶登記信息需要和訪問日志集成,以提高數(shù)據(jù)挖掘的準(zhǔn)確度,使之能更進一步的了解客戶。

2.4Web數(shù)據(jù)挖掘能夠獲取的知識模式

運用Web數(shù)據(jù)挖掘技術(shù)能夠?qū)φ军c上的各種數(shù)據(jù)源進行挖掘,找到相關(guān)的一些知識模式,以指導(dǎo)站點人員更好地運作站點和向客戶提供更好的服務(wù)。一般運用Web數(shù)據(jù)挖掘可以在站點上挖掘出來的知識模式有以下幾個:

①路徑分析。它可以被用于判定在一個Web站點中最頻繁訪問的路徑。通過路徑分析,可以得到重要的頁面,可以改進頁面及網(wǎng)站結(jié)構(gòu)的設(shè)計。

②關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)。在電子商務(wù)中關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)可以找到客戶對網(wǎng)站上各種文件之間訪問的相互關(guān)系,可以找到用戶訪問的頁面與頁面之間的相關(guān)性和購買商品間的相關(guān)性。利用這些相關(guān)性,可以更好的組織站點的內(nèi)容,實施有效的市場策略,增加交叉銷售量,同時還可以減少用戶過濾信息的負(fù)擔(dān)。

③序列模式的發(fā)現(xiàn)。序列模式的發(fā)現(xiàn)就是在時間戳有序的事務(wù)集中,找到那些“一些項跟隨另一項”的內(nèi)部事務(wù)模式。它能夠便于進行電子商務(wù)的組織預(yù)測客戶的訪問模式,對客戶開展有針對性的廣告服務(wù)。通過系列模式的發(fā)現(xiàn),能夠在服務(wù)器方選擇有針對性地頁面,以滿足訪問者的特定要求。

④分類和預(yù)測。分類發(fā)現(xiàn)就是給出識別一個特殊群體的公共屬性的描述,這個描述可以用來分類新的項。分類的目的是通過構(gòu)造分類模型或分類器,把數(shù)據(jù)庫中的數(shù)據(jù)項映射到給定類別中的某一個,以便用于預(yù)測;也就是利用歷史數(shù)據(jù)記錄自動推導(dǎo)出對給定數(shù)據(jù)的推廣描述,從而能對未來數(shù)據(jù)進行預(yù)測,進行適合某一類客戶的商務(wù)活動。

⑤聚類分析。聚類分析可以從Web訪問信息數(shù)據(jù)中聚集出具有相似特性的那些客戶。在Web事務(wù)日志中,聚類顧客信息或數(shù)據(jù)項能夠便于開發(fā)和執(zhí)行未來的市場策略。這種市場策略包括自動給一個特定的顧客聚類發(fā)送銷售郵件、為屬于某一個顧客聚類中的顧客推薦特定的商品等。對電子商務(wù)來說,客戶聚類可以對市場細(xì)分理論提供有力的支持。通過對聚類客戶特征的提取,電子商務(wù)網(wǎng)站可以為客戶提供個性化的服務(wù)。

⑥異常檢測。異常檢測是對分析對象的少數(shù)的、極端的特例的描述,以揭示內(nèi)在的原因,從而減小經(jīng)營的風(fēng)險。異常檢測在電子商務(wù)中的應(yīng)用可以體現(xiàn)在信用卡欺詐甄別、發(fā)現(xiàn)異常客戶和網(wǎng)絡(luò)入侵檢測等方面。

Web數(shù)據(jù)挖掘的各項功能不是獨立存在的,而是在挖掘過程中互相聯(lián)系,發(fā)揮作用。

3Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用

3.1數(shù)據(jù)抽取方法在電子商務(wù)中的應(yīng)用

與傳統(tǒng)商務(wù)活動相比,電子商務(wù)具有更多的虛擬和不確定的因素:如客戶購買的心理、動機、能力、欲望等。Web數(shù)據(jù)挖掘要解決的問題就是如何從零散的無規(guī)則的網(wǎng)絡(luò)數(shù)據(jù)中找到有用的和有規(guī)則的數(shù)據(jù)和知識,基本方法之一就是進行數(shù)據(jù)抽取,以期對數(shù)據(jù)進行濃縮,給出它的緊湊描述,如方差值等統(tǒng)計值或用直方圖等圖形方式表示,從數(shù)據(jù)泛化的角度討論數(shù)據(jù)總結(jié),把最原始、基本的信息數(shù)據(jù)從低層次抽象到高層次,以便于企業(yè)決策。

3.2基于Web數(shù)據(jù)挖掘的智能化搜索引擎

電子商務(wù)企業(yè)在活動過程中面臨的問題之一是如何通過Internet全面、準(zhǔn)確、及時地收集到企業(yè)內(nèi)、外部的環(huán)境信息,尤其是一些隱性的、關(guān)系到企業(yè)經(jīng)營成敗的關(guān)鍵信息,以提高競爭力。目前的搜索引擎存在著查準(zhǔn)率低、返回?zé)o用信息多的問題,使企業(yè)無法得到優(yōu)質(zhì)的信息。鑒于此,將Web數(shù)據(jù)挖掘技術(shù)應(yīng)用于搜索引擎,使之成為智能搜索引擎,從而提高性能,滿足電子商務(wù)企業(yè)的需要。Web挖掘技術(shù)主要在以下幾個方面對搜索引擎有借鑒作用:文檔的自動分類、自動摘要的形成、檢索結(jié)果的聯(lián)機聚類和相關(guān)度排序及實現(xiàn)個性化的搜索引擎。經(jīng)過文檔的分類處理,可以對搜索結(jié)果進行分門別類,可以通過限制搜索范圍來使文本的查找更為容易,幫助用戶快速的對目標(biāo)知識進行定位,從而提高用戶進行網(wǎng)上信息搜索的效率;自動摘要能夠解決大部分搜索引擎機械地截取文檔的前幾句和固定字?jǐn)?shù)的摘要使信息反映不完整的缺陷,使用戶能較準(zhǔn)確、快速、方便地了解檢索信息;通過對檢索結(jié)果的文檔集合進行聚類,可以使得與用戶檢索結(jié)果相關(guān)的文檔集中在一起,從而遠(yuǎn)離那些不相關(guān)的文檔,將處理以后的信息以超鏈結(jié)構(gòu)組織的層次方式可視化地提供給用戶,由用戶選擇他所感興趣的那一簇,將大大縮小所需瀏覽的頁面數(shù)量;將Web使用挖掘中的個性化技術(shù)應(yīng)用在搜索引擎中,可以在大量訓(xùn)練樣本的基礎(chǔ)上,得到數(shù)據(jù)對象間的內(nèi)在特征,并以此為依據(jù)進行有目的的信息提取,使得搜索引擎可以按照用戶的興趣偏好擴充用戶搜索的關(guān)鍵詞,以使得檢索結(jié)果更接近用戶要求,或者根據(jù)用戶歷史瀏覽信息的分析獲得用戶興趣庫,調(diào)用個性化的搜索引擎可以提高用戶檢索的查全率與查準(zhǔn)率。通過借鑒Web挖掘技術(shù)可以提高查準(zhǔn)率與查全率,改善檢索結(jié)果的組織,從而使檢索效率得到改善。

3.3Web數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用

①客戶關(guān)系管理的核心

客戶關(guān)系管理(CustomerRelationshipManagement,簡稱CRM)的核心是通過客戶和他們行為的有效數(shù)據(jù)收集,發(fā)現(xiàn)潛在的市場和客戶,從而獲得更高的商業(yè)利潤,通過完善的客戶服務(wù)和深入的客戶分析來滿足客戶的需求,保證實現(xiàn)客戶的終生價值。可以說CRM能給傳統(tǒng)企業(yè)帶來在網(wǎng)絡(luò)經(jīng)濟時代謀取生存之道的管理制度和技術(shù)手段。它要求企業(yè)從“以產(chǎn)品為中心”的模式向“以客戶為中心”的模式轉(zhuǎn)移。

②Web數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用

Web數(shù)據(jù)挖掘能夠幫助企業(yè)確定客戶的特點,使企業(yè)能夠為客戶提供有針對性的服務(wù)。將Web數(shù)據(jù)挖掘用在電子商務(wù)CRM中主要體現(xiàn)在客戶的獲取和保持、價值客戶鑒別、客戶滿意度分析及改善站點結(jié)構(gòu)等幾方面。

通過Web數(shù)據(jù)挖掘,可以理解訪問者的動態(tài)行為,據(jù)此優(yōu)化電子商務(wù)網(wǎng)站的經(jīng)營模式。通過把所掌握的大量客戶分成不同的類,對不同類的客戶提供個性化服務(wù)來提高客戶的滿意度,從而保持老客戶;通過對新訪問者的網(wǎng)頁瀏覽記錄進行分析,就可以判斷出該訪問者是屬于哪一類客戶,是有利可圖的潛在客戶還是毫無價值的過客,達(dá)到區(qū)別對待、節(jié)省銷售成本、提高訪問者到購買者的轉(zhuǎn)化率的目的,從而挖掘潛在客戶;通過對具有相似瀏覽行為的客戶進行分組,提取組中客戶的共同特征,從而實現(xiàn)客戶的聚類,這可以幫助電子商務(wù)企業(yè)更好地了解客戶的興趣、消費習(xí)慣和消費傾向,預(yù)測他們的需求,有針對性地向他們推薦特定的商品并實現(xiàn)交叉銷售,可以提高交易成功率和交易量,提高營銷效果。

此外,站點的結(jié)構(gòu)和內(nèi)容是吸引客戶的關(guān)鍵。利用關(guān)聯(lián)規(guī)則的發(fā)現(xiàn),針對不同客戶動態(tài)調(diào)整站點結(jié)構(gòu)和頁面內(nèi)容,把具有一定支持度和信任度的相關(guān)聯(lián)的物品放在一起以有助于銷售;通過路徑分析等技術(shù)可以判定出一類用戶對Web站點頻繁訪問的路徑,這些路徑反映這類用戶瀏覽站點頁面的順序和習(xí)慣,將客戶訪問的有關(guān)聯(lián)的文件實現(xiàn)直接鏈接,讓客戶容易地訪問到想要的頁面。這樣的網(wǎng)站會給客戶留下好印象,提高客戶忠誠度,吸引客戶,延長他們在網(wǎng)站上的駐留時間以及提高再次訪問的機率。

通過挖掘客戶的行為記錄和反饋情況,進一步優(yōu)化網(wǎng)站組織結(jié)構(gòu)和服務(wù)方式以提高網(wǎng)站的效率。通過Web數(shù)據(jù)挖掘,可以得到可靠的市場反饋信息,評測廣告的投資回報率,從而評估網(wǎng)絡(luò)營銷模式的成功與否;可以根據(jù)關(guān)心某產(chǎn)品的訪問者的瀏覽模式來決定廣告的位置,增加廣告針對性,提高廣告的投資回報率,降低公司的運營成本。③維護客戶的隱私權(quán)

維護客戶的隱私權(quán)是商家在商業(yè)運作過程中不能忽視的一個基本組成部分。因此,作為電子商務(wù)企業(yè),應(yīng)該盡量避免對單個客戶數(shù)據(jù)進行挖掘。企業(yè)管理客戶隱私權(quán)的保護應(yīng)該從技術(shù)和管理兩個方面來實現(xiàn):技術(shù)上,通常是采用加密標(biāo)志符,并且盡量避免對單個客戶數(shù)據(jù)進行挖掘;管理上,很多電子商務(wù)企業(yè)現(xiàn)在已經(jīng)增設(shè)了首席隱私官(CPO,ChiefPrivacyOfficer)職位,隱私官將能在個人對隱私的需求和公司以合理手段使用隱私材料的權(quán)利之間,建立適當(dāng)?shù)钠胶怅P(guān)系。這種平衡關(guān)系的大成,需要以長期的實踐和經(jīng)驗為基礎(chǔ)。除了電子商務(wù)企業(yè)以單獨的主體身份進行客戶隱私權(quán)保護的管理之外,行業(yè)自律也是保護客戶隱私權(quán)的一個行之有效的手段。目前,電子商務(wù)網(wǎng)站越來越傾向于通過行業(yè)自律的方式來樹立其在客戶心目中的形象,讓客戶放心地提交數(shù)據(jù)。

3.4Web數(shù)據(jù)挖掘在個性化服務(wù)推薦系統(tǒng)中的應(yīng)用

電子商務(wù)個性化服務(wù)推薦系統(tǒng)是向站點企業(yè)提供在電子商務(wù)中更好地運作CRM,建立良好客戶關(guān)系的一種解決方法,是“以客戶為中心”、“一對一”的行銷的堅實執(zhí)行者。

該系統(tǒng)主要是將數(shù)據(jù)挖掘的思想和方法應(yīng)用到Web服務(wù)器日志及Web數(shù)據(jù)庫等資源上,挖掘出客戶的訪問規(guī)律;然后將在線訪問客戶歸結(jié)到某一類中去,根據(jù)該類用戶的訪問規(guī)律進行Web頁面的推薦;并且系統(tǒng)還可以通過不斷地跟蹤用戶的當(dāng)前訪問,實時調(diào)整推薦集,為用戶提供個性化的訪問。該系統(tǒng)由五大模塊組成:數(shù)據(jù)收集模塊、數(shù)據(jù)預(yù)處理模塊、數(shù)據(jù)存儲模塊、離線挖掘模塊和在線推薦模塊。其系統(tǒng)結(jié)構(gòu)模型如圖1所示:

圖1基于Web數(shù)據(jù)挖掘的個性化服務(wù)推薦系統(tǒng)結(jié)構(gòu)模型

數(shù)據(jù)收集模塊主要用于收集Web數(shù)據(jù)庫、使用日志等數(shù)據(jù),形成數(shù)據(jù)采集庫,為以后的挖掘做準(zhǔn)備;數(shù)據(jù)預(yù)處理模塊主要是對所收集的數(shù)據(jù)進行預(yù)處理,數(shù)據(jù)預(yù)處理的質(zhì)量與挖掘的效率和結(jié)果緊密相關(guān);數(shù)據(jù)存儲模塊將預(yù)處理后的數(shù)據(jù)存入用戶事務(wù)庫;離線挖掘模塊中的挖掘引擎使用挖掘算法庫中的數(shù)據(jù)挖掘技術(shù)如統(tǒng)計分析、關(guān)聯(lián)規(guī)則、聚類分析、序列模式等,來發(fā)現(xiàn)用戶瀏覽模式,并通過模式分析對其進行分析與解釋,根據(jù)實際應(yīng)用,通過觀察和選擇,把發(fā)現(xiàn)的統(tǒng)計結(jié)果、規(guī)則和模型轉(zhuǎn)換為知識,經(jīng)過篩選后得到有用的模式用來指導(dǎo)實際的電子商務(wù)行為;在線推薦模塊在Web服務(wù)器前端設(shè)置了推薦引擎,它將用戶當(dāng)前的瀏覽活動與瀏覽出的頁面推薦集結(jié)合起來考慮,生成相應(yīng)推薦集,然后在用戶最新請求的頁面上添加推薦集的頁面,再通過Web服務(wù)器傳遞到用戶端的瀏覽器,為用戶實現(xiàn)實時個性化服務(wù);同時將推薦結(jié)果送往網(wǎng)站管理中心,以便調(diào)整網(wǎng)站設(shè)計,優(yōu)化網(wǎng)站結(jié)構(gòu),提高網(wǎng)站效率。

總的來說,在個性化服務(wù)推薦系統(tǒng)中運用數(shù)據(jù)挖掘技術(shù)有兩個階段:第一個階段是學(xué)習(xí)階段,離線進行。第二個階段是模式的使用階段,在線進行。挖掘和在線推薦的特征獲取和規(guī)則生成是離線處理的,而當(dāng)用戶訪問該網(wǎng)站時通過在線推薦引擎進行在線服務(wù)。離線模塊和在線模塊相互聯(lián)系,在線模塊主要是利用離線模塊提供的規(guī)則模型對在線用戶推薦(推薦引擎);離線模塊主要是利用在線模塊積累的數(shù)據(jù)運用系統(tǒng)推薦算法形成相應(yīng)的規(guī)則。挖掘算法和推薦策略可以根據(jù)不同類型站點的要求來具體選擇,挖掘結(jié)果和推薦集通過推薦引擎反饋給用戶。電子商務(wù)網(wǎng)站的客戶登錄網(wǎng)站以后,其訪問信息將會被記錄到服務(wù)器端。這些數(shù)據(jù)將在經(jīng)過預(yù)處理后,在專用的數(shù)據(jù)挖掘模塊中,通過具體的挖掘算法和推薦策略來進行模式識別和模式分析。用戶訪問信息也會傳到推薦引擎,推薦引擎根據(jù)客戶的會員標(biāo)識,向挖掘模塊抽取對應(yīng)客戶的挖掘結(jié)果和推薦集,將其可視化地反饋給用戶,達(dá)到個性化服務(wù)的目的。

3.5基于Web的數(shù)據(jù)挖掘在商業(yè)信用評估中的應(yīng)用

發(fā)達(dá)的社會信用水平是發(fā)展電子商務(wù)的重要基礎(chǔ),通過Web數(shù)據(jù)挖掘?qū)φ军c數(shù)據(jù)統(tǒng)計和歷史記錄之間的差別,結(jié)果與期望值的偏離以及反常實例進行充分的分析,可以有效地防范投資和經(jīng)營風(fēng)險。另外,通過數(shù)據(jù)挖掘技術(shù)對企業(yè)經(jīng)營進行跟蹤,開展企業(yè)的資產(chǎn)評估、利潤收益分析和發(fā)展?jié)摿︻A(yù)測,構(gòu)建完善的安全保障體系,實施網(wǎng)上全程監(jiān)控,監(jiān)督網(wǎng)上言論,維護企業(yè)信譽,強化網(wǎng)上交易和在線支付的安全管理,利用數(shù)據(jù)挖掘的信用評估模型,對交易歷史數(shù)據(jù)進行挖掘發(fā)現(xiàn)客戶的交易數(shù)據(jù)特征,建立客戶信譽度級別,有效地防范和化解信用風(fēng)險,提高企業(yè)信用甄別與風(fēng)險管理的水平和能力。

4結(jié)論

本文對Web挖掘技術(shù)進行了綜述,介紹了其在電子商務(wù)中的典型應(yīng)用。Web數(shù)據(jù)挖掘高度自動化地對電子商務(wù)中的大量信息進行分析和推理,從中挖掘出潛在的模式,預(yù)測客戶行為,幫助企業(yè)的決策者調(diào)整市場策略,減少風(fēng)險,做出正確的決策。Web數(shù)據(jù)挖掘是近幾年來數(shù)據(jù)挖掘領(lǐng)域的探討熱點,利用它的技術(shù)知識將它運用到電子商務(wù),將會解決許多實際問題,具有豐富的學(xué)術(shù)價值。將Web數(shù)據(jù)挖掘技術(shù)和電子商務(wù)兩者有機結(jié)合,將會為企業(yè)更有效的確認(rèn)目標(biāo)市場,改進決策,獲得競爭優(yōu)勢提供幫助,有著很廣闊的應(yīng)用前景,使電子商務(wù)網(wǎng)站更具有競爭力,從而為企業(yè)帶來更多的效益。面向電子商務(wù)的Web數(shù)據(jù)挖掘能發(fā)現(xiàn)大量數(shù)據(jù)背后隱藏的知識,指導(dǎo)商家提高銷售額,改善企業(yè)客戶關(guān)系,提高網(wǎng)站運行效率,改進系統(tǒng)性能,具有良好的發(fā)展和應(yīng)用前景,必將得到越來越多的關(guān)注。

參考文獻:

[1]毛國君.數(shù)據(jù)挖掘原理與算法[M].清華大學(xué)出版社.2005(07).

[2]張冬青.數(shù)據(jù)挖掘在電子商務(wù)中應(yīng)用問題研究[J].現(xiàn)代情報.2005(09).

[3]李鳳慧.面向電子商務(wù)的Web數(shù)據(jù)挖據(jù)的研究[D].山東科技大學(xué)碩士學(xué)位論文.2004(06).

[4]楊風(fēng)召,白慧.異常檢測技術(shù)及其在電子商務(wù)中的應(yīng)用[J].情報雜志.2005(12).

第4篇

摘要:文章探討高校圖書館開展文獻計量服務(wù)的基礎(chǔ)、內(nèi)容、模式及業(yè)務(wù)框架,提出文獻計量服務(wù)作為拓展延伸圖書館服務(wù)的新生長點,能夠很好地適應(yīng)當(dāng)前高校及其科研工作者的需求,是圖書館轉(zhuǎn)變其職能角色,構(gòu)建主導(dǎo)型服務(wù)模式的重要途徑,是實現(xiàn)高校圖書館可持續(xù)發(fā)展的需要。

中圖分類號:G251.5文獻標(biāo)識碼:A文章編號:1003-1588(2015)03-0113-03

服務(wù)是圖書館永恒的主題,程煥文提出圖書館精神為“智慧與服務(wù)”[1]。2008年孫浩在論文《關(guān)于文獻計量服務(wù)的研究》首次提出文獻計量服務(wù)(Bibliometric Service)的概念以及相關(guān)理論。文獻計量服務(wù)工作是促進知識生產(chǎn)的配套措施,是采用數(shù)學(xué)分析工具和計算機技術(shù)對各類文獻計量特征進行統(tǒng)計分析,從而發(fā)現(xiàn)文獻情報規(guī)律、文獻管理方法以及學(xué)科發(fā)展趨勢的情報服務(wù)工作,向讀者和社會提供全方位的文獻分布藍(lán)圖[2]。文獻計量服務(wù)理念恰好符合圖書館智慧服務(wù)的精神,迎合了圖書館深層次、學(xué)科化服務(wù)的理念,作為拓展延伸高校圖書館科研支持服務(wù)的新生長點,在一定程度上能夠很好地適應(yīng)當(dāng)前高校及其科研工作者的信息需求,為圖書館轉(zhuǎn)變職能角色以及深化學(xué)科服務(wù)提供了切實可行的理論、方法和途徑。

1開展文獻計量服務(wù)工作的基礎(chǔ)

隨著網(wǎng)絡(luò)信息技術(shù)的飛速發(fā)展以及全面的數(shù)據(jù)庫資源的開發(fā),分析型數(shù)據(jù)庫也隨之出現(xiàn),其中比較著名的有SCI、SSCI、ESI、CSSCI、EI、Scopus、Incites等,這些數(shù)據(jù)庫可以為文獻計量服務(wù)提供全面而可靠的統(tǒng)計源,即硬件條件。文獻計量服務(wù)要求圖書館員掌握一定量的數(shù)學(xué)分析工具和計算機技術(shù)方法來對各種類型的文獻計量特征進行統(tǒng)計分析,這項工作具有很強的知識性與技術(shù)性。高校圖書館近年來引進大量高素質(zhì)高水平人才,其中包含一批既具有學(xué)科背景又有圖書情報專業(yè)知識的全能型館員,雖然目前他們暫時分布在各個業(yè)務(wù)部門,但經(jīng)過專業(yè)訓(xùn)練,就會形成一支能夠開展文獻計量服務(wù)的隊伍,因此目前高校圖書館已經(jīng)具備開展文獻計量服務(wù)的技術(shù)保障與人員力量,這為文獻計量服務(wù)工作的開展奠定了堅實的基礎(chǔ)。

2文獻計量服務(wù)的內(nèi)容

文獻計量服務(wù)是使用文獻計量(信息計量)分析方法和工具,通過一定的情報分析和文獻數(shù)據(jù)挖掘技巧,對文獻進行深層次的加工,技術(shù)含量較高,屬于高層次的知識服務(wù)工作。在高校開展文獻計量服務(wù),通過對各類文獻計量特征進行統(tǒng)計與分析,從而發(fā)現(xiàn)文獻情報規(guī)律、文獻管理方法以及學(xué)科發(fā)展趨勢,達(dá)到對研究機構(gòu)、科研工作者或?qū)W科科研競爭力以及學(xué)科發(fā)展態(tài)勢發(fā)展?fàn)顩r等進行客觀評估及分析[3],以評估科研績效和檢測科研發(fā)展態(tài)勢,從而輔助科研管理者進行科研決策,包括學(xué)校人才的整體狀況分析以及各學(xué)科師資力量的分布、科研課題的申報與獎勵,科研基金分配、成果獎勵、人才選拔與引進等。輔助研究者的科學(xué)研究包括分析本學(xué)科的發(fā)展態(tài)勢、個人的科研業(yè)績以及在同行中的競爭優(yōu)勢、研究前沿、趨勢、引領(lǐng)學(xué)科發(fā)展等。具體可以通過對學(xué)術(shù)期刊、文獻的統(tǒng)計分析,了解研究機構(gòu)分布、學(xué)科的成長階段判斷、發(fā)展趨勢預(yù)測等,以此作為評價學(xué)科發(fā)展的依據(jù)。通過對科研能力、優(yōu)勢學(xué)科分布、發(fā)展?fàn)顩r、人力資源狀況、科研效率等進行統(tǒng)計分析,可以對學(xué)術(shù)機構(gòu)進行評價。還可以通過某一著者的科研論文及專著發(fā)表情況、研究領(lǐng)域與專長、學(xué)術(shù)貢獻、科研潛在能力等進行著者評價。文獻計量服務(wù)在很大程度上是以大型分析數(shù)據(jù)庫作為依據(jù),主要以科研論文作為學(xué)科分析與評價統(tǒng)計源,具體的基于論文數(shù)據(jù)平臺的學(xué)科分析見表1。表1學(xué)科分析常用論文數(shù)據(jù)庫平臺

數(shù)據(jù)庫名稱評價指標(biāo)評價內(nèi)容評價維度ESI數(shù)據(jù)庫國際論文總量排名總體科研表現(xiàn)國際論文總被引排名總體學(xué)科影響力學(xué)科綜合實力Incites數(shù)據(jù)庫WOS數(shù)據(jù)平臺論文占全球的比例科研活躍度論文總被引占全球的比例科研影響力學(xué)科H指數(shù)學(xué)術(shù)綜合實力學(xué)術(shù)影響力Incites數(shù)據(jù)庫ESI數(shù)據(jù)庫WOS數(shù)據(jù)平臺篇均被引的全球均值比科研平均質(zhì)量ESI高被引論文或熱點論文比例科研前沿性頂級期刊論文的國際份額同行認(rèn)可度基金項目的論文質(zhì)量項目完成質(zhì)量學(xué)術(shù)質(zhì)量Incites數(shù)據(jù)庫國際合作論文占全球的比例國際科研合作國際會議論文占全球的比例國際學(xué)術(shù)交流國際合作與交流WOS數(shù)據(jù)平臺跨院系的合作論文比例學(xué)科交叉活躍度跨院系的合作論文的學(xué)科分布學(xué)科交叉的聚度跨院系的合作論文的期刊及被引學(xué)科交叉的質(zhì)量學(xué)科交叉王芳,龐德盛,楊錯:高校圖書館開展文獻計量服務(wù)的探索與思考王芳,龐德盛,楊錯:高校圖書館開展文獻計量服務(wù)的探索與思考學(xué)校的職能部門即科研管理者和科研機構(gòu)及科研工作者對文獻計量服務(wù)的關(guān)注側(cè)重點各有不同,因此文獻計量服務(wù)針對不同的對象采取不同的服務(wù)內(nèi)容,這樣服務(wù)才更合理、更具針對性。

3文獻計量服務(wù)的模式

根據(jù)文獻計量服務(wù)的特點,將服務(wù)模式分為兩種,主動推送和用戶個性化定制。主動推送就是定期通過微博、微信、圖書館主頁、簡報等平臺主動推送服務(wù)產(chǎn)品,或通過培訓(xùn)講座、問卷調(diào)查、讀者沙龍等形式讓大家充分了解圖書館館員所做的工作及其價值,特別是工作開展初期,在用戶對文獻計量服務(wù)不了解的情況下,這種模式可以讓用戶了解文獻計量服務(wù)人員所能做的科研服務(wù)內(nèi)容及服務(wù)價值。圖書館可以提供個性化服務(wù),年齡在40歲以上的副教授和教授由于在業(yè)界已經(jīng)有了一定名譽和地位,可以對他們進行團隊學(xué)術(shù)影響力的分析(包括團隊科研成果的產(chǎn)出情況、被引用情況及影響力、H指數(shù)以及與其他團隊合作情況進行分析),同時也關(guān)注教授個人在全球、國內(nèi)、同行中的位置,如某教授本人的科研狀況分析,某教授科研論文發(fā)文量和被引情況分析。而對于剛進入科研領(lǐng)域的年輕教師,文獻計量服務(wù)就要重點關(guān)注學(xué)者個人學(xué)術(shù)影響力的分析和所在學(xué)科領(lǐng)域的發(fā)展態(tài)勢,還可以對教師本人在本學(xué)科領(lǐng)域的成就和影響力進行分析評價。文獻計量服務(wù)的個性化科研分析,不僅有利于挖掘?qū)W科領(lǐng)域中堅力量和有潛力的科研人才,還可以挖掘某一領(lǐng)域的知識淵源、演進脈絡(luò)、熱點研究等內(nèi)容。通過對高校及其內(nèi)部的各種計量對象進行統(tǒng)計分析,可以為高校管理者的科研決策提供參考。

4文獻計量服務(wù)的業(yè)務(wù)框架

通過分析文獻計量服務(wù)的對象、模式及核心業(yè)務(wù)流程,并將這些流程與服務(wù)業(yè)務(wù)框架有機融合在一起,初步建立起文獻計量服務(wù)的業(yè)務(wù)框架。文獻計量服務(wù)工作首先要確定服務(wù)對象的層次進而選擇相應(yīng)的服務(wù)模式,然后找出與之相匹配的服務(wù)方法,再根據(jù)文獻計量服務(wù)的核心業(yè)務(wù)流程進行有效文獻計量產(chǎn)品的創(chuàng)造,最后綜合反饋的結(jié)果,進行數(shù)據(jù)的綜合分析,形成最終的文獻計量服務(wù)報告。

5討論

5.1文獻計量服務(wù)是圖書館構(gòu)建主導(dǎo)型服務(wù)模式的途徑

近年來,隨著圖書情報事業(yè)外部發(fā)展環(huán)境的不斷變化以及圖書情報學(xué)新理論、新思想的不斷呈現(xiàn),圖情專家開始從廣義的服務(wù)視角,思索探討發(fā)揮圖書情報機構(gòu)的文獻計量功能。高校圖書館新時期提升工作水平的一個重要突破口就是著力強化決策服務(wù)功能,顯著提升參考咨詢工作水平。高校圖書館特別是研究型高校圖書館擁有豐富的文獻信息資源優(yōu)勢,又集合了專業(yè)學(xué)科館員力量,大多具有調(diào)研課題的成功經(jīng)驗,完全有條件建立文獻計量服務(wù)部門。圖書館應(yīng)加快情報服務(wù)水平的提升,提供與教學(xué)科研相關(guān)的信息和情報研究產(chǎn)品,構(gòu)建主導(dǎo)型服務(wù)模式。

5.2文獻計量服務(wù)是實現(xiàn)高校圖書館可持續(xù)發(fā)展的選擇

將文獻計量服務(wù)理念引入高校圖書館,更好地實現(xiàn)智慧服務(wù),不僅可以提高圖書館對高校教學(xué)和科研的影響力,而且可以為圖書館尋求和發(fā)展服務(wù)新的生長點提供有力支持。隨著現(xiàn)代信息技術(shù)的不斷發(fā)展,圖書館情報學(xué)的技術(shù)含量也相應(yīng)地提高,賦予其全新內(nèi)涵,可以說,加強并大力發(fā)展圖書情報領(lǐng)域?qū)W科化服務(wù)必然成為高校圖書館可持續(xù)發(fā)展的要求。文獻計量服務(wù)為高校圖書館在大學(xué)中的角色轉(zhuǎn)變打開一扇新的大門,使圖書館參與到高校的科研發(fā)展、政策制定和學(xué)科引領(lǐng)之中,轉(zhuǎn)變其在高校發(fā)展中的邊緣角色。通過創(chuàng)新服務(wù),真正迎合用戶科研支持服務(wù)需求,探索有效的文獻計量服務(wù)模式,建立可持續(xù)發(fā)展的長效服務(wù)機制,真正實現(xiàn)圖書館服務(wù)的不可替代性,實現(xiàn)高校圖書館的可持續(xù)發(fā)展[5]。

5.3文獻計量服務(wù)是高校發(fā)展的需要

學(xué)科建設(shè)是高等院校提高教學(xué)質(zhì)量和科研水平的重要基礎(chǔ),而學(xué)科發(fā)展策略的制定首先需要對自身的學(xué)科發(fā)展情況進行客觀準(zhǔn)確的評估和分析,進而合理地完善自身的學(xué)科體系、加強重點學(xué)科的優(yōu)勢。國內(nèi)外高校也越來越重視通過各種類型的學(xué)科評估把握自身的學(xué)科發(fā)展態(tài)勢、本學(xué)科的優(yōu)勢和劣勢、重點研究方向、資源分配方案等,從而對高校的學(xué)科發(fā)展戰(zhàn)略提供重要依據(jù)和指導(dǎo)意義。通過文獻計量和相關(guān)統(tǒng)計數(shù)據(jù)的分析能幫助科研人員很好地判斷出某一學(xué)科的發(fā)展現(xiàn)狀、發(fā)展趨勢及潛力,同時也能在一定程度上判斷出科研人員的科研能力、學(xué)術(shù)水平及影響力。隨著文獻計量理論研究和應(yīng)用的不斷深入,適時在高校圖書館推出文獻計量服務(wù)模式是一種必然趨勢。在信息化大環(huán)境下,面對新的機遇和挑戰(zhàn),高校圖書館必須積極分析自己的優(yōu)勢并加以充分利用與發(fā)揮,提升圖書館的軟實力。

參考文獻:

[1]程煥文.實在的圖書館精神與圖書館精神的實在――《圖書館精神》自序[J].大學(xué)圖書館學(xué)報,2006(4):2-14.

[2]孫浩.關(guān)于文獻計量服務(wù)的研究[J].現(xiàn)代情報,2008(6):64-66.

[3]孫玉偉,劉昌榮,朱玉強.大學(xué)圖書館文獻計量服務(wù)實踐探索[J].圖書館雜志,2014(1):56-61.

[4]孫玉偉.面向科研決策的信息服務(wù)框架探析[J].情報雜志,2013(6):167-171.

第5篇

關(guān)鍵詞:軟件工程;面向數(shù)據(jù)的軟件工程;面向數(shù)據(jù)的體系結(jié)構(gòu)

一、軟件工程的發(fā)展歷程和研究現(xiàn)狀

軟件工程這一術(shù)語,是在上世紀(jì)70年代末在一次會議上被提出來的,其設(shè)立的目的就是為了規(guī)范整個軟件行業(yè),從而進一步促進軟件行業(yè)的經(jīng)濟效益,節(jié)約了大量的人力物力成本。現(xiàn)在公認(rèn)的軟件工程的發(fā)展歷史包含以下四個時期。首先誕生的是面向過程的軟件工程。這一階段主要是采用結(jié)構(gòu)化的方法,對軟件整個生命周期的過程進行設(shè)計、優(yōu)化和測試[1]。隨著技術(shù)的發(fā)展,研究也在不斷推進,面向?qū)ο蟮能浖こ桃脖惶岢觯渲饕菍γ嫦驅(qū)ο筮M行分析、設(shè)計、編碼、測試和軟件的后期維護等等,在當(dāng)時這一理念比較先進,所以其很快被廣大從業(yè)者接受,并且推廣開來。但是面向?qū)ο蟮能浖こ倘圆荒芎芎玫亟鉀Q軟件在使用當(dāng)中存在復(fù)用性低這一問題,因此有人提出了采用組件技術(shù)對軟件工程進行進行優(yōu)化,經(jīng)過實踐證明這一技術(shù)確實能夠提高復(fù)用率,降低軟件開發(fā)過程中的經(jīng)濟成本。而后隨著軟硬件技術(shù)的提高,經(jīng)濟的發(fā)展,用戶的商業(yè)需求也越來越高,軟件開發(fā)者提出了面向服務(wù)的軟件工程。時至今日,整個軟件開發(fā)行業(yè)仍是以面向服務(wù)的軟件開發(fā)為主導(dǎo)[2]。可是科技的發(fā)展不會一直止步不前,軟件工程也一樣,隨著這些年大數(shù)據(jù)、云計算思潮的影響,很多學(xué)者開始構(gòu)思能不能開發(fā)出一種基于大數(shù)據(jù)的軟件工程。現(xiàn)在國內(nèi)外已經(jīng)有不少的學(xué)者提出了設(shè)計理念和相關(guān)模型,例如:我國學(xué)者何克清就詳細(xì)分析了大數(shù)據(jù)影響下的軟件工程的研究方向和一些關(guān)鍵技術(shù)。可是這一思想在現(xiàn)實的軟件工程中還沒有大范圍的應(yīng)用起來。因為其存在兩個主要缺點:(1)現(xiàn)在的數(shù)據(jù)不僅形勢復(fù)雜,而且增長速率也十分迅速,不僅包含著數(shù)據(jù),還包含數(shù)據(jù)集[3]。因此在數(shù)據(jù)的儲存、管理、分析和挖掘方面,相關(guān)的信息技術(shù)和軟件技術(shù)更是難以招架。而且隨著社會變革的加快,用戶理念也在不斷的轉(zhuǎn)變之中,這就為整個軟件的開發(fā)過程帶來了更多的問題。(2)當(dāng)下的軟件開發(fā)方法存在一定的缺陷,例如開發(fā)復(fù)雜、生命周期短、維護難等問題導(dǎo)致軟件成本高。

二、面向數(shù)據(jù)的軟件工程的內(nèi)涵和優(yōu)勢

面向數(shù)據(jù)的軟件工程是基于面向數(shù)據(jù)的結(jié)構(gòu)體系,然后對軟件進行開發(fā)。以數(shù)據(jù)為核心是此類體系的最大特點。整個體系結(jié)構(gòu)以數(shù)據(jù)生態(tài)系統(tǒng)為基礎(chǔ),構(gòu)建的軟件體系能夠包含整個數(shù)據(jù)的生命過程,從保護到授權(quán)。相比較現(xiàn)在廣泛采用的面向服務(wù)的軟件工程來說其主要存在以下幾個優(yōu)點:(1)兩者核心不同。一個是以數(shù)據(jù)為核心,具有一定的邏輯性,被數(shù)據(jù)驅(qū)動,可以根據(jù)用戶的具體需求來進行具體的服務(wù)。一個是以服務(wù)為核心,是典型的通過模型來驅(qū)動的,整個過程中服務(wù)不僅可以被發(fā)現(xiàn)而且是無狀態(tài)的[4]。(2)面向數(shù)據(jù)的體系結(jié)構(gòu)在數(shù)據(jù)管理方面有著明顯的優(yōu)勢,能夠通過數(shù)據(jù)注冊中心對數(shù)據(jù)完成有效管理、挖掘和分析,并且能夠在不同結(jié)構(gòu)的系統(tǒng)中實現(xiàn)信息的分享,其相較于當(dāng)下主流的軟件開發(fā)方式可以有效地解決信息數(shù)據(jù)的管理問題。(3)這兩種軟件工程所采用的軟件開發(fā)方式都能夠有效地提高軟件的復(fù)用率。以數(shù)據(jù)為基礎(chǔ)的軟件能夠滿足不同用戶的需求,追求用戶個人體驗的滿足,但是以服務(wù)為基礎(chǔ)的軟件開發(fā)方法卻受限于服務(wù)重用這一缺陷,沒法追求個性化定制。(4)這種面向數(shù)據(jù)的軟件工程能夠在數(shù)據(jù)未被使用時對數(shù)據(jù)進行加密保護,能夠在一定程度上對數(shù)據(jù)安全進行保護,提高軟件的安全性能。

三、結(jié)語

目前已經(jīng)有研究人員提出了面向數(shù)據(jù)的軟件工程的具體方法,例如徐良在2014年設(shè)計的畢設(shè)管理系統(tǒng)就是采用了此類思想。清華大學(xué)的張桂剛教授就提出了一種以現(xiàn)有的軟件工程為基礎(chǔ)的大數(shù)據(jù)軟件開發(fā)過程和相關(guān)編程語言,最后還提出了軟件的設(shè)計模型。相信隨著研究的進一步深入,研究人員會更加深入的推進這個方向的發(fā)展。

參考文獻

[1]王雅怡.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析[J].科技與創(chuàng)新,2018,08:155-156.

[2]宋陽.基于物聯(lián)網(wǎng)和云技術(shù)的軟件工程實驗室架構(gòu)設(shè)計[J].軟件開發(fā),2018,04:48-49.

第6篇

關(guān)鍵詞:大數(shù)據(jù);發(fā)展脈絡(luò);營銷趨勢;研究評析

一、問題的提出

云計算、移動互聯(lián)網(wǎng)等新信息技術(shù)的廣泛應(yīng)用及社會化網(wǎng)絡(luò)的興起,使信息數(shù)據(jù)產(chǎn)生機制更復(fù)雜、傳播速度更快、類型更多樣,全球進入信息數(shù)據(jù)量“井噴式”增長的大數(shù)據(jù)時代。國際數(shù)據(jù)公司(In原ternationalDataCorporation,IDC)指出:全球創(chuàng)建和復(fù)制的數(shù)據(jù)量五年內(nèi)增長近九倍,預(yù)計將以每兩年至少翻一番的速度繼續(xù)增長。僅2013年,世界范圍存儲的數(shù)據(jù)就達(dá)1.2ZB(1ZB抑1021B),將這些數(shù)據(jù)刻錄到CDR只讀光盤并堆起,其高度將是地球到月球距離的五倍[1]。生產(chǎn)和信息方式的變革引起管理規(guī)范及其深層次上價值觀的轉(zhuǎn)變。傳統(tǒng)企業(yè)營銷中,為避免無法獲取整體數(shù)據(jù)的弊端,多依據(jù)小樣本采樣統(tǒng)計推斷以形成所謂“科學(xué)決策”。然而采樣分析的成功取決于樣本的絕對隨機性,大數(shù)據(jù)時代,營銷調(diào)研建立在對大樣本持續(xù)收集數(shù)據(jù)的基礎(chǔ)上,實時分析和輸出調(diào)查結(jié)果將為營銷決策提供及時判斷臨界值。在大數(shù)據(jù)背景下對營銷活動進行研究,具有聚焦數(shù)據(jù),提高營銷決策科學(xué)性;強調(diào)洞察,增強營銷活動“預(yù)見性”;重視創(chuàng)新,增強營銷理論“前瞻性”等研究價值[2]。特別是中國具有眾多人口和龐大市場,也使中國成為最為復(fù)雜的大數(shù)據(jù)國家之一。那么,大數(shù)據(jù)對營銷活動究竟會產(chǎn)生怎樣的影響?其內(nèi)在機理是什么?通過文獻綜述,對大數(shù)據(jù)概念進行界定,梳理其發(fā)展的歷史脈絡(luò),在此基礎(chǔ)上分析大數(shù)據(jù)對消費者行為、營銷決策模式、營銷戰(zhàn)略、營銷要素等的影響表征及其機理,最后對大數(shù)據(jù)的營銷應(yīng)用研究做出述評。

二、大數(shù)據(jù)的發(fā)展脈絡(luò)及概念界定

(一)大數(shù)據(jù)的發(fā)展脈絡(luò)

大數(shù)據(jù)的概念最早要追溯到上世紀(jì),只是在互聯(lián)網(wǎng)時代,大數(shù)據(jù)才從規(guī)模、類型等方面得以實現(xiàn)。早在1981年,美國著名未來學(xué)家Toffler在其著作《TheThirdWave》中,提及“大數(shù)據(jù)”,并稱之為“第三浪潮的華章”[3]。2001年,META集團(現(xiàn)為Gartner)的分析師Laney指出數(shù)據(jù)增長帶來規(guī)模性(Volume)、高速性(Velocity)、多樣性(Variety)等變化[4]。《Nature》則在2008年9月開設(shè)“BigData”專刊[5-7],同時《Sci原ence》也推出數(shù)據(jù)處理研究專刊“DealingWithDa原ta”,對數(shù)據(jù)洪流(DataDeluge)所帶來的社會變革及影響做出討論[8]。大數(shù)據(jù)研究的開創(chuàng)性論文是Gins原bergetal(2009)的“DetectingInfluenzaEpidemicsUsingSearchEngineQueryData”,該文探討了如何利用谷歌搜索引擎查詢詞來預(yù)測流行病[9]。只是在最近幾年,大數(shù)據(jù)才成為高頻詞。2011年5月,麥肯錫公司《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一前沿》報告,指出“在數(shù)據(jù)滲透于各領(lǐng)域并成為生產(chǎn)要素的背景下,對海量數(shù)據(jù)挖掘應(yīng)用,將帶來新的生產(chǎn)增長和消費者盈余浪潮”[10]。2012年3月,美國開始實施“大數(shù)據(jù)研發(fā)計劃(BigDataRe原searchandDevelopmentInitiative)”,將大數(shù)據(jù)喻為“未來新石油”,并視為與互聯(lián)網(wǎng)、超級計算機同等重要的國家戰(zhàn)略,這也是美國在“信息高速公路”計劃后所實施的又一國家級重大科技戰(zhàn)略。日本緊隨其后,推出“新ICT戰(zhàn)略研究計劃”。同年,世界經(jīng)濟論壇《大數(shù)據(jù)、大影響》報告,從多個行業(yè)領(lǐng)域闡述大數(shù)據(jù)給世界經(jīng)濟帶來的發(fā)展機會[11]。就國內(nèi)而言,2011年12月,國金證券開創(chuàng)國內(nèi)大數(shù)據(jù)研究先河,將其研究成果引入資本市場[12]。2012年5月,香山科學(xué)會議組織“大數(shù)據(jù)科學(xué)與工程:一門新興的交叉學(xué)科”為論題的會議,同年6月,中國計算機學(xué)會青年計算機科技論壇(CCFYOC原SEF)舉辦“大數(shù)據(jù)時代,智謀未來”會議,對大數(shù)據(jù)挖掘技術(shù)、組織架構(gòu)、平臺治理等展開探討。2013年6月,國家自然科學(xué)基金委管理科學(xué)部、美國營銷科學(xué)學(xué)會(MSI)、南京大學(xué)商學(xué)院(管理學(xué)院)和香港中文大學(xué)工商管理學(xué)院聯(lián)合主辦“2013營銷科學(xué)與應(yīng)用國際論壇”,也將“大數(shù)據(jù)、社會化、移動化對市場營銷的新挑戰(zhàn)”作為主要議題之一。2014年2月,北京銀行與小米科技就移動支付、便捷信貸、產(chǎn)品定制、渠道拓展等簽署協(xié)議,表明國內(nèi)企業(yè)運用大數(shù)據(jù)戰(zhàn)略進入實質(zhì)性階段。2014年3月5日,總理第一次把大數(shù)據(jù)寫進政府工作報告,闡明了國家對大數(shù)據(jù)產(chǎn)業(yè)鼎力支持的政策,隨后一系列公開講話進一步明確了這一戰(zhàn)略部署。2015年2月,百度公司利用百度遷徙、百度指數(shù)等大數(shù)據(jù)產(chǎn)品直觀地呈現(xiàn)了春運“景觀”,把大數(shù)據(jù)研究成果可視化地展示在電視屏幕上。2015年3月,政府工作報告中進一步提出“互聯(lián)網(wǎng)+”計劃,推動大數(shù)據(jù)與現(xiàn)代工業(yè)相結(jié)合。

(二)大數(shù)據(jù)的概念界定

大數(shù)據(jù)本身就是抽象的概念,當(dāng)前對其概念界定尚未達(dá)成統(tǒng)一,不同組織及學(xué)者給予不同的表述,見表1。盡管各方對大數(shù)據(jù)概念并不統(tǒng)一,但其中“大規(guī)模數(shù)據(jù)”“體量、復(fù)雜性及速度超越傳統(tǒng)數(shù)據(jù)”“超越現(xiàn)代技術(shù)手段處理能力”等觀點得到基本認(rèn)可。IBM公司及Laneyetal(2001)認(rèn)為大數(shù)據(jù)具有“3V”特征:規(guī)模性(Volume),數(shù)據(jù)量一般要達(dá)到TB級甚至PB級;多樣性(Variety),數(shù)據(jù)結(jié)構(gòu)類型包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);高速性(Ve原locity),產(chǎn)生、處理、分析數(shù)據(jù)的速度加快。國際數(shù)據(jù)公司(IDC)在此基礎(chǔ)上,增加“價值性(Value),即“大數(shù)據(jù)價值很大但呈現(xiàn)低密度性”的特點,從而形成大數(shù)據(jù)的“4V”特征[16]。而NetApp公司認(rèn)為大數(shù)據(jù)具有“ABC”三特征:大分析(BigAnalytic),通過對大數(shù)據(jù)實時分析構(gòu)建新的業(yè)務(wù)模式并更好地了解顧客需求;高帶寬(BigBandwidth),快速有效地對數(shù)據(jù)進行處理分析;大內(nèi)容(BigContent),包括各種類型數(shù)據(jù),同時對數(shù)據(jù)存儲、擴展、安全等管理的高要求[17]。

三、大數(shù)據(jù)對未來市場營銷的沖擊

根據(jù)(移動)互聯(lián)網(wǎng)時代大數(shù)據(jù)的特征、消費者行為變化及營銷模式的可能演變,通過相關(guān)文獻梳理,勾畫的大數(shù)據(jù)對未來營銷活動的影響趨勢,見圖1。

(一)大數(shù)據(jù)對消費行為的影響

1援消費行為更理性。工業(yè)化時代,信息不對稱的客觀存在,消費者易受各種如低價促銷、廣告宣傳等影響。而大數(shù)據(jù)時代,消費者有更多、更方便的途徑獲取更詳細(xì)的商品價格、成本、產(chǎn)地、質(zhì)量等信息,并可更方便地搜尋、比對和遴選,從而做出更理性的選擇[18]。2援消費行為冪律分布。大數(shù)據(jù)時代,消費者評價系統(tǒng)更廣泛,先前購物者的購后評價及經(jīng)驗對新消費者具有重要參考。相比先前購物者的好評,消費者則會更關(guān)注其差評,以便做出正確的消費決策。同類產(chǎn)品中,質(zhì)量好、價格有優(yōu)勢、服務(wù)好的產(chǎn)品受到越來越多的青睞,并不斷吸引新的消費者,形成“滾雪球式”的“馬太效應(yīng)”,消費行為呈現(xiàn)冪律分布。3援消費行為更個性化。工業(yè)化時代,商家追求規(guī)模經(jīng)濟的考慮,只能在有限范圍滿足消費者個性化消費。而大數(shù)據(jù)時代,信息廣泛并快速傳播,消費者的消費認(rèn)知及創(chuàng)造力大大提升,消費異質(zhì)性不斷增大,對產(chǎn)品或服務(wù)的關(guān)注并不僅限于以往的質(zhì)量、品牌、價格、售后等,更關(guān)注其個性化的滿足程度。

(二)大數(shù)據(jù)對營銷決策模式的影響

大數(shù)據(jù)時代,思維方式發(fā)生三個變革:其一,要分析與事務(wù)相關(guān)所有數(shù)據(jù)而不是少量數(shù)據(jù)所構(gòu)成的樣本;其二,要接受數(shù)據(jù)紛亂復(fù)雜的事實,而不能過于苛求精確;其三,更加主動地分析相關(guān)關(guān)系而不再探究難以捉摸的因果關(guān)系[19],可以說,數(shù)據(jù)驅(qū)動型決策(Data‐drivenDecisionMaking)是大數(shù)據(jù)背景下決策的特點[20],以“數(shù)據(jù)化、智能化、實時化垣經(jīng)驗”將成為大數(shù)據(jù)時代的營銷決策范式。1援?dāng)?shù)據(jù)決策技術(shù)升級,注重實時處理及相關(guān)分析。傳統(tǒng)分析多基于多元統(tǒng)計、計量經(jīng)濟學(xué)模型等方法,對大量一手和二手結(jié)構(gòu)化數(shù)據(jù)實施分析,從中尋求研究對象的內(nèi)在聯(lián)系,常用方法有:聚類分析、因子分析、相關(guān)分析、回歸分析、A/B測試、數(shù)據(jù)挖掘等。大數(shù)據(jù)背景下,數(shù)據(jù)規(guī)模大、傳遞速度快、非結(jié)構(gòu)化數(shù)據(jù)多等特點,使得傳統(tǒng)數(shù)據(jù)分析及數(shù)據(jù)庫管理手段很難適應(yīng)時代要求。數(shù)據(jù)產(chǎn)生及傳播速度加快,要求數(shù)據(jù)應(yīng)用實現(xiàn)從離線(Offline)向在線(On原line)的實時處理轉(zhuǎn)化[21]。數(shù)據(jù)關(guān)聯(lián)成為大數(shù)據(jù)的主要價值來源,但數(shù)據(jù)間交互廣、價值密度低、碎片化嚴(yán)重,也使決策重點從以往因果關(guān)系分析向相關(guān)關(guān)系分析轉(zhuǎn)變。2援決策參與主體向社會大眾傾斜,數(shù)據(jù)分析師地位加強。大數(shù)據(jù)使?fàn)I銷決策越來越依賴于數(shù)據(jù)分析而非經(jīng)驗或直覺[22],直覺判斷將被精準(zhǔn)的數(shù)據(jù)分析代替。管理者決策重心在于正確發(fā)現(xiàn)并提出問題,一線員工對決策參與度將大大提升,決策主體從社會精英向社會大眾傾斜,扁平化組織架構(gòu)、學(xué)習(xí)型企業(yè)文化將得到加強。同時,能綜合運用數(shù)據(jù)分析、分布式管理的數(shù)據(jù)分析師,將為企業(yè)營銷決策提供更多智力支持。

(三)大數(shù)據(jù)對營銷戰(zhàn)略的影響

1援激發(fā)協(xié)同營銷的競爭格局。大數(shù)據(jù)環(huán)境下企業(yè)與行業(yè)的邊界日趨模糊,營銷系統(tǒng)開放性更明顯。企業(yè)競爭不再局限于個體之間或供應(yīng)鏈的鏈條間,而是向多主體所構(gòu)建的商業(yè)生態(tài)系統(tǒng)間延伸[23]。企業(yè)營銷戰(zhàn)略的設(shè)計應(yīng)打破傳統(tǒng)的個體競爭思維,在不斷提升自身營銷網(wǎng)絡(luò)化和動態(tài)化能力基礎(chǔ)上,利用外部資源,形成協(xié)同營銷格局。2援一對一營銷的精準(zhǔn)定位。大數(shù)據(jù)背景下,企業(yè)可以記錄消費者在產(chǎn)品各個生命周期階段的品牌偏好、口碑評價等行為數(shù)據(jù),基于社會學(xué)、心理學(xué)、營銷學(xué)、傳播學(xué)等相關(guān)理論,并借助數(shù)據(jù)挖掘、統(tǒng)計計量等,按一定的細(xì)分標(biāo)準(zhǔn)進行消費行為細(xì)分,從而結(jié)合自身資源優(yōu)勢,形成目標(biāo)市場的選擇和一對一營銷的精準(zhǔn)定位。

(四)大數(shù)據(jù)對營銷要素的影響

1援產(chǎn)品:顧客參與式的產(chǎn)品設(shè)計和個人定制。大數(shù)據(jù)背景下,虛擬企業(yè)和智能車間將會越來越多地被采用,顧客參與式的產(chǎn)品設(shè)計和個人定制將大行其道。那些市場價值在較短時間發(fā)生貶值的短生命周期產(chǎn)品的時效性更強、需求波動大,與外界存在著復(fù)雜非線性關(guān)系[24]。而長周期產(chǎn)品特別是其中生產(chǎn)工藝復(fù)雜、流程管理復(fù)雜、客戶需求復(fù)雜的復(fù)雜品(ComplicatedProduct)將實現(xiàn)供應(yīng)鏈縱向一體化整合及全生命周期數(shù)據(jù)整合[25]。“全息”生命周期的完整大數(shù)據(jù)可幫助企業(yè)構(gòu)建消費者興趣圖譜,從而應(yīng)用于營銷和新媒體關(guān)系定位中。2援渠道:渠道縮短及渠道多元化。大數(shù)據(jù)背景下,信息技術(shù)更為成熟,經(jīng)由中間商的渠道模式將讓位于直銷,渠道長度越來越短。特別是具有及時反饋交互關(guān)系平臺技術(shù)的實施,使企業(yè)可開發(fā)出更多、更便捷的渠道與顧客連接,實現(xiàn)多渠道及跨渠道營銷。諸如微商等“屏幕+手指+快遞”的購物方式,配合超低的價格,使?fàn)I銷渠道更趨多元化。3援價格:透明度更高,基于支付意愿的差異化定價。傳統(tǒng)營銷定價多從產(chǎn)品成本、利潤率、顧客接受度等簡單因素考慮,并依據(jù)先前相關(guān)銷售經(jīng)驗建立精算模型。大數(shù)據(jù)背景下,傳統(tǒng)精算模型將被顛覆,價格不對稱性有所改善,定價透明度越來越高,明智的價格策略是企業(yè)“陽光”定價,基于支付意愿的差異化定價將成為主導(dǎo),電子支付成為主流。4援促銷策略:促銷手段的數(shù)字化、互動化趨勢。大數(shù)據(jù)背景下,傳統(tǒng)電視、報紙、廣播等大眾傳媒的傳播效率不斷下降,而建立在數(shù)據(jù)庫基礎(chǔ)上的移動互聯(lián)網(wǎng)將成為促銷信息的重要傳播手段,促銷手段更具數(shù)字化。同時,促銷手段更新穎,目標(biāo)受眾被多元化數(shù)據(jù)鎖定,并特別強調(diào)與顧客間的互動和情感溝通。

四、大數(shù)據(jù)研究在營銷中的應(yīng)用評析

(一)研究層次:偏宏觀層面研究,輕微觀分析

當(dāng)前對大數(shù)據(jù)的相關(guān)研究,更多從宏觀層面對其概念內(nèi)涵、形成脈絡(luò)及其對社會所產(chǎn)生的影響方面展開描述,而對大數(shù)據(jù)所形成各種影響的內(nèi)在機理缺少必要的微觀分析。大數(shù)據(jù)為未來營銷帶來深刻影響,但機會和挑戰(zhàn)并存,其合理利用前提是必須擁有準(zhǔn)確、可靠、及時的高質(zhì)量的數(shù)據(jù)[26],只有在此基礎(chǔ)上,才能提煉出有效的營銷決策信息,才能幫助企業(yè)實現(xiàn)精準(zhǔn)定位。

(二)研究視角:多立足于信息科學(xué)視角,缺少管理視角

當(dāng)前,國外從管理學(xué)視角應(yīng)用大數(shù)據(jù)技術(shù)來支持管理決策已成為商科教育的熱點[27]。相比之下,國內(nèi)相關(guān)研究還處于起步階段,數(shù)據(jù)驅(qū)動決策的管理模式還有待形成,現(xiàn)有的相關(guān)研究則更多立足于對數(shù)據(jù)信息的采集、處理、檢索、挖掘及離線分析等信息科學(xué)視角。而只有立足管理決策的視角,探討大數(shù)據(jù)對現(xiàn)代經(jīng)濟組織的戰(zhàn)略定位、架構(gòu)設(shè)計、營銷實施等實時問題,才能真正發(fā)掘大數(shù)據(jù)的“資源”價值,建立起信息引導(dǎo)決策的機制。

(三)應(yīng)用范圍:國內(nèi)多理論研究,實踐廣度、深度不夠

第7篇

我從事計算語言學(xué)教學(xué)和研究已經(jīng)50多年,在這半個多世紀(jì)的漫長歲月中,針對計算語言學(xué)的跨學(xué)科性質(zhì),我在北京大學(xué)學(xué)習(xí)過語言學(xué),在中國科學(xué)技術(shù)大學(xué)研究生院學(xué)習(xí)過信息科學(xué),在法國格勒諾布爾理科醫(yī)科大學(xué)學(xué)習(xí)過數(shù)學(xué),前后花了將近20年的時間更新自己的知識,成為跨學(xué)科背景的計算語言學(xué)家。現(xiàn)在我們已經(jīng)進入了信息網(wǎng)絡(luò)時代,以自然語言信息處理作為研究目標(biāo)的計算語言學(xué)正越來越受到語言學(xué)家的關(guān)注。然而,由于大多數(shù)語言學(xué)家僅具有文科背景,他們對于計算語言學(xué)中涉及的數(shù)學(xué)知識和計算機知識了解不多,盡管他們懷著關(guān)注計算語言學(xué)的強烈愿望,可是一旦看到計算語言學(xué)的專業(yè)文獻、接觸到其中的數(shù)學(xué)和計算機方面的問題,往往望而生畏,敬而遠(yuǎn)之。他們精研通達(dá)的語言學(xué)知識,難以與數(shù)學(xué)知識和計算機知識融會貫通起來,這是十分可惜的!

我常常想,如果有計算語言學(xué)家能夠用一般語言學(xué)家可以理解的方式,深入淺出地闡述計算語言學(xué)的原理和方法,一定會吸引更多的語言學(xué)家參加到計算語言學(xué)的隊伍中,更好地推動我國計算語言學(xué)的教學(xué)和研究。

2004年我在英國伯明翰大學(xué)訪問時,在伯明翰市中心的一個書店里偶然發(fā)現(xiàn)了Ruslan Mitkov主編的《牛津計算語言學(xué)手冊》,很快就被它簡潔明了、深入淺出的寫作風(fēng)格吸引住了。我覺得這本書就是我多年來夢寐以求的深入淺出的計算語言學(xué)著作,非常適合文科背景的語言學(xué)家閱讀,決心把這本書引進到國內(nèi)來。

2005年回國之后,我馬上找到外語教學(xué)與研究出版社的朋友,向他們介紹這本書的價值。他們被我的誠意感動,很快就決定引進這本書,并且與牛津大學(xué)出版社商量,雙方一致同意合作在國內(nèi)出版。2009年9月,《牛津計算語言學(xué)手冊》正式在國內(nèi)發(fā)行。這是一件大快人心的好事!

本書由Ruslan Mitkov教授主編,收錄了包括語言學(xué)家、計算機專家和語言工程人員在內(nèi)的49位學(xué)者撰寫的38篇針對計算語言學(xué)主要領(lǐng)域的綜述性文章,各章的寫作風(fēng)格力求一致,使得全書前后關(guān)聯(lián)、渾然一體、可讀性強。《牛津計算語言學(xué)手冊》內(nèi)容豐富、深入淺出,全面地反映了國外計算語言學(xué)的最新成果,是我們了解國外計算語言學(xué)發(fā)展動向的一個窗口,正好滿足了我國語言學(xué)界學(xué)習(xí)和了解國外計算語言學(xué)的研究成果和最新動態(tài)的要求。

本書主編Ruslan Mitkov是計算語言學(xué)家及語言工程專家,畢業(yè)于德國德累斯頓大學(xué)(Dresden University),現(xiàn)為英國伍爾弗漢普頓大學(xué)(University of Wolverhampton)教授。他的研究興趣是回指消解、機器翻譯和自動索引,曾于2002年出版過名為《回指消解》(Anaphora Resolution)的專著。著名計算語言學(xué)家Martin Kay(馬丁?凱伊)為本書作序。Martin Kay是美國斯坦福大學(xué)語言學(xué)教授,曾任計算語言學(xué)會主席、國際計算語言學(xué)委員會主席,是國際計算語言學(xué)界的領(lǐng)軍人物。

二、內(nèi)容簡介

本書內(nèi)容分三大部分:1.與計算語言學(xué)有關(guān)的語言學(xué)基礎(chǔ)理論(1~9章);2.計算語言學(xué)中自然語言的處理、方法與資源(10~26章);3.計算語言學(xué)的應(yīng)用(27~38章),幾乎涵蓋了計算語言學(xué)的所有領(lǐng)域。書末有按照字母順序編排的計算語言學(xué)術(shù)語表,每個術(shù)語均有簡要的定義和解釋,便于讀者查詢。下面分別介紹各章的內(nèi)容。

第1章“音系學(xué)”(phonology)介紹了描寫音系學(xué)和計算音系學(xué)的基本知識,著重介紹了非線性音系學(xué)中的有限狀態(tài)模型、音位的特征-值矩陣描述方法以及音系學(xué)研究中的計算工具。

第2章“形態(tài)學(xué)”(morphology)介紹了諸如語素、詞、屈折、派生等形態(tài)學(xué)的基本知識,分析了形態(tài)學(xué)對于音系學(xué)的影響,著重介紹計算形態(tài)學(xué)中的有限狀態(tài)分析方法,并介紹了雙層形態(tài)學(xué)和雙層規(guī)則的形式化描述方法。最后介紹了結(jié)構(gòu)段形態(tài)學(xué)。

第3章“詞典學(xué)”(lexicography)首先簡要地回顧了詞典學(xué)的發(fā)展歷史,接著討論了人編詞典在計算機應(yīng)用中的不足,說明了計算詞典學(xué)對于傳統(tǒng)的詞典編纂技術(shù)提出的挑戰(zhàn)。本章著重討論了詞匯在計算語言學(xué)中的功能以及計算技術(shù)在詞典編纂中的作用;說明了計算技術(shù)改變了詞典編纂工作的面貌,為新型詞典的編纂提供了有力的技術(shù)手段。本章強調(diào)指出,計算機輔助的詞典編纂應(yīng)該成為今后詞典編纂工作的發(fā)展方向。

第4章“句法學(xué)”(syntax)首先列舉了一些有趣的句法現(xiàn)象,分析了這些現(xiàn)象在計算上的意義,接著介紹正則語法和有限狀態(tài)語法、上下文無關(guān)的短語結(jié)構(gòu)語法、轉(zhuǎn)換語法、擴充轉(zhuǎn)移網(wǎng)絡(luò)、各種基于約束的特征結(jié)構(gòu)語法(功能語法、詞匯功能語法、中心語驅(qū)動的短語結(jié)構(gòu)語法、PATR語法)。最后,介紹了兩種在語言學(xué)和計算上有意義的句法框架(廣義短語結(jié)構(gòu)語法、樹鄰接語法)。

第5章“語義學(xué)”(semantics)集中介紹了計算語義學(xué)的基本內(nèi)容。首先討論語義的表示問題,介紹了語義的高階邏輯(higher-order-logic)表示法和語義的特征值矩陣(Attribute-Value Matrix)表示法。其次討論句法語義接口,介紹了“并行對應(yīng)模型”(Parallel Correspondence Model,簡稱PCM);針對 Frege的“組成性原則”(principle of compositionality),介紹了“非組成性的語義學(xué)”。最后介紹了語義解釋的動態(tài)模型。

第6章“話語”(discourse)首先列舉了一些話語平面的現(xiàn)象,闡明“話語”研究的對象是句子之間的關(guān)聯(lián)問題,計算語言學(xué)中的話語研究要揭示句子之間關(guān)聯(lián)的機制。接著討論參照表示(referring expressions)和話語結(jié)構(gòu)(discourse structure),說明參照表示的工作原理和參照表示的選擇方法,并討論主題(theme)與述題(rheme)、話題(topic)與焦點(focus),以及預(yù)設(shè)(presupposition)、蘊含(implicature)等問題。最后討論“話語樹”(discourse tree),介紹了“修辭結(jié)構(gòu)理論”(rhetorical structure theory)和“中心理論”(centering theory)。

第7章“語用學(xué)和對話”(pragmatics and dialogue)討論語用學(xué)及其在計算機對話模型中的應(yīng)用。首先介紹言語行為(speech act)、言外語力(illocutionary force)、合作原則(cooperative principle,簡稱CP)、關(guān)聯(lián)(relevance)等語用學(xué)的基本概念,并且介紹了意圖(intention)、信念(belief)、知識(knowledge)和推論(inference)等與概念表達(dá)有關(guān)的問題。著重討論了計算語用學(xué)中的對話模型(dialogue model),說明了從話語行為到對話行為的計算機制,并介紹了對話的管理模型(dialogue management models)。

第8章“形式語法與形式語言”(formal grammars and languages)介紹形式語言理論的基本知識,分別論述了形式語法和自動機,把形式語法看成是語言的生成裝置,把自動機看成語言的識別裝置。為了便于文科背景的讀者理解本章的內(nèi)容,對于一些基本概念都給出了定義和實例;為了避免抽象的數(shù)學(xué)推理,對于一些基本的結(jié)論不在數(shù)學(xué)上加以證明。首先介紹了Chomsky的形式語法,給出了形式語法的Chomsky分類,分別討論了上下文無關(guān)語言(context-free languages)、線性和正則語言(linear and regular languages)、半線性語言(semilinear languages)、上下文有關(guān)語言(context-sensitive languages)、柔性上下文有關(guān)語言(mildly context-sensitive languages)。接著介紹自動機理論,分別討論了有限自動機(finite automata)、下推自動機(pushdown automata)、線性有界自動機(linear bounded automata)、圖靈機(Turing machine)。

第9章“計算復(fù)雜性”(complexity)介紹自然語言處理中的計算復(fù)雜性問題。首先介紹計算復(fù)雜性的度量方法和計算復(fù)雜性的類別,分別討論了多項式算法(Polynomial algorithm,簡稱P)和非確定多項式算法(Nondeterministic Polynomial algorithm,簡稱NP),并介紹了自然語言處理中關(guān)于“NP完全問題”(NP-complete problem)的一些研究。接著討論正則語言問題的計算復(fù)雜性,介紹了確定性(determinism)和非確定性(non-determinism)的概念、線性(linearity)和有限狀態(tài)特性(finite-stateness)的概念,說明了有限狀態(tài)方法的可應(yīng)用性。然后討論上下文無關(guān)語言的計算復(fù)雜性,介紹了基于搜索的上下文無關(guān)識別(search-based context-free recognition)、自頂向下識別(top-down recognition)、線性時間與空間中的確定性語法識別(deterministic grammar recognition in linear time and space)。最后討論了概率語法和啟發(fā)式搜索、并行處理和實際效用等問題,說明計算復(fù)雜性分析在理解自然語言的復(fù)雜性以及在建立實際的自然語言處理系統(tǒng)中的用途。

第10章“文本切分”(text segmentation)介紹兩方面的內(nèi)容:一方面是“詞例還原”(tokenization),一方面是“句子分離”(sentence splitting)。詞例還原的目標(biāo)是把文本中的單詞、標(biāo)點符號、數(shù)字、字母數(shù)字字符切分出來,以便進行進一步處理。本章分別介紹了單詞自動切分、縮寫切分(例如:“Mr.,Dr.,kg.”中的小黑點)、連字符處理(例如:“self-asessment,forty-two,F(xiàn)-16”中的連字符)的技術(shù),并且討論了漢語和日語等東方語言中有關(guān)“詞例還原”(也就是“切詞”)的特殊問題。句子分離的目標(biāo)是把文本中的句子分離出來,在很多自然語言處理系統(tǒng)中,都需要進行句子分離。本章介紹了基于規(guī)則的句子分離、基于統(tǒng)計的句子分離、非規(guī)范輸入文本中的句子分離等技術(shù)。

第11章“詞類標(biāo)注”(part-of-speech tagging)介紹了詞類標(biāo)注器(POS tagger)的設(shè)計技術(shù)以及兼類詞的排歧(disambiguation)方法。簡要回顧了詞類標(biāo)注發(fā)展的歷史,介紹了基于局部性手寫規(guī)則的詞類標(biāo)注器、基于n-元語法的詞類標(biāo)注器、基于隱馬爾科夫模型(Hidden Markov Models)的詞類標(biāo)注器、基于機器學(xué)習(xí)的詞類標(biāo)注器、基于全局性手寫規(guī)則的詞類標(biāo)注器、基于混合方法的詞類標(biāo)注器,重點介紹了手工排歧語法(handwritten disambiguation grammars)。

第12章“句法剖析”(parsing)介紹了自動句法剖析的基本概念和關(guān)鍵技術(shù)。句法剖析的深度因自然語言處理的具體要求的不同而不同,有淺層的句法剖析(shallow parsing),也有深層的句法剖析(deep parsing)。本章首先介紹了淺層句法剖析,這種剖析只要把句子剖析為語塊(chunks)就可以了。之后,介紹了依存剖析(dependency parsing)。在介紹上下文無關(guān)剖析(context-free parsing)時,比較詳細(xì)地討論了CYK算法、自底向上剖析、左角分析法、自底向上的活性線圖分析法(bottom-up active chart)。在介紹基于合一的剖析(unification-based parsing)時,討論了特征-值矩陣。剖析時可能得到若干個結(jié)果,因此,本章還討論了剖析結(jié)果的排歧問題。最后,討論了剖析算法準(zhǔn)確性的評測、剖析程序的效率以及剖析語法覆蓋面的度量方法等問題。

第13章“詞義排歧”(word-sense disambiguation,簡稱WSD)討論如何利用上下文來確定多義詞的準(zhǔn)確意義。首先介紹了在計算語言學(xué)研究早期所提出的WSD優(yōu)選語義學(xué)方法、詞專家剖析方法。這些方法由于缺乏可供使用的詞匯資源,出現(xiàn)了“知識獲取的瓶頸問題”(knowledge acquisition bottleneck)。這些問題由于大規(guī)模詞匯庫和知識庫的出現(xiàn)而得到緩解,又由于統(tǒng)計方法和機器學(xué)習(xí)方法的應(yīng)用而可以從語料庫中獲取精確的數(shù)據(jù)。近年來,在WSD中普遍使用基于詞典的方法、聯(lián)結(jié)主義方法(connectionist)、統(tǒng)計方法、機器學(xué)習(xí)方法,取得了很大的進步。最后討論WSD的評測,介紹了SENSEVAL的評測活動,并介紹WSD的一些實際應(yīng)用。

第14章“回指消解”(anaphora resolution)首先列舉了一些回指現(xiàn)象,說明了回指現(xiàn)象的各種變體。接著討論回指消解所需要的知識源、回指消解的過程、回指消解在自然語言處理中的應(yīng)用。最后回顧了回指消解研究的發(fā)展歷史和現(xiàn)狀,討論了今后回指消解研究中應(yīng)當(dāng)注意的問題。

第15章“自然語言生成”(natural language generation,簡稱NLG)介紹了自然語言生成研究的理論和實踐問題,力圖說明在人們的心智上以及在計算機中,語言究竟是怎樣產(chǎn)生出來的。自然語言生成是一個知識密集的問題,可以從語言學(xué)、認(rèn)知科學(xué)和社會學(xué)的角度來探討。可以把自然語言生成看成一個映射問題,也可以把它看成一個選擇問題,還可以把它看成一個規(guī)劃問題。自然語言生成可以分為四個問題:宏觀規(guī)劃(macroplanning)、微觀規(guī)劃(microplanning)、表層實現(xiàn)(surface realization)、物理表達(dá)(physical presentation)。對于宏觀規(guī)劃,介紹了說話內(nèi)容的規(guī)劃、文本的規(guī)劃,以及使用修辭結(jié)構(gòu)理論的規(guī)劃方法;對于微觀規(guī)劃,著重介紹了詞匯生成的問題。最后介紹了表層生成的技術(shù)。

第16章“語音識別”(speech recognition)研究如何把作為聲學(xué)信號的聲波轉(zhuǎn)換為單詞的序列。現(xiàn)在,最有效的語音識別方法是語音信號統(tǒng)計建模的方法。本章簡要地介紹了語音識別中的主要方法和技術(shù):聲學(xué)語音信號的建模、語音識別中的詞匯表示、語音識別中的語言模型和解碼。重點介紹獨立于說話人的大詞匯量連續(xù)語音識別(large-vocabulary continuous speech recognition,簡稱LVCSR)的最新的技術(shù)。目前,語音識別主要應(yīng)用于自動聽寫機的設(shè)計、口語對話系統(tǒng)、語音文獻的自動轉(zhuǎn)寫、語音信息檢索等領(lǐng)域中。最后討論了語音識別技術(shù)未來的研究前景。

第17章“文本-語音合成”(text-to-speech synthesis,簡稱TTS)介紹文本-語音合成的最新成果。TTS既涉及自然語言處理技術(shù),也涉及數(shù)字信號的處理技術(shù)。本章主要從自然語言處理的角度來介紹TTS。首先介紹TTS系統(tǒng)的概貌以及它的商業(yè)應(yīng)用價值。然后描述TTS系統(tǒng)的功能結(jié)構(gòu)以及TTS系統(tǒng)的組成部分,TTS系統(tǒng)中的自動形態(tài)-句法分析、自動語音分析、自動韻律生成,說明了如何從文本中近似地計算語音的聲調(diào)和時長。最后介紹了聲波生成的兩種技術(shù):規(guī)則合成技術(shù)(synthesis by rules)與毗連合成技術(shù)(concatenative synthesis)。

第18章“有限狀態(tài)技術(shù)”(finite-state technology)首先舉例介紹有限狀態(tài)語言、詞匯轉(zhuǎn)錄機、重寫規(guī)則等基本概念,然后介紹基本正則表達(dá)式的運算方法和復(fù)雜的正則表達(dá)式,最后討論有限狀態(tài)網(wǎng)絡(luò)的形式特性。

第19章“統(tǒng)計方法”(statistical methods)介紹了計算語言學(xué)中的統(tǒng)計方法。目前,統(tǒng)計方法已經(jīng)成為自然語言處理的主流方法。本章首先介紹數(shù)理統(tǒng)計的基本概念(如:樣本空間、概率測度、隨機變量、條件概率、熵、隨機過程)以及如何把它們應(yīng)用于自然語言的模擬問題,分別介紹了隱馬爾科夫模型(hidden Markov models)和最大熵模型(maximum-entropy models),最后介紹了這些模型的一些技術(shù)細(xì)節(jié),如:韋特比搜索(Viterbi search)、最大熵方程(maximum-entropy equation)等。

第20章“機器學(xué)習(xí)”(machine learning)介紹了如何通過有指導(dǎo)的訓(xùn)練實例(supervised training examples)來自動地獲取語言資源中蘊含的決策樹(decision-tree)和規(guī)則(rules),描述了怎樣從經(jīng)過標(biāo)注的訓(xùn)練實例中進行推理的各種算法和知識表達(dá)技術(shù),并介紹了如何使用已經(jīng)獲得的知識來進行分類的基于實例的分類方法(instance-based categorization),較詳細(xì)地介紹了k-鄰近分類算法(k nearest-neighbour categorization algorithm)。這些機器學(xué)習(xí)的技術(shù)可以應(yīng)用來解決計算語言學(xué)中的形態(tài)分析、詞類標(biāo)注、句法剖析、詞義自動排歧、信息抽取、前指消解等各種各樣的問題。

第21章“詞匯知識的獲取”(lexical knowledge acquisition)首先介紹了詞匯知識自動獲取的一些背景,包括詞匯知識的形式、詞匯知識獲取的資源和工具、單詞的共現(xiàn)和相似度。然后介紹了從語料庫中自動獲取詞匯的搭配關(guān)系(lexical collocation)和聯(lián)想關(guān)系(lexical association)的方法,詞匯相似度(similarity)計算與敘詞表(thesaurus)構(gòu)建的方法,動詞的次范疇框架(subcategorization frame)的獲取方法;分析了詞匯語義學(xué)(lexical semantics)和詞匯知識獲取的關(guān)系。最后介紹了從機器可讀的詞典中獲取詞匯知識的方法。由于在自然語言處理中越來越重視詞匯知識的作用,自然語言處理的形式模型中越來越多地采用“詞匯化”(lexicalized)的方法,詞匯知識的自動獲取是當(dāng)前計算語言學(xué)研究的亮點之一。

第22章“評測”(evaluation)專門討論自然語言處理系統(tǒng)的評測問題。評測是推動自然語言處理研究發(fā)展的一個重要手段,評測的結(jié)果對于自然語言處理系統(tǒng)的投資者、開發(fā)者和使用者都是很有價值的。在自然語言處理技術(shù)發(fā)展的早期主要使用基于技術(shù)的評測(technology-based evaluation),在自然語言處理技術(shù)比較成熟時,就可以使用以用戶為中心的評測(user-centred evaluation)。根據(jù)評測時的輸入與輸出,評測技術(shù)又可以分為分析成分的評測(evaluation of analysis components)、輸出技術(shù)的評測(evaluation of output technologies)和交互系統(tǒng)的評測(evaluation of interactive systems)。分析成分的評測把語言映射為它的內(nèi)部表達(dá)作為輸出(例如:有標(biāo)記的片段、樹形圖、抽象的意義表達(dá)式等)。輸出技術(shù)的評測要把處理的結(jié)果用具體的語言表示出來(例如:文摘、生成的文本、翻譯的譯文等)。這種評測可以分別使用內(nèi)部評測指標(biāo)(intrinsic measures)和外部評測指標(biāo)(extrinsic measures)來進行。交互系統(tǒng)的評測容許用戶與系統(tǒng)進行交互。本章總結(jié)了評測的各種技術(shù),并指出它們的優(yōu)點和缺點。

第23章“子語言和可控語言”(sublanguage and controlled language)首先討論了在限定語義領(lǐng)域中的計算語言學(xué),指出了在當(dāng)前的水平之下,在某些限定領(lǐng)域中應(yīng)用自然語言處理技術(shù)的必要性。然后舉例說明了某些自發(fā)形成的子語言,分析了子語言的特性,討論了子語言在機器翻譯、文本數(shù)據(jù)抽取、自然語言生成、自動文摘中的應(yīng)用問題。接著討論可控語言,分析了使用可控語言的必要性和局限性,介紹了可控語言的一個實例――簡化英語AECMA。最后討論子語言與可控語言的關(guān)系,分析了把子語言轉(zhuǎn)變?yōu)榭煽卣Z言的途徑。

第24章“語料庫語言學(xué)”(corpus linguistics)主要討論了語料庫在自然語言處理中的應(yīng)用問題。首先從語料的抽樣框架、語料的代表性、語料的平衡性等方面說明了建立語料庫的基本要求,簡要地回顧了語料庫的發(fā)展歷史,然后著重地討論了語料庫的標(biāo)注(annotation)問題。標(biāo)注過的語料庫的優(yōu)點是:開發(fā)和研究上的方便性、使用上的可重用性、功能上的多樣性和分析上的清晰性。學(xué)術(shù)界對于語料庫標(biāo)注的批評主要來自兩方面:一方面認(rèn)為,語料庫經(jīng)過標(biāo)注之后失去了客觀性,所得到的語料庫是不純粹的;另一方面認(rèn)為,手工標(biāo)注的語料庫準(zhǔn)確性高而一致性差,自動或半自動的標(biāo)注一致性高而準(zhǔn)確性差,語料庫的標(biāo)注難以做到兩全其美,而目前大多數(shù)的語料庫標(biāo)注都需要人工參與,因而很難保證語料庫標(biāo)注的一致性。在分析了語料庫在自然語言處理中的應(yīng)用問題之后,作者指出,不論標(biāo)注過的語料庫,還是沒有標(biāo)注過的語料庫,在自然語言處理中都是有用的,語料庫語言學(xué)有助于計算語言學(xué)的發(fā)展。

第25章“知識本體”(ontology)討論了知識本體及其在自然語言處理中的應(yīng)用。首先,分別介紹了哲學(xué)傳統(tǒng)的知識本體、認(rèn)知和人工智能傳統(tǒng)的知識本體、語言學(xué)傳統(tǒng)的知識本體,并討論了語言學(xué)中的知識本體與詞匯語義學(xué)的關(guān)系;然后,說明在自然語言處理中,知識本體可以用來幫助系統(tǒng)進行語言的結(jié)構(gòu)分析(例如:英語中的PP附著問題、錯拼更正、句法檢錯、語音識別),也可以用來進行局部的自然語言理解(例如:信息檢索中的問題搜索、文本分類),并具體說明了知識本體在信息檢索、信息抽取、自動文摘、語義相似度計算、詞義排歧中的應(yīng)用。

第26章“樹鄰接語法”(tree-adjoining grammar,簡稱TAG)介紹一種局部化的語法形式模型:樹鄰接語法(TAG)和詞匯化的樹鄰接語法(lexicalized tree-adjoining grammar,簡稱LTAG)。首先討論上下文無關(guān)語法CFG的局部化問題,說明TAG與CFG的不同:TAG以句法結(jié)構(gòu)樹作為核心操作對象,在樹的基礎(chǔ)上來組織語言知識,它的產(chǎn)生式規(guī)則也對應(yīng)著樹結(jié)構(gòu),它以線性的一維形式來表達(dá)二維的樹結(jié)構(gòu);而CFG以符號串作為操作對象,CFG是一個基于符號串的形式語法,而TAG是基于樹的形式語法。然后討論上下文無關(guān)語法CFG的詞匯化問題,介紹了LTAG。LTAG對于TAG的擴充主要在于把每一個初始樹(initial tree)和輔助樹(auxiliary tree)都與某一個或某一些叫作“錨點”(anchor)的具體單詞關(guān)聯(lián)起來。最后討論LTAG的一些重要特性及其與別的形式系統(tǒng)的關(guān)系。

第27章“機器翻譯:總體回顧”(machine translation:general overview)介紹了從20世紀(jì)50年代到90年代的基于規(guī)則的機器翻譯系統(tǒng)(rule-based machine translation,簡稱rule-based MT)的主要概念和方法:直接翻譯方法、中間語言方法、轉(zhuǎn)換方法、基于知識的方法,并介紹了主要的機器翻譯工具,簡要回顧了機器翻譯的歷史。

第28章“機器翻譯:新近的發(fā)展”(machine translation:latest developments)介紹了當(dāng)前機器翻譯系統(tǒng)的研究、開發(fā)和應(yīng)用的情況,討論了經(jīng)驗主義的機器翻譯系統(tǒng):基于實例的機器翻譯(example-based MT)和統(tǒng)計機器翻譯(statistical MT),并把它們與傳統(tǒng)的基于規(guī)則的機器翻譯系統(tǒng)進行了對比,同時還介紹了把各種方法融為一爐的混合機器翻譯系統(tǒng)(hybrid MT)。當(dāng)前基于規(guī)則的機器翻譯的開發(fā)中,回指消解的研究以及基于中間語言和基于知識的機器翻譯的研究取得較大進展,本章也做了介紹;此外,還介紹了口語的機器翻譯,討論了少數(shù)民族語言和不發(fā)達(dá)語言的機器翻譯前景,討論了因特網(wǎng)上的機器翻譯(特別是網(wǎng)頁翻譯)問題。最后,本章介紹了譯者的電子翻譯工具,特別討論了雙語語料庫、翻譯記憶、雙語上下文索引等問題,并介紹了一些面向譯者的詞處理工具。

第29章“信息檢索”(information retrieval)主要介紹了文本的信息檢索。信息檢索系統(tǒng)的任務(wù)在于,對于用戶提出的提問或者命題,給出與之有關(guān)的文獻集合,作為檢索的結(jié)果。首先分析了信息檢索系統(tǒng)的軟件組成成分,包括文獻處理、提問處理、檢索匹配技術(shù)。然后討論自然語言處理技術(shù)對于信息檢索的推動和促進作用,講述了如何使用自然語言處理所得到的形態(tài)信息、短語信息、句法信息來改進信息檢索中的索引技術(shù),并且指出,當(dāng)前的趨向是使用語義信息來進行信息檢索。最后展望信息檢索的發(fā)展前景。

第30章“信息抽取”(information extraction,簡稱IE)討論如何從自由文本中自動地識別特定的實體(entities)、關(guān)系(relation)和事件(events)的方法和技術(shù)。本章主要討論兩種類型的信息抽取:一種是名稱的自動抽取(extraction of names),一種是事件的自動抽取(extraction of events),并介紹書寫抽取規(guī)則的方法。對于名稱的自動抽取,本章介紹了名稱標(biāo)注器(name tagger);對于事件的自動抽取,介紹了事件識別器(event recognizer)。同時,還介紹了如何從已經(jīng)標(biāo)注了有關(guān)名稱或事件信息的文本語料庫中自動地學(xué)習(xí)和抽取規(guī)則的方法,這種方法也就是信息抽取的統(tǒng)計模型。最后,介紹了信息抽取的評測和應(yīng)用。

第31章“問答系統(tǒng)”(question answering,簡稱QA)討論如何從大規(guī)模真實的聯(lián)機文本中對于指定的提問找出正確回答的方法和技術(shù),這是文本信息處理的一個新的發(fā)展趨向。由于QA要對指定的提問給出一套數(shù)量不多的準(zhǔn)確回答,在技術(shù)上,它更接近于信息檢索(information retrieval),而與傳統(tǒng)的文獻檢索(document retrieval)有較大的區(qū)別――QA要生成一個相關(guān)文獻的表作為對于用戶提問的回答。與信息抽取相比,QA要回答的提問可以是任何提問,而信息抽取只需要抽取事先定義的事件和實體。在開放領(lǐng)域的QA系統(tǒng)中,使用有限狀態(tài)技術(shù)和領(lǐng)域知識,把基于知識的提問處理、新的文本標(biāo)引形式以及依賴于經(jīng)驗方法的回答抽取技術(shù)結(jié)合起來,這樣,就把信息抽取技術(shù)大大地向前推進了一步。本章首先介紹了QA系統(tǒng)的類別和QA系統(tǒng)的體系結(jié)構(gòu),接著介紹了開放領(lǐng)域QA系統(tǒng)中的提問處理、開放領(lǐng)域QA系統(tǒng)中的提問類型以及關(guān)鍵詞抽取技術(shù),并討論了開放領(lǐng)域QA系統(tǒng)中的文獻處理方法和提問抽取方法,最后展示了QA系統(tǒng)的發(fā)展前景。

第32章“自動文摘”(text summarization)介紹對單篇或多篇文本進行自動文摘的方法。首先討論自動文摘的性質(zhì)和自動文摘的過程。接著介紹自動文摘的三個階段:第一階段是主題辨認(rèn)(topic identification),第二階段是主題融合(topic fusion),第三階段是文摘生成(summary generation);并介紹了多文本的自動文摘。最后,介紹自動文摘的評測方法,討論了自動文摘評測的兩個指標(biāo):壓縮比(compression ratio,簡稱CR)和內(nèi)容保留率(retention ratio,簡稱RR)。

第33章“術(shù)語抽取和自動索引”(term extraction and automatic indexing)介紹術(shù)語自動處理的技術(shù)。術(shù)語廣泛地出現(xiàn)在科技文獻中,術(shù)語的自動識別對于科技文獻的分析、理解、生成、翻譯具有關(guān)鍵性作用。隨著網(wǎng)絡(luò)的普及和數(shù)字技術(shù)的發(fā)展,出現(xiàn)在互聯(lián)網(wǎng)、政府、工業(yè)部門和數(shù)字圖書館中的專業(yè)文獻日益增多,術(shù)語的自動處理對于這些文獻的信息檢索、跨語言問答、多媒體文本自動索引、計算機輔助翻譯、自動文摘等都具有重要作用。本章把面向術(shù)語的語言自動處理分為術(shù)語發(fā)現(xiàn)(term discovery)和術(shù)語識別(term recognition)兩個部門,分別介紹了主要的技術(shù)和系統(tǒng),最后介紹了雙語言術(shù)語的自動抽取技術(shù)。

第34章“文本數(shù)據(jù)挖掘”(text data mining,簡稱TDM)介紹了本文數(shù)據(jù)挖掘技術(shù)。文本數(shù)據(jù)挖掘的目的在于從大規(guī)模真實文本數(shù)據(jù)中發(fā)現(xiàn)或推出新的信息,找出文本數(shù)據(jù)集合的模型,發(fā)現(xiàn)文本數(shù)據(jù)中所隱含的趨勢,從文本數(shù)據(jù)的噪聲中分離出有用的信號。本章首先討論文本數(shù)據(jù)挖掘與信息檢索的區(qū)別,分析了文本數(shù)據(jù)挖掘與計算語言學(xué)和范疇元數(shù)據(jù)(category metadata)的關(guān)系。本章舉出實例,具體說明了怎樣使用生物醫(yī)學(xué)文獻中的文本數(shù)據(jù)來推測偏頭痛(migraine headaches)的病因,怎樣使用專利文獻中的文本數(shù)據(jù)來揭示專利文本與已經(jīng)發(fā)表的研究文獻之間的關(guān)系,并介紹了LINDI(Linking Information for Novel Discovery and Insight)系統(tǒng)。這個系統(tǒng)的軟件能夠根據(jù)大規(guī)模的文本集合來發(fā)現(xiàn)文本中蘊含的重要的新信息。

第35章“自然語言接口”(natural language interaction簡稱NLI)介紹計算機自然語言接口系統(tǒng)。這樣的NLI系統(tǒng)可以把用戶使用的口頭自然語言或書面自然語言提出的問題轉(zhuǎn)化為計算機可以處理的形式。首先介紹了NLI系統(tǒng)的基本組成部分、意義表達(dá)語言(meaning representation language,簡稱MRL)、同義互訓(xùn)軟件(paraphraser)、問題生成軟件(response generator)以及可移植工具(portability tools)。然后介紹口語對話系統(tǒng)(spoken dialogue systems,簡稱SDS),分別介紹了SDS的單詞識別軟件、任務(wù)模型、用戶模型、話語模型、對話管理軟件、消息生成軟件、語音合成軟件。最后討論SDS系統(tǒng)的靈活性、現(xiàn)狀以及將來的應(yīng)用前景。

第36章“多模態(tài)和多媒體系統(tǒng)中的自然語言”(natural language in multimodal and multimedia systems)討論自然語言在多模態(tài)系統(tǒng)和多媒體系統(tǒng)應(yīng)用中的重要作用,說明了怎樣把自然的口語或書面語與多媒體輸入?yún)f(xié)同地融合為一體,怎樣把自然語言與其他的媒體結(jié)合起來以生成更加有效的輸出,怎樣使用自然語言處理技術(shù)來改善多媒體文獻的存取。首先介紹包含自然語言的多模態(tài)和多媒體輸入的分析問題,討論了怎樣把自然語言處理技術(shù)作為多模態(tài)分析的基礎(chǔ),怎樣把不同的模態(tài)結(jié)合起來的技術(shù)。接著介紹包含自然語言的多媒體輸出的生成問題,討論了怎樣把自然語言處理技術(shù)作為多媒體生成的基礎(chǔ),并討論了不同模態(tài)的協(xié)調(diào)問題(包括不同模態(tài)的配置、不同模態(tài)輸出的裁剪、模態(tài)輸出中空間和時間的配合)。還討論了用于多媒體數(shù)據(jù)存取的自然語言處理技術(shù)(包括基于自然語言處理的圖形和圖像檢索、圖形和圖像數(shù)據(jù)庫的自然語言接口、多媒體信息的自然語言摘要)。最后討論在多媒體環(huán)境中使用語言的問題。

第37章“計算機輔助語言教學(xué)中的自然語言處理”(natural language processing in computer-assisted language learning)介紹在計算機輔助語言教學(xué)(computer-assisted language learning,簡稱CALL)中使用自然語言處理技術(shù)的問題。首先介紹CALL的發(fā)展歷史,接著介紹在自然語言處理背景下的CALL,語料庫與CALL,雙語語料庫,討論自然語言處理技術(shù)在形態(tài)學(xué)教學(xué)、語法教學(xué)、偏誤的識別與診斷中的應(yīng)用。最后討論自然語言處理技術(shù)在CALL中應(yīng)用的評估問題。

第38章“多語言的在線自然語言處理”(multilingual on-line natural language processing)討論在因特網(wǎng)上的多語言處理問題。因特網(wǎng)現(xiàn)在已經(jīng)發(fā)展成多語言的網(wǎng)絡(luò),英語獨霸互聯(lián)網(wǎng)天下的局面已經(jīng)成為歷史,非英語的網(wǎng)站越來越多,語言障礙日益嚴(yán)重。為了克服語言障礙,機器翻譯當(dāng)然是一個最重要的手段,除了機器翻譯之外的各種使用自然語言處理技術(shù)的多語言處理工具也雨后春筍般地開發(fā)出來。本章介紹了語種辨別(language identification)、跨語言信息檢索(cross-language information retrieval,簡稱CLIR)、雙語言術(shù)語對齊(bilingual terminology alignment)和語言理解助手(comprehension aids)4個方面的研究情況。語種辨別的目的在于讓計算機自動地判斷書面文本是用什么語言寫的,這顯然是多語言自動處理必須經(jīng)過的第一步。跨語言信息檢索CLIR的目的在于使用一種語言提問來檢索其他語言文本的信息。本章介紹了在CLIR中的譯文發(fā)現(xiàn)技術(shù)(finding translation)、翻譯變體的修剪技術(shù)(pruning translation alternatives)和翻譯變體的加權(quán)技術(shù)(weighting translation alternatives)。在這些應(yīng)用中,雙語言詞典或多語言詞典是最重要的資源,而這些詞典的覆蓋面可以通過使用雙語言術(shù)語對齊的技術(shù)來加以提升。語言理解助手的功能在于給用戶提供軟件工具來理解外語書寫的文本,而不必使用全自動機器翻譯的技術(shù)。本章介紹了施樂公司歐洲研究中心(Xerox Research Centre Europe,簡稱XRCE)的語言理解助手LocoLex和語義模型,并介紹了施樂公司使用語言助手來改善數(shù)字圖書館Callimaque的技術(shù)。

本章最后附有各章作者簡介、計算語言學(xué)術(shù)語表、作者索引和主題索引,便于讀者查閱。

三、簡評

本書是手冊性的專著,有如下三個明顯特點:

1.深入淺出。本書各章寫作風(fēng)格一致,內(nèi)容協(xié)調(diào),渾然一體,特別適合對計算語言學(xué)感興趣和初入門的讀者閱讀。本書使用流暢的文筆和有趣的實例來介紹艱深的技術(shù)問題,尤其適合文科背景的讀者閱讀。

2.專家執(zhí)筆。本書的38章分別由各個領(lǐng)域內(nèi)的46位知名專家執(zhí)筆,由于這些專家具有所屬領(lǐng)域的精湛知識,對于自己的領(lǐng)域有深刻的理解,有力地保證了本書的學(xué)術(shù)質(zhì)量和專業(yè)水平。

3.涵蓋全面。本書幾乎涵蓋了計算語言學(xué)的所有領(lǐng)域,反映了當(dāng)前計算語言學(xué)的最新成就,使我們對計算語言學(xué)能夠獲得全面而系統(tǒng)的認(rèn)識。

我國曾經(jīng)翻譯出版過有關(guān)計算語言學(xué)和自然語言處理的大部頭專著,如馮志偉和孫樂翻譯的《自然語言處理綜論》(電子工業(yè)出版社,2005)被稱為自然語言處理教材的“黃金標(biāo)準(zhǔn)”。但是,這部專著主要針對理工科背景的讀者而寫,數(shù)學(xué)公式較多,文科背景的讀者閱讀和理解起來常常會感到困難。與《自然語言處理綜論》相比,本書盡量避免使用繁難的數(shù)學(xué)公式,文筆淺顯而流暢,內(nèi)容新穎而有趣,更適合文科背景的讀者閱讀。目前,計算語言學(xué)這個新興的學(xué)科不僅吸引了大量理工科背景的研究人員,同時也有不少文科背景的研究人員投身到計算語言學(xué)的研究行列中來。本書的上述特點正好可以滿足文科背景研究人員的需要。當(dāng)然,由于本書內(nèi)容涵蓋面廣、專業(yè)性強,對理工科背景的研究人員也有很大的參考價值。

第8篇

關(guān)鍵詞:地理信息系統(tǒng);空間數(shù)據(jù)倉庫;數(shù)據(jù)倉庫;認(rèn)知過程

0引言

進入21世紀(jì)后,對空間數(shù)據(jù)倉庫的研究方興未艾,在許多次的國際學(xué)術(shù)會議上都有相關(guān)[1~3]。例如在泰國召開的ISPRS第三屆動態(tài)與多維GIS會議暨CPGIS第十屆地理信息年會、北京召開的第20屆國際制圖協(xié)會國際學(xué)術(shù)會議、南非召開的第21屆國際制圖協(xié)會國際學(xué)術(shù)會議等。還有一些ESRI公司的白皮書、全球性用戶大會、SSD國際會議、數(shù)字地球國際會議、GIS國際會議等也開始討論空間數(shù)據(jù)倉庫問題[4~8]。將空間數(shù)據(jù)倉庫技術(shù)引入到我國大概是20世紀(jì)90年代末,文獻[9~14]的發(fā)表開創(chuàng)了我國空間數(shù)據(jù)倉庫理論與技術(shù)研究的新局面,此后又陸續(xù)出現(xiàn)了一些這方面的論文。

總體說來,上述工作對空間數(shù)據(jù)倉庫的理論和方法進行了初步研究,在概念、原理、結(jié)構(gòu)、操作與算法等方面進行了初步論述,已取得了卓有成效的成績。但是到目前為止,空間數(shù)據(jù)倉庫的概念框架和認(rèn)知過程等方面還是缺乏系統(tǒng)的論述,沒有形成一套比較完整的空間數(shù)據(jù)倉庫概念框架體系和認(rèn)知過程體系。

1概念框架

空間數(shù)據(jù)倉庫是GIS技術(shù)和數(shù)據(jù)倉庫技術(shù)相結(jié)合的產(chǎn)物,其定義很多,但中心思想包含三方面內(nèi)容:①空間數(shù)據(jù)倉庫是在網(wǎng)絡(luò)環(huán)境下,實現(xiàn)對異地、異質(zhì)、異構(gòu)不同源數(shù)據(jù)庫中地理空間數(shù)據(jù)、專題數(shù)據(jù)及時間數(shù)據(jù)的統(tǒng)一、整合、集成處理,形成用戶獲取數(shù)據(jù)的共享操作模式;②空間數(shù)據(jù)倉庫可根據(jù)需求對這些數(shù)據(jù)再進行測繪專業(yè)處理,提供多種空間數(shù)據(jù)產(chǎn)品,滿足用戶更高層次——對數(shù)據(jù)產(chǎn)品的需求;③基于空間數(shù)據(jù)產(chǎn)品,空間數(shù)據(jù)倉庫可從多維的角度進行空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析,提供綜合的、多維的、面向分析的空間輔助決策支持信息,滿足用戶空間決策分析的需求。

空間數(shù)據(jù)倉庫的概念框架分為外部結(jié)構(gòu)、內(nèi)部結(jié)構(gòu)。外部結(jié)構(gòu)主要描述空間數(shù)據(jù)倉庫與外部系統(tǒng)的關(guān)系;內(nèi)部結(jié)構(gòu)主要描述空間數(shù)據(jù)倉庫的內(nèi)部功能模塊組成。

1.1外部結(jié)構(gòu)

數(shù)據(jù)庫系統(tǒng)處于空間數(shù)據(jù)倉庫系統(tǒng)的最底層,管理著若干種不同的地理空間數(shù)據(jù)庫和專題數(shù)據(jù)庫,它們各自獨立,形成了各式各樣的異地異質(zhì)異構(gòu)的數(shù)據(jù)庫系統(tǒng),它們主要為空間數(shù)據(jù)倉庫提供數(shù)據(jù)源。應(yīng)用系統(tǒng)處于空間數(shù)據(jù)倉庫系統(tǒng)的最上層,它通過一個標(biāo)準(zhǔn)的接口從空間數(shù)據(jù)倉庫中提取地理空間數(shù)據(jù)、空間數(shù)據(jù)產(chǎn)品和空間輔助決策分析信息,為應(yīng)用系統(tǒng)服務(wù)。其具體外部結(jié)構(gòu)如圖1所示。

1.2內(nèi)部結(jié)構(gòu)

空間數(shù)據(jù)倉庫的內(nèi)部組成應(yīng)由八個獨立功能模塊構(gòu)成,分層次實現(xiàn)空間數(shù)據(jù)倉庫系統(tǒng)。其中,第一層次的功能模塊是空間數(shù)據(jù)倉庫的基礎(chǔ)處理模塊,由多源空間數(shù)據(jù)抽取、多源空間數(shù)據(jù)整合、多源空間數(shù)據(jù)統(tǒng)一、空間數(shù)據(jù)倉庫元數(shù)據(jù)組成;第二層次的功能模塊是空間數(shù)據(jù)倉庫的服務(wù)模塊,由空間數(shù)據(jù)產(chǎn)品服務(wù)、空間數(shù)據(jù)立方體分析、空間數(shù)據(jù)挖掘分析組成;第三層次的功能模塊是空間數(shù)據(jù)倉庫的對外數(shù)據(jù)接口模塊,由對外數(shù)據(jù)交換格式組成。第一層次的功能模塊為第二層次的功能模塊服務(wù),第二層次的功能模塊為第三層次的功能模塊服務(wù)。其具體內(nèi)部結(jié)構(gòu)圖如圖2所示。

當(dāng)應(yīng)用系統(tǒng)提出需求時:①多源空間數(shù)據(jù)抽取功能模塊從各源數(shù)據(jù)庫系統(tǒng)中抽取出相應(yīng)地理范圍(矩形、多邊形、橢圓)的不同種類的地理空間數(shù)據(jù)、專題數(shù)據(jù);②多源空間數(shù)據(jù)整合功能模塊對這些由圖幅范圍組織的地理空間數(shù)據(jù)進行相應(yīng)地理范圍的裁剪、拼接、接邊、圖形編輯、拓?fù)渲亟M等整合處理,形成裁剪拼接和接邊好的、具有完整拓?fù)潢P(guān)系的、物理上無縫的、按區(qū)域范圍組織的地理空間數(shù)據(jù);③多源空間數(shù)據(jù)統(tǒng)一功能模塊對這些整合處理好的地理空間數(shù)據(jù)進行數(shù)學(xué)基礎(chǔ)、數(shù)據(jù)編碼、數(shù)據(jù)格式、數(shù)據(jù)精度等方面的統(tǒng)一處理,形成能相互疊加的地理空間數(shù)據(jù);④將經(jīng)抽取、整合、統(tǒng)一處理好的地理空間數(shù)據(jù)提交給空間數(shù)據(jù)產(chǎn)品服務(wù)功能模塊,經(jīng)過集成、融合、派生和關(guān)聯(lián)等測繪專業(yè)算法處理,生成應(yīng)用系統(tǒng)所需的各種空間數(shù)據(jù)產(chǎn)品;⑤基于已生成的空間數(shù)據(jù)產(chǎn)品,進行空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析,得到面向空間輔助決策分析的結(jié)果;⑥將這些空間數(shù)據(jù)產(chǎn)品和空間輔助決策分析結(jié)果,以對外數(shù)據(jù)交換格式的形式提交給應(yīng)用系統(tǒng)使用。

2認(rèn)知過程

2.1認(rèn)知過程概念圖

空間數(shù)據(jù)倉庫是描述地理現(xiàn)象的一個重要分支,其認(rèn)知過程應(yīng)與地理空間信息的認(rèn)知過程基本一致,不同之處在于其描述的內(nèi)容和范圍大小的區(qū)別。因此,建立空間數(shù)據(jù)倉庫的認(rèn)知過程,實際上是要經(jīng)過一個地理現(xiàn)象認(rèn)識、抽象、組織、分析和應(yīng)用的過程。其具體的認(rèn)知過程概念框圖如圖3所示。

2.2認(rèn)知過程描述

這14個世界模型和13個轉(zhuǎn)換算子的組合構(gòu)成了三個層次世界,即實體世界、目標(biāo)世界和產(chǎn)品世界。其中,現(xiàn)實世界、地理現(xiàn)實世界、地理工程現(xiàn)實世界和地理工程概念世界這四個世界模型,以及命名、選擇、抽象這三個轉(zhuǎn)換算子,共同構(gòu)成實體世界;地理工程尺度世界、地理要素分類世界、地理要素編碼世界、地理要素幾何世界和地理要素集合世界這五個世界模型,以及度量、分層、編碼、測量和聚集這五個轉(zhuǎn)換算子,共同構(gòu)成目標(biāo)世界;地理空間抽取世界、地理空間整合世界、地理空間統(tǒng)一世界、地理空間產(chǎn)品世界、地理空間決策世界這五個世界模型,以及提取、處理、變換、計算、分析這五個轉(zhuǎn)換算子,共同構(gòu)成產(chǎn)品世界。

數(shù)據(jù)庫概念設(shè)計階段、地理空間數(shù)據(jù)庫實現(xiàn)階段和空間數(shù)據(jù)倉庫實現(xiàn)階段構(gòu)成了空間數(shù)據(jù)倉庫系統(tǒng)實現(xiàn)過程的三個階段,這三個階段分別對應(yīng)著三個層次世界,即實體世界、目標(biāo)世界和產(chǎn)品世界。其中,前兩個階段是為地理空間數(shù)據(jù)庫的建立服務(wù)的,由它們實現(xiàn)實體世界向目標(biāo)世界的轉(zhuǎn)換;后一個階段是為空間數(shù)據(jù)倉庫的建立服務(wù)的,由它們實現(xiàn)目標(biāo)世界向產(chǎn)品世界的轉(zhuǎn)換。

由此可見,空間數(shù)據(jù)倉庫的認(rèn)知過程主要就是這14個世界模型通過這13個轉(zhuǎn)換算子的轉(zhuǎn)換實現(xiàn)三個層次世界的過程。這個認(rèn)知過程指導(dǎo)了空間數(shù)據(jù)倉庫的實現(xiàn)。

3認(rèn)知的概念定義

3.1世界模型

實際上,這些世界模型主要是依靠具體的實體模型或數(shù)據(jù)模型描述來實現(xiàn)的。每個世界模型均有其描述的地理空間對象,因此這些世界模型描述的內(nèi)容大不相同,必須定義出這些世界模型。

3.1.1現(xiàn)實世界模型

現(xiàn)實世界中,人們能看到一系列物質(zhì)和現(xiàn)象,對于這些物質(zhì)和現(xiàn)象,不管是否能叫上名字,它們都是客觀存在的,并且相互之間通過它們的關(guān)系組成了自然界的千差萬別。由此可見,能將現(xiàn)實世界中所有物質(zhì)和現(xiàn)象集合以及它們之間的相互關(guān)系用一定的形式進行描述就是現(xiàn)實世界模型。

現(xiàn)實世界的物質(zhì)和現(xiàn)象集合中,隱含著許多不同的地理現(xiàn)象類,如地質(zhì)、礦產(chǎn)、石油、自然地理等地理現(xiàn)象類。地理現(xiàn)象類是現(xiàn)實世界的一個子集。由此可見,能將現(xiàn)實世界中所有地理現(xiàn)象類集合以及它們之間的相互關(guān)系用一定的形式進行描述就是地理現(xiàn)實世界模型。

本文原文

3.1.3地理工程現(xiàn)實世界模型

地理現(xiàn)實世界的地理現(xiàn)象類集合中,特指一個或若干個地理現(xiàn)象就是地理工程現(xiàn)實世界,如自然地理等。地理工程現(xiàn)實世界是地理現(xiàn)實世界的一個子集。由此可見,能將地理現(xiàn)實世界指的地理現(xiàn)象以及它們之間的相互關(guān)系用一定的形式進行描述就是地理工程現(xiàn)實世界模型。

3.1.4地理工程概念世界模型

要用計算機來描述地理工程現(xiàn)實世界中的地理現(xiàn)象,就必須對它們進行抽象描述,形成地理現(xiàn)象在人們頭腦中的反映,生成概念模型。由此可見,能將地理工程現(xiàn)實世界指的地理現(xiàn)象以及它們的內(nèi)部關(guān)系用一定的形式進行抽象的概念描述就是地理工程概念世界模型。

3.1.5地理工程尺度世界模型

將地理現(xiàn)象抽象成概念模型,僅有這些還遠(yuǎn)遠(yuǎn)不夠,因為現(xiàn)實世界中的所有地理現(xiàn)象均是有度量的,所以用計算機描述這些地理現(xiàn)象時,也必須是可度量的。度量主要包括描述地理現(xiàn)象的歐幾里德幾何坐標(biāo)系和數(shù)學(xué)單位尺度。由此可見,對地理工程概念世界中的抽象地理現(xiàn)象進行歐幾里德幾何坐標(biāo)系和數(shù)學(xué)單位尺度描述就是地理工程尺度世界模型。3.1.6地理要素分類世界模型

按照GIS理論,概念中的地理現(xiàn)象最終都是通過多種地理要素來表達(dá)的,因此如何對地理要素進行合理的設(shè)計和劃分就顯得十分重要。根據(jù)ARC/INFO的分層理論,只有將這些地理要素進行分類分級,才能高效地處理它們。由此可見,對地理工程尺度世界中具有尺度度量的地理現(xiàn)象進行地理要素的分類分級描述就是地理要素分類世界模型。

3.1.7地理要素編碼世界模型

要使計算機能識別和處理地理要素,就必須給這些地理要素進行分類分級編碼,即用一串?dāng)?shù)字來表示它們,該分類分級編碼就成為該地理要素在計算機中的唯一標(biāo)志符,以便計算機能識別和處理。由此可見,對地理要素分類世界中具有明確分類分級定義的地理要素進行分類分級編碼描述就是地理要素編碼世界模型。

3.1.8地理要素幾何世界模型

為了便于計算機的存儲和管理,必須將地理要素細(xì)分為幾何目標(biāo)。地理要素幾何目標(biāo)包括基本目標(biāo)和復(fù)合目標(biāo)。基本目標(biāo)按地理要素的空間特征劃分為點狀目標(biāo)、線狀目標(biāo)、面狀目標(biāo)、體狀目標(biāo)和表面狀目標(biāo)等五種;復(fù)合目標(biāo)由基本目標(biāo)集合嵌套構(gòu)成。由此可見,對地理要素編碼世界中具有明確分類分級編碼的地理要素進行幾何目標(biāo)的劃分和描述就是地理要素幾何世界模型。

3.1.9地理要素集合世界模型

因為地理要素在一定的條件下由相同或不同的點、線、面、表面和體等五類空間目標(biāo)組合而成,所以在實際使用中,必須通過計算機系統(tǒng)把數(shù)據(jù)庫中存儲的基本目標(biāo)、復(fù)合目標(biāo)還原成地理要素。由此可見,對地理要素幾何世界中具有基本目標(biāo)、復(fù)合目標(biāo)描述的地理要素進行數(shù)據(jù)庫的幾何目標(biāo)集合操作就是地理要素集合世界模型。

定義9地理要素集合世界模型。設(shè)Con中地理要素點狀目標(biāo)、線狀目標(biāo)、面狀目標(biāo)、體狀目標(biāo)、表面目標(biāo)集合分別表示為Po、Lo、Ao、To、So,Atr為地理要素的某一地理特征集合,則地理要素集合世界模型為Ent={e|(Po,Lo,Ao,To,So)∈Atr}。

3.1.10地理空間抽取世界模型

地理空間抽取的主要功能就是從源數(shù)據(jù)庫中按地理區(qū)域范圍(矩形、橢圓、多邊形等)抽取出滿足一定條件的不同種類的地理空間數(shù)據(jù)。由此可見,對地理要素集合世界中的地理空間數(shù)據(jù)按一定地理區(qū)域范圍和地理特征進行抽取的操作描述就是地理空間抽取世界模型。

3.1.11地理空間整合世界模型

數(shù)據(jù)庫中存儲的地理空間數(shù)據(jù)是以圖幅為單位組織的,但應(yīng)用系統(tǒng)使用數(shù)據(jù)是無圖幅概念的,是以地理區(qū)域范圍為組織的。由此可見,對地理空間抽取世界中抽取出的地理空間數(shù)據(jù)進行圖形裁剪、圖形拼接、圖形接邊、圖形編輯和拓?fù)渲亟M等整合處理,形成以地理區(qū)域范圍為組織的無縫數(shù)據(jù)集合操作就是地理空間整合世界模型。定義11地理空間整合世界模型。設(shè)Con中圖形裁剪、圖形拼接、圖形編輯、圖形接邊、拓?fù)渲亟M功能分別表示為Cut、Stitch、Meet、Edit和Topology,整合功能集合表示為Fun={Cut,Stitch,Meet,Edit,Topology},則地理空間整合世界模型Pro={e|(e∈Ext,e∈Fun)}。

3.1.12地理空間統(tǒng)一世界模型

實現(xiàn)地理空間數(shù)據(jù)整合后,必須對來自不同源數(shù)據(jù)庫中的地理空間數(shù)據(jù)進行統(tǒng)一,因為地理空間數(shù)據(jù)存在著差異。這些差異表現(xiàn)在如下方面,即數(shù)學(xué)基礎(chǔ)差異、數(shù)據(jù)編碼差異和數(shù)據(jù)格式差異、數(shù)據(jù)精度差異。由此可見,對地理空間整合世界中的地理空間數(shù)據(jù)進行數(shù)學(xué)基礎(chǔ)、數(shù)據(jù)編碼、數(shù)據(jù)格式、數(shù)據(jù)精度的統(tǒng)一操作和描述就是地理空間統(tǒng)一世界模型。

3.1.13地理空間產(chǎn)品世界模型

隨著應(yīng)用的深入,單純的地理空間數(shù)據(jù)已越來越不能滿足用戶的需求,用戶更加希望使用的是經(jīng)過測繪專業(yè)處理的、經(jīng)過二次加工處理的地理空間數(shù)據(jù)產(chǎn)品,后者在實際中具有更大的應(yīng)用價值。由此可見,對地理空間統(tǒng)一世界中的地理空間數(shù)據(jù)進行測繪專業(yè)處理生成空間數(shù)據(jù)產(chǎn)品的操作就是地理空間產(chǎn)品世界模型。

定義13地理空間產(chǎn)品世界模型。設(shè)Con中單一、集成、融合、派生和關(guān)聯(lián)的功能分別表示為Single、Integrate、Fuse、Derive和Relate,測繪專業(yè)處理算法集合為Fru={Single,Integrate,Fuse,Derive,Relate},則地理空間產(chǎn)品世界模型Pdu={e|(e∈Uni,e∈Fru}。

3.1.14地理空間決策世界模型

建立空間數(shù)據(jù)倉庫的最終目的是為空間決策支持服務(wù),為用戶提供大量的具有空間決策支持的信息,這可通過空間數(shù)據(jù)倉庫中的空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析來實現(xiàn)。由此可見,對地理空間產(chǎn)品世界中的空間數(shù)據(jù)產(chǎn)品進行空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析,生成空間決策支持信息的操作和描述就是地理空間決策世界模型。

定義14地理空間決策世界模型。設(shè)Con中的空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析分別表示為Scube、Smine,空間決策分析算法集合為Sdss={Scube,Smine},則地理空間決策世界模型Dss={e|(e∈Pdu,e∈Sdss)}。

3.2轉(zhuǎn)換算子

在空間數(shù)據(jù)倉庫的認(rèn)知過程中,14個世界模型的變換離不開13個轉(zhuǎn)換算子,即命名、選擇、抽象、度量、分層、編碼、測量、聚集、提取、處理、變換、計算和分析,由它們實現(xiàn)每兩個世界模型的轉(zhuǎn)換。這些轉(zhuǎn)換算子主要是依靠元數(shù)據(jù)來實現(xiàn)的,因為每個世界模型均有描述它的元數(shù)據(jù),要實現(xiàn)兩個世界模型的轉(zhuǎn)換,通曉這兩個世界的元數(shù)據(jù)是轉(zhuǎn)換的前提。雖然這些轉(zhuǎn)換算子的具體定義不同,但它們都是實現(xiàn)每兩個世界模型的轉(zhuǎn)換,從數(shù)學(xué)的定義上說就是由某個世界模型通過函數(shù)轉(zhuǎn)換到另一個世界模型上,因此這些轉(zhuǎn)換算子的宏觀數(shù)學(xué)定義是一致的。

4結(jié)束語

目前,空間數(shù)據(jù)倉庫理論和技術(shù)研究才剛剛起步,其目標(biāo)是支持?jǐn)?shù)字地球發(fā)展、空間數(shù)據(jù)集成、空間決策支持發(fā)展的需求。因此應(yīng)該抓住這個千載難逢的好機會,將我國的空間數(shù)據(jù)倉庫研究與建立邁上一個新臺階,以支持我國的空間數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)。本文對空間數(shù)據(jù)倉庫的概念框架和認(rèn)知過程體系進行了一定程度的技術(shù)探討,希望能起到拋磚引玉的作用。

參考文獻:

[1]ZOUYijiang.Theconceptualframeworkonthemulti-scaleandspatio-temporaldatawarehouse[C].Beijing:20thICCAcademicPress,2001:2823-2831.

[2]ZOUYijiang.Thedesignofspatlatldatawarehouse[C].Bangkok:GeoInformatics&DMGIS’2001AcademicPress,2001:421-426.

[3]ZOUYijiang.Theresearchofmetadataonspatialdatawarehouse[C].Durban:21thICCAcademicPress,2003:225-226.

[4]ESRI.ESRIopenstrategywhitepapersonSDE/CADclient&spatialdatawarehousing[EB/OL].(1998).Esri/com/base/compay/opengis.

[5]ESRI.AnESRIwhitepapers,mappingforthedatawarehouse[EB∕OL].(2002).Esri/com/base/compay/opengis.

[6]TOMB,GRAYJ,SLUTZD.Microsoftterraserver:aspatialdatawarehouse.microsoftresearchadvancedtechnologydivision[EB/OL].(2004)./.

[7]SHEKHARS,LUCT,TANX,etal.Avisualizationtoolforspatialdatawarehouses[EB/OL].(2003).cs.umn.edu/Research/Shashi-group.[8]DIMITRISP.EfficientOLAPoperationsinspatialdatawarehouses,HKUST-CS01-01[R].HongKong:[s.n.],2001:65-69.

[9]趙霈生,楊崇俊.空間數(shù)據(jù)倉庫的技術(shù)與實踐[J].遙感學(xué)報,2000,4(2):157-160.

[10]李琦,楊超偉.空間數(shù)據(jù)倉庫及其構(gòu)建策略[J].中國圖像圖形學(xué)報,1999,4(11):984-990.

[11]楊群,閭國年,陳鐘明.地理信息數(shù)據(jù)倉庫的技術(shù)研究[J].中國圖像圖形學(xué)報,1999,4(8):621-626.

[12]周炎坤,李滿春.大型空間數(shù)據(jù)倉庫初探[J].測繪通報,2000,22(8):22-23.

第9篇

關(guān)鍵詞:統(tǒng)計學(xué)專業(yè);應(yīng)用型人才;實踐教學(xué)

隨著我國高等教育從精英教育向大眾化教育的轉(zhuǎn)變,應(yīng)用型人才培養(yǎng)已經(jīng)成為課程建設(shè)及其一般本科院校特別是新建地方本科院校的必然選擇,也是我國經(jīng)濟社會發(fā)展的必然要求。所以,探索、創(chuàng)新應(yīng)用型人才培養(yǎng)模式和培養(yǎng)體系,建立起促進應(yīng)用型人才培養(yǎng)的體制機制,以更好地適應(yīng)地方經(jīng)濟建設(shè)和社會發(fā)展對人才的需要,這是高等教育人才培養(yǎng)工作面臨的重要課題。近幾年來,作為新建地方院校的廣西財經(jīng)學(xué)院對此進行了積極探索,本文結(jié)合該校統(tǒng)計學(xué)專業(yè)應(yīng)用型人才培養(yǎng)實踐進行了較深入的探討。

一、圍繞應(yīng)用型人才類型定位,科學(xué)制定統(tǒng)計學(xué)專業(yè)人才培養(yǎng)方案

1.統(tǒng)計學(xué)專業(yè)應(yīng)用型人才的培養(yǎng)目標(biāo)定位

根據(jù)教育部統(tǒng)計學(xué)專業(yè)教學(xué)指導(dǎo)委員會對經(jīng)濟管理類統(tǒng)計人才培養(yǎng)目標(biāo)的界定,結(jié)合廣西財經(jīng)學(xué)院實際,我校統(tǒng)計學(xué)專業(yè)培養(yǎng)目標(biāo)定位為:以滿足市場需求為導(dǎo)向,培養(yǎng)具有良好的數(shù)學(xué)和經(jīng)濟學(xué)、管理學(xué)素養(yǎng),掌握統(tǒng)計學(xué)的基本理論、方法和思想,能熟練運用現(xiàn)代信息技術(shù)進行數(shù)據(jù)處理和統(tǒng)計分析的復(fù)合型、應(yīng)用型、創(chuàng)新型經(jīng)濟管理類專門人才。具體表現(xiàn)為“寬口徑、厚基礎(chǔ)、重應(yīng)用、高素質(zhì)”培養(yǎng)目標(biāo)要求。“寬口徑”是指所培養(yǎng)的學(xué)生有廣泛的適應(yīng)性,既是統(tǒng)計人才又是經(jīng)濟管理人才,其知識結(jié)構(gòu)能夠適應(yīng)現(xiàn)代市場經(jīng)濟發(fā)展對“復(fù)合型”人才的要求;“厚基礎(chǔ)”是指所培養(yǎng)的學(xué)生有較扎實的經(jīng)濟管理的理論基礎(chǔ)、統(tǒng)計學(xué)基礎(chǔ)、計算機基礎(chǔ)和數(shù)學(xué)基礎(chǔ),增強學(xué)生對經(jīng)濟發(fā)展和社會需求的適應(yīng)性;“重應(yīng)用”指所培養(yǎng)的學(xué)生主要是應(yīng)用型經(jīng)濟管理統(tǒng)計人才,要著重培養(yǎng)學(xué)生應(yīng)用經(jīng)濟理論和統(tǒng)計方法去處理現(xiàn)實問題的能力,包括調(diào)查研究、分析和預(yù)測和參與政策咨詢和決策的能力等,體現(xiàn)了作為方法論、管理工具的統(tǒng)計學(xué)學(xué)科性質(zhì);“高素質(zhì)”是指所培養(yǎng)的學(xué)生有較高的綜合素質(zhì),包括專業(yè)素養(yǎng)、品德素質(zhì)、心理素質(zhì)和較強的獲取知識、更新知識和進行知識創(chuàng)新的能力、適應(yīng)社會的能力。

2.以“雙體系、雙平臺、多模塊”框架構(gòu)建應(yīng)用型統(tǒng)計學(xué)專業(yè)課程體系

按照知識、素質(zhì)、能力一體化教育的思想,在課程體系設(shè)計過程中,我們注意把握以下幾方面:一是保證統(tǒng)計學(xué)專業(yè)基礎(chǔ)課程的學(xué)時、學(xué)分,夯實專業(yè)基礎(chǔ);二是給足統(tǒng)計學(xué)專業(yè)主干課程學(xué)時、學(xué)分,力求專業(yè)主干課能講深講透;三是強化實踐教學(xué),課內(nèi)與課外、校內(nèi)與校外實踐相結(jié)合;四是突出統(tǒng)計學(xué)專業(yè)“市場調(diào)查與定量分析”核心競爭能力培養(yǎng)要求;五是邀請用人單位參與人才培養(yǎng)方案的制定,以更好地適應(yīng)生產(chǎn)實踐、社會發(fā)展需要。從2006級統(tǒng)計學(xué)專業(yè)開始,我們按照學(xué)校的統(tǒng)一架框要求,按照“雙體系、雙平臺、多模塊”框架構(gòu)建了應(yīng)用型統(tǒng)計學(xué)專業(yè)課程體系。“雙體系”是指在人才培養(yǎng)中堅持理論教學(xué)和實踐教學(xué)的有機統(tǒng)一,構(gòu)建教學(xué)與科研互動、理論教學(xué)與實踐教學(xué)并重的教學(xué)體系。理論課程體系包括公共基礎(chǔ)課、專業(yè)基礎(chǔ)課、專業(yè)主干課和選修課,其中的專業(yè)基礎(chǔ)課程包括數(shù)學(xué)、計算機和經(jīng)濟學(xué)、管理學(xué)等重在夯實專業(yè)基礎(chǔ);實驗實踐課程體系分為兩個模塊:模塊一為學(xué)校各專業(yè)統(tǒng)一規(guī)定的軍訓(xùn)、就業(yè)指導(dǎo)等實踐課程,模塊二則是根據(jù)統(tǒng)計學(xué)專業(yè)要求設(shè)置的獨立實踐實驗?zāi)K。“雙平臺”是指加強通識教育、提高學(xué)生人文精神和修養(yǎng)的公共基礎(chǔ)理論課程平臺,以及幫助學(xué)生拓寬口徑、加厚基礎(chǔ),以適應(yīng)專業(yè)和人生發(fā)展的統(tǒng)計學(xué)專業(yè)基礎(chǔ)核心課程。專業(yè)主干課程有概率論與數(shù)理統(tǒng)計、多元統(tǒng)計分析等8門,約占理論課程總學(xué)分的25%,該模塊作為統(tǒng)計學(xué)專業(yè)核心內(nèi)容,既保證了統(tǒng)計學(xué)專業(yè)的基本理論、基本方法教學(xué),也突出了統(tǒng)計學(xué)專業(yè)的核心知識、能力培養(yǎng)。“多模塊”是以“雙體系”、“雙平臺”為基礎(chǔ)支撐,按照統(tǒng)計學(xué)科專業(yè)的服務(wù)方向和人才規(guī)格要求以及學(xué)生的興趣特長、人生志向等,從理論和實踐兩個維度設(shè)計多個不同的學(xué)習(xí)模塊,即“社會經(jīng)濟統(tǒng)計”、“市場調(diào)查與數(shù)據(jù)分析”、“風(fēng)險管理與精算”三個專業(yè)方向,讓學(xué)生自主選擇,因材施教。三個方向的課程設(shè)置,既突出本方向的知識、能力要求,也考慮到了統(tǒng)計學(xué)與經(jīng)濟學(xué)、管理學(xué)的結(jié)合,有助于提高學(xué)生的專業(yè)技能和實踐創(chuàng)新能力。

二、加強實踐教學(xué)和職業(yè)素養(yǎng),提高學(xué)生的綜合素質(zhì)和實踐創(chuàng)新能力

1.整合、優(yōu)化實踐課程體系設(shè)計,突出統(tǒng)計應(yīng)用主線

從2005級到2009級,我們每年都在不斷總結(jié)、逐步完善實踐課程體系設(shè)置,到2008級形成了比較完整的實踐課程體系,實踐實驗課程學(xué)分超過總學(xué)分的26%。實踐實驗課程包括兩方面:一是獨立實驗實踐課。以ERP(企業(yè)資源計劃)為平臺,構(gòu)建以統(tǒng)計核算、分析為主,會計核算、業(yè)務(wù)核算相互支持的企業(yè)實踐課程群,使學(xué)生了解、把握企業(yè)的創(chuàng)辦與整體運作,用數(shù)據(jù)解讀企業(yè)經(jīng)營,此課程群包括ERP沙盤模擬對抗、創(chuàng)業(yè)計劃實訓(xùn)等。同時,結(jié)合統(tǒng)計工作過程,設(shè)置了SPSS軟件應(yīng)用、統(tǒng)計分析綜合實訓(xùn)等獨立實訓(xùn)課程,從應(yīng)用計算機技術(shù)處理數(shù)據(jù)到分析報告撰寫進行強化,加強統(tǒng)計學(xué)專業(yè)核心能力的掌握。二是課內(nèi)同步實驗實踐課。主要包括專業(yè)主干課程的課內(nèi)同步實驗實踐課,如多元統(tǒng)計分析、計量經(jīng)濟學(xué)等課程的課內(nèi)實驗,一般安排本課程總課時的1/4課時,主要實訓(xùn)內(nèi)容為EXCEL、SPSS應(yīng)用、課程論文等。

2.加強實踐教學(xué)的基礎(chǔ)建設(shè),為學(xué)生提供實戰(zhàn)型實訓(xùn)平臺

實踐教學(xué)的基礎(chǔ)建設(shè)重點是實踐教學(xué)基地建設(shè)。一是校內(nèi)實驗室建設(shè)。這幾年來,我校重點建設(shè)了一批專業(yè)實驗室和綜合實驗室,并努力使其成為集實踐教學(xué)、科學(xué)研究及社會服務(wù)為一體的產(chǎn)學(xué)研創(chuàng)新實踐基地。統(tǒng)計學(xué)專業(yè)建成了自治區(qū)級重點建設(shè)實驗室――財經(jīng)科學(xué)實驗中心分室的統(tǒng)計實驗室、數(shù)學(xué)建模實驗室,以及目前廣西高校唯一的市場調(diào)查與數(shù)據(jù)挖掘中心,配備了SPSS、CATI(計算機輔助電話調(diào)查系統(tǒng))等先進統(tǒng)計教學(xué)軟件。二是校外實踐基地建設(shè)。目前已經(jīng)建成了國家統(tǒng)計局廣西調(diào)查總隊實踐教學(xué)基地等多個實踐實訓(xùn)基地,每年安排統(tǒng)計學(xué)專業(yè)學(xué)生到基地實習(xí),參與實習(xí)單位研究項目的數(shù)據(jù)收集、數(shù)據(jù)處理等工作。在校外實習(xí)基地建設(shè)和運行過程中,在共同合作、互惠互利的基礎(chǔ)上,我們一方面吸引和聘請基地依托單位的專家和相關(guān)人員一起參與實習(xí)教學(xué)計劃的制定與管理;另一方面充分發(fā)揮我校作為廣西高校唯一經(jīng)濟管理類統(tǒng)計學(xué)專業(yè)的學(xué)科專業(yè)優(yōu)勢,積極幫助基地依托單位開展職工統(tǒng)計業(yè)務(wù)及軟件應(yīng)用培訓(xùn)等,合作開展項目研究與開發(fā),使實習(xí)基地同時成為人才培訓(xùn)和師生科研的基地。

3.充分利用好課外實踐創(chuàng)新平臺,課外實踐創(chuàng)新活動納入本科教學(xué)全過程

統(tǒng)計學(xué)專業(yè)應(yīng)用型人才培養(yǎng),不僅需要理論教學(xué)和實驗、實訓(xùn)教學(xué)等第一課堂,還需要結(jié)合統(tǒng)計學(xué)專業(yè)特點,積極指導(dǎo)、組織學(xué)生開展學(xué)術(shù)講座、創(chuàng)業(yè)大賽、市場調(diào)查和數(shù)學(xué)建模等課外實踐活動,使課外實踐活動成為第一課堂的延伸和拓展,這對于促進統(tǒng)計學(xué)專業(yè)課程教學(xué)改革,明確統(tǒng)計學(xué)專業(yè)學(xué)習(xí)目標(biāo),學(xué)會如何做人做事、增強社會責(zé)任意識和培養(yǎng)大學(xué)生的團隊精神和實踐創(chuàng)新能力等具有積極意義。這幾年來,我們組織學(xué)生開展的主要課外學(xué)術(shù)科技活動有:一是開展學(xué)生科研項目立項,探索以問題和課題為核心的探究性教學(xué)模式。另外,也吸收了一些優(yōu)秀學(xué)生參與教師科研項目研究。二是積極組織學(xué)生參加“挑戰(zhàn)杯”全國大學(xué)生創(chuàng)業(yè)計劃大賽和課外學(xué)術(shù)科技作品大賽、數(shù)學(xué)建模大賽等科技創(chuàng)新活動。三是組織學(xué)生參與廣西統(tǒng)計信息服務(wù)中心、中國-東盟博覽會等實習(xí)單位的數(shù)據(jù)收集、處理和分析等統(tǒng)計工作,積累實際工作經(jīng)驗,培養(yǎng)了實際工作能力。四是開展職業(yè)技能教育,增強學(xué)生的就業(yè)技能和職業(yè)素養(yǎng),如會計從業(yè)資格、統(tǒng)計職稱等,邀請政府部門、企業(yè)高管或相關(guān)業(yè)務(wù)專家到校開展專題講座、職業(yè)生涯規(guī)劃、就業(yè)創(chuàng)業(yè)指導(dǎo)。此外,為了更好地貫徹因材施教原則,指導(dǎo)學(xué)生學(xué)習(xí)和成才,我們實施了本科生導(dǎo)師制,從學(xué)生的思想、生活、學(xué)業(yè)和就業(yè)等各方面進行更系統(tǒng)、更有針對性的指導(dǎo),起到了教學(xué)相長的作用。

4.改革畢業(yè)實習(xí)方式,強化畢業(yè)論文(設(shè)計)的現(xiàn)實性和專業(yè)特色

針對近年來高校畢業(yè)生畢業(yè)實習(xí)難、分散形式效果較差的現(xiàn)實,我們在加大實踐基地建設(shè)力度的同時,逐步改革畢業(yè)實習(xí)方式,變“放羊式”畢業(yè)實習(xí)為集中實習(xí)為主、集中與分散實習(xí)相結(jié)合,切實提高實習(xí)效果。對于畢業(yè)論文(設(shè)計)工作,一是改革畢業(yè)論文指導(dǎo)方式,將社會實踐、學(xué)年論文、畢業(yè)實習(xí)和學(xué)生平時的一些競賽活動與畢業(yè)論文緊密結(jié)合,使學(xué)生較早了解畢業(yè)論文的有關(guān)要求及素材積累;二是向?qū)嵙?xí)單位或用人單位征集部分畢業(yè)論文(設(shè)計)現(xiàn)實問題選題,并且適當(dāng)邀請實踐基地部分專家或業(yè)務(wù)骨干參與學(xué)生畢業(yè)論文指導(dǎo),通過畢業(yè)論文撰寫為實際工作部門解決一些實際問題;三是進一步強調(diào)統(tǒng)計學(xué)的專業(yè)特色,要求論文必須用數(shù)據(jù)說話,以檢驗學(xué)生綜合統(tǒng)計分析能力,減少抄襲現(xiàn)象的發(fā)生。

三、整合教學(xué)內(nèi)容,加強課程建設(shè),突出實踐應(yīng)用

根據(jù)統(tǒng)計學(xué)專業(yè)的知識結(jié)構(gòu)和能力培養(yǎng)要求,以打破“學(xué)科本位”,突出應(yīng)用能力培養(yǎng)為主線,我們對課程體系的各知識點進行合理梳理、歸類,特別是對統(tǒng)計專業(yè)課程中內(nèi)容交叉重復(fù)部分進行整合,進一步明確各門課程內(nèi)容歸屬,合理確定各門課程的教學(xué)內(nèi)容,使課程體系中的知識點不重不漏,課程內(nèi)容更科學(xué)適用。之后,將各門課程按照內(nèi)在聯(lián)系和教學(xué)要求歸并成若干個課程模塊,分塊建設(shè)。制定分階段課程建設(shè)規(guī)劃,重點是專業(yè)主干課程建設(shè),明確課程建設(shè)的目標(biāo)和具體內(nèi)容,包括教學(xué)大綱、教案、電子課件、參考材料、試題庫、課程網(wǎng)站等內(nèi)容,進而形成了每一門課程完整的課程檔案。

在教材的選用與建設(shè)方面,對于專業(yè)課程,選用理論內(nèi)容體系較完整、豐富,與經(jīng)濟社會實際緊密結(jié)合、實踐性強,面向21世紀(jì)的優(yōu)秀新教材、國家“十一五”規(guī)劃教材或國外優(yōu)秀教材;對于實踐課程,目前部分選用兄弟院校現(xiàn)成教材、實驗指導(dǎo)書,部分實訓(xùn)教材通過自編完成。下一步,我們計劃用1-2年時間完成本專業(yè)完整的實踐教材體系建設(shè),形成本專業(yè)特色系列實踐教材,如統(tǒng)計學(xué)案例教程、商務(wù)研究方法與應(yīng)用等。這些實驗(實訓(xùn))教材可作為一些專業(yè)主干課程的同步實驗教材,也可作為統(tǒng)計學(xué)專業(yè)獨立實驗教材。

四、以人為本,改革教學(xué)方式方法,進一步提高課程教學(xué)質(zhì)量

在教學(xué)內(nèi)容、課程體系確定后,如何教成為提高教學(xué)質(zhì)量的關(guān)鍵環(huán)節(jié)。我們鼓勵教師探索不同教學(xué)方式方法,激發(fā)學(xué)生學(xué)習(xí)的主動性、創(chuàng)造性,提高課堂教學(xué)效果。近年來,我們嘗試對《統(tǒng)計學(xué)》課程內(nèi)容進行分模塊、與非統(tǒng)計專業(yè)的專業(yè)教師合作進行教學(xué),即將非統(tǒng)計學(xué)專業(yè)的《統(tǒng)計學(xué)》課程分解為“統(tǒng)計學(xué)基礎(chǔ)理論和方法”、“統(tǒng)計理論與方法在本專業(yè)中的應(yīng)用”兩大模塊,前一部分內(nèi)容由統(tǒng)計專業(yè)教師上課,后一部分內(nèi)容由統(tǒng)計專業(yè)教師和非統(tǒng)計專業(yè)的專業(yè)教師合作上課,將統(tǒng)計方法教學(xué)與各經(jīng)濟管理類專業(yè)課程教學(xué)過程中的應(yīng)用分析結(jié)合起來。在《統(tǒng)計學(xué)》(或《統(tǒng)計學(xué)原理》)教學(xué)過程中,試行“讀(閱讀)寫(寫作)議(討論)講(講課)”教學(xué)模式改革。“讀”是指在課外閱讀統(tǒng)計教材及相關(guān)教學(xué)資料,通過教師引導(dǎo),使學(xué)生讀好書、會讀書,奠定學(xué)生良好的理論素養(yǎng)和數(shù)據(jù)意識;“寫”是指學(xué)生在閱讀基礎(chǔ)上,結(jié)合專業(yè)課程教學(xué)內(nèi)容,有計劃、有目的地撰寫讀書筆記、調(diào)查報告、課程小論文等;“議”是組織學(xué)生開展案例討論、課堂辯論,實施交互式教學(xué);“講”是讓學(xué)生充當(dāng)教師角色,就統(tǒng)計教材或現(xiàn)實某一問題進行講解,之后教師進行評議。分模塊教學(xué)、“讀寫議講”教學(xué)方式充分體現(xiàn)了“以人為本”的教育理念,把統(tǒng)計理論方法與非統(tǒng)計學(xué)專業(yè)的專業(yè)學(xué)習(xí)、課內(nèi)教學(xué)與課外學(xué)習(xí)有機地結(jié)合起來,有利于引導(dǎo)學(xué)生主動參與和自主學(xué)習(xí),培養(yǎng)學(xué)生創(chuàng)新思維和發(fā)現(xiàn)問題、解決問題的能力,所以分模塊教學(xué)、“讀寫議講”教學(xué)方式改革得到了學(xué)生普遍好評,教學(xué)效果顯著。《多元統(tǒng)計分析》、《市場調(diào)查與分析》等專業(yè)主干課程也借鑒此思路進行了教學(xué)改革,采取“課堂講授+實驗(實踐)教學(xué)+課程論文”教學(xué)方式,重點培養(yǎng)學(xué)生“寫”(分析)的能力,強調(diào)統(tǒng)計理論方法在社會實踐和現(xiàn)代經(jīng)濟管理中的運用。目前,我們正在針對不同課程特點,分別制定各門專業(yè)主干課程的教學(xué)方案,將“重思想、重應(yīng)用”的教學(xué)理念貫徹到每一門主干課程教學(xué)過程中。經(jīng)過上述訓(xùn)練,學(xué)生應(yīng)用統(tǒng)計理論方法解決實際問題的能力大大增強,研究能力也有不同程度的提高。

參考文獻:

[1] 陳相成.經(jīng)濟管理類統(tǒng)計專業(yè)的改革發(fā)展思路[J].統(tǒng)計研究,2008,(5).

[2] 蔡敬民,魏朱寶.應(yīng)用型人才培養(yǎng)的思考與實踐――以合肥學(xué)院為例[J].中國大學(xué)教學(xué),2008,(6).

[3] 曾五一.關(guān)于經(jīng)濟與管理類統(tǒng)計學(xué)專業(yè)教學(xué)規(guī)范的若干問題[J].統(tǒng)計與信息論壇,2004,(4).

第10篇

肖文杰(1985-),男,助教,主要從事計算機網(wǎng)絡(luò)教學(xué),研究方向為計算機網(wǎng)絡(luò),數(shù)據(jù)挖掘。

摘 要:《數(shù)據(jù)結(jié)構(gòu)》在傳統(tǒng)教學(xué)模式的教學(xué)過程中,存在諸多現(xiàn)實問題:學(xué)生與老師的互動性較差,學(xué)生自覺參與意識不強和學(xué)生實踐動手能力差等。針對以上問題進行分析,結(jié)合《數(shù)據(jù)結(jié)構(gòu)》課程特點,論文提出了“PBL與CBS相結(jié)合的教學(xué)模式”。從教學(xué)應(yīng)用和實踐效果看,采用這一教學(xué)模式后,學(xué)生不僅在筆試成績上有大幅度提高,而且實踐能力也得到大幅度提升,同時對提高學(xué)生的綜合素質(zhì)有很好的幫助。

關(guān)鍵詞:數(shù)據(jù)結(jié)構(gòu);PBL教學(xué)法;CBS教學(xué)法;教學(xué)模式

《數(shù)據(jù)結(jié)構(gòu)》課程,既是計算機專業(yè)核心的專業(yè)基礎(chǔ)課,同時也是眾多其它專業(yè)的重要的選修課程[1]。在采用傳統(tǒng)教學(xué)模式進行教學(xué)時,筆者發(fā)現(xiàn)教學(xué)過程中,學(xué)生無論是在課堂還是課外,學(xué)習(xí)自覺性和主動性不是很高,教學(xué)間缺少有效的互動環(huán)節(jié)等。這種教學(xué)模式,學(xué)生很容易產(chǎn)生了消極態(tài)度,最終導(dǎo)致教學(xué)效果不是很理想。

為了解決這些問題,筆者結(jié)合自己多年教學(xué)經(jīng)驗,在借鑒前人研究成果基礎(chǔ)上,利用基于問題學(xué)習(xí)法(Problem-based Learning,PBL)和基于案例學(xué)習(xí)法(Case-based Study,CBS)相結(jié)合的教學(xué)模式運用在《數(shù)據(jù)結(jié)構(gòu)》課程教學(xué)中,希望通過此教學(xué)模式的運用,能改變這種現(xiàn)狀。PBL和CBS兩種教學(xué)模式,最初都是運用在醫(yī)學(xué)教育中的教學(xué)方式。其中PBL是起源于20世紀(jì)50年代,是近年來比較流行的一種新型教學(xué)模式[2-3]。PBL強調(diào)以問題為學(xué)習(xí)主軸,以學(xué)生為主體,以教師為導(dǎo)向的啟發(fā)式教育,以培養(yǎng)學(xué)生的能力為教學(xué)目標(biāo)[4-5]。基于案例學(xué)習(xí)的教學(xué)法,強調(diào)以案例為教學(xué)核心,是一種對案例進行分析的教學(xué)模式[6]。

1.研究對象及實施過程

對于具體教學(xué)活動的實施,分別在南昌工學(xué)院和南昌師范學(xué)院(原江西教育學(xué)院)兩個學(xué)校同時進行。

1.1研究對象

在南昌工學(xué)院選取2012級軟件技術(shù)專業(yè)三年制專科學(xué)生,共106人和2012級網(wǎng)絡(luò)工程專業(yè)四年制本科

學(xué)生,共84人。在南昌師范學(xué)院選取2012級軟件技術(shù)專業(yè)三年制專科學(xué)生,共122人。具體實施教學(xué)過程中,將學(xué)生隨機進行分組教學(xué),即分成傳統(tǒng)模式教學(xué)組和PBL與CBS相結(jié)合教學(xué)組。

1.2授課教材和教師

授課教材的選擇:相同專業(yè)學(xué)生選用同種教材。而參考書學(xué)生根據(jù)需要自己選擇。授課教師都為具有多年教學(xué)經(jīng)驗的雙師型教師。另外,在進行PBL與CBS教學(xué)之前,首先對授課教師進行PBL和CBS教學(xué)模式的相關(guān)培訓(xùn),對PBL和CBS教學(xué)理念和方法進行了系統(tǒng)學(xué)習(xí)。

1.3教學(xué)模式實施過程

1.3.1傳統(tǒng)教學(xué)模式

《數(shù)據(jù)結(jié)構(gòu)》的傳統(tǒng)教學(xué)方法,主要采用“多媒體+黑板”方式進行課堂授課,在此教學(xué)模式中,整體采用“預(yù)習(xí)-課堂授課-課后復(fù)習(xí)-考試”的一個教學(xué)思路,即在實施過程中,要求學(xué)生對上課前對課本進行預(yù)習(xí),正式上課過程中,主要以教師為主進行授課,授課過程中,適當(dāng)安排提問和互動環(huán)節(jié),在課后,也同樣要求學(xué)生對課堂所學(xué)的進行復(fù)習(xí),最后進行期末考試。

1.3.2PBL與CBS相結(jié)合的教學(xué)模式

PBL與CBS相結(jié)合的《數(shù)據(jù)結(jié)構(gòu)》課程教學(xué),是

指在《數(shù)據(jù)結(jié)構(gòu)》教學(xué)過程中,授課教師采用PBL教學(xué)理念,同時結(jié)合CBS教學(xué)法,采用“設(shè)置問題―小組討論―問題總結(jié)”三段式,展開教學(xué)活動。教學(xué)中,

以學(xué)生為主體、以問題為基礎(chǔ)、以案例為載體,進行引導(dǎo)式的綜合教學(xué)。教師具體實施教學(xué)過程中,將引導(dǎo)同學(xué)們按如下步驟學(xué)習(xí):

(1)設(shè)置問題和資料準(zhǔn)備階段。在這個階段,授課教師在授課前一段時間內(nèi),事先按照《數(shù)據(jù)結(jié)構(gòu)》課程的教學(xué)大綱和授課計劃要求,結(jié)合學(xué)生學(xué)習(xí)層次和現(xiàn)有的知識水平結(jié)構(gòu),對將要學(xué)習(xí)的知識點進行提煉,同時配合使用具體案例,設(shè)置好若干個問題點,并同時為學(xué)生提供必要的教學(xué)素材,以供學(xué)生學(xué)習(xí)使用。學(xué)生在收到這些問題后,對其進行分組參與學(xué)習(xí)。各小組之間,進行協(xié)調(diào)分工,根據(jù)設(shè)置的問題和教師提供的素材,進行預(yù)習(xí),借助于網(wǎng)絡(luò)資源、圖書館資源,查閱相關(guān)資料。

(2)小組討論和交流階段。在這一教學(xué)活動環(huán)節(jié)中,以學(xué)生為主體、教師輔助參與。授課教師首先利用簡短時間對本堂課程知識進行簡單介紹,對基本定義、算法和應(yīng)用進行概括性的點撥。然后各小組進行交流和討論。討論中,通常會要求每組選出小組代表,進行小組發(fā)言,同時與教師和其它各小組進行交流。

(3)問題總結(jié)和教師評價階段。在課堂規(guī)定的時間內(nèi),完成交流和討論后,這時,再由授課教師對本次課堂學(xué)習(xí)進行總結(jié)和歸納。首先,授課教師對各小組對問題的討論結(jié)果、解決問題的方法和存在分歧給出點評。其次,在實施PBL與CBS相結(jié)合的教學(xué)模式下,授課教師還應(yīng)對各小組在解決問題過程中的方法和表現(xiàn)情況等進行總結(jié)和點評。

2.考核與評價

為了比較傳統(tǒng)組和PBL與CBS相結(jié)合教改組在《數(shù)據(jù)結(jié)構(gòu)》教學(xué)過程中的實施情況,采用筆試+實踐、學(xué)生自我評價和教師評價三種考評方式。

2.1筆試、實踐考核設(shè)計及效果

教學(xué)考核設(shè)計,建立由筆試和實踐操作組成的考核辦法。為了保證試題的公平性和客觀性,筆試題均從學(xué)校試卷庫中隨機抽題組成試卷,題型包括:單選題、填空題、綜合應(yīng)用題和算法設(shè)計題等;而實踐考試包括課程設(shè)計和小型項目實踐操作等題。

通過筆試和實踐操作考試,經(jīng)統(tǒng)計和整理,得出傳統(tǒng)組和PBL與CBS相結(jié)合教改組(簡稱教改組)的考核結(jié)果。筆試成績情況如表1所示;實踐操作考核情況如表2所示。(注:實驗組和傳統(tǒng)組,每組人數(shù)總數(shù)為30人)

從表1和表2中,我們可以發(fā)現(xiàn),無論是筆試成績還是實踐操作成績,教改組學(xué)生都明顯高于傳統(tǒng)組學(xué)生。

2.2學(xué)生自我評價與問卷調(diào)查分析

另外,在考核中我們增加了學(xué)生自評考核手段。為此,我們設(shè)計了614份調(diào)查問卷,實際發(fā)放了610份,最后收回有效的調(diào)查問卷為598份。經(jīng)對調(diào)查問卷整理和統(tǒng)計,得出了教改組學(xué)生的一些自我評價結(jié)果。調(diào)查中發(fā)現(xiàn),在運用PBL與CBS相結(jié)合教學(xué)模式下教學(xué)的學(xué)生(即教改組),對于學(xué)習(xí)積極性、學(xué)習(xí)興趣和自學(xué)能力提高等方面都表示更多的贊同和支持。

2.3教師評價分析

本次調(diào)查中,也對參與教學(xué)實踐的授課教師采取了座談和調(diào)查。據(jù)授課教師的普遍反映,在《數(shù)據(jù)結(jié)構(gòu)》課程教學(xué)中,運用PBL與CBS相結(jié)合的教學(xué)模式進行授課,學(xué)生們自覺參與教學(xué)過程的熱情大幅度得到提高,學(xué)生與老師、學(xué)生與學(xué)生之間的交流和互動機會明顯增多。同時,學(xué)生對于作業(yè)的完成情況也比原來有很好的改善和進步。

3.PBL與CBS相結(jié)合教學(xué)模式在《數(shù)據(jù)結(jié)構(gòu)》教學(xué)中的理性總結(jié)

3.1有效的提高了學(xué)生的學(xué)習(xí)成績

從考核的結(jié)果來看,在PBL與CBS相結(jié)合教學(xué)模式下授課的學(xué)生(教改組),對于《數(shù)據(jù)結(jié)構(gòu)》這門課程的成績,無論是筆試成績,還是實踐考試成績都比傳統(tǒng)模式下授課的學(xué)生有較大的提高。教改組學(xué)生在綜合應(yīng)用題和算法設(shè)計題得分率,明顯高于傳統(tǒng)教學(xué)模式下的學(xué)生。

3.2有利于促進學(xué)生學(xué)習(xí)動機的形成

《數(shù)據(jù)結(jié)構(gòu)》是一門理論和實踐結(jié)合比較緊密的課程。在傳統(tǒng)教學(xué)模式下的“灌輸式”授課,學(xué)生缺乏實踐及親身體驗的過程,老師通常講什么學(xué)生就去學(xué)什么,完全處于一種被動學(xué)習(xí)狀態(tài)。學(xué)生主動學(xué)習(xí)意識和主觀能動性無法得到很好的好培養(yǎng)和訓(xùn)練。PBL與CBS相結(jié)合教學(xué)模式通過“問題+案例”為核心,學(xué)生以問題為基礎(chǔ),學(xué)生帶著問題去查詢資料、學(xué)習(xí)、實踐、最終去解決問題。這種模式,倡導(dǎo)以教師為主導(dǎo)、以學(xué)生為主體,能夠充分調(diào)動學(xué)生主動能動性。

3.3促進批判性思維和質(zhì)疑精神的培養(yǎng)

在《數(shù)據(jù)結(jié)構(gòu)》課程中,批判性思維主要體現(xiàn)在對數(shù)據(jù)結(jié)構(gòu)問題的確定、分析及問題的解決的能力。學(xué)生只有具備良好的批判性思維,才能對問題進行界定和分析,利用數(shù)據(jù)結(jié)構(gòu)的知識解決實際問題。在以教師為主體的傳統(tǒng)教學(xué)模式中,學(xué)生無法發(fā)揮主動探索性和對問題的質(zhì)疑性。PBL與CBS教學(xué)模式,對于學(xué)生的批判性思維和質(zhì)疑的培養(yǎng)具有明顯優(yōu)勢。

3.4對學(xué)生綜合能力的培養(yǎng)和訓(xùn)練有幫助

PBL與CBS相結(jié)合的《數(shù)據(jù)結(jié)構(gòu)》教學(xué)實踐中,采用小組的方式進行學(xué)習(xí),無論對問題分析、問題討論和問題的解決過程中,都需要小組成員的共同努力和協(xié)作去完成。在這種以團隊形式教學(xué)實踐中,學(xué)生要學(xué)會與人溝通、交流和和合作。在這種不斷以小組形式的學(xué)習(xí)過程中,學(xué)生們的信息獲取能力、與人交流能力和團體協(xié)作能力等都會得到較好培養(yǎng)和訓(xùn)練。

4.結(jié)束語

筆者將PBL與CBS相結(jié)合的教學(xué)模式運用于《數(shù)據(jù)結(jié)構(gòu)》課程教學(xué),將近有兩年的時間。結(jié)合考核結(jié)果、學(xué)生自評和教師評價來看,該組合模式在《數(shù)據(jù)結(jié)構(gòu)》課程教學(xué)中,取得了良好的效果,學(xué)生對于《數(shù)據(jù)結(jié)構(gòu)》課程學(xué)習(xí)的興趣有了很大提高,考試成績也有比較好提高,另外,學(xué)生問題分析與解決能力、團體協(xié)作能力等綜合素質(zhì)都有不同程度提升。

另外,在運用PBL與CBS相結(jié)合進行《數(shù)據(jù)結(jié)構(gòu)》課程教學(xué)中,我們也發(fā)現(xiàn)存在一些問題,有部分學(xué)生反應(yīng)對該授課模式不太適應(yīng)和缺乏系統(tǒng)性等。這對授課教師提出了更高的要求:

(1)授課教師在授課前應(yīng)有充足的備課基礎(chǔ)。不僅包括對課程的授課知識有充分熟悉,而且要求對授課中的問題設(shè)置、計劃安排、節(jié)奏的控制等都要有很好的把握等。

(2)授課教師要有更強的自我學(xué)習(xí)能力。要能夠主動地自我學(xué)習(xí),不斷地加強對新知識、新技術(shù)、新觀念、和新方法等的學(xué)習(xí),以提高自身的綜合素質(zhì)。(1.南昌工學(xué)院信息學(xué)院;2.浙江大學(xué)計算機系統(tǒng)工程研究所;3.吉首大學(xué)旅游與管理工程學(xué)院)

基金項目:2012年江西省教學(xué)教育改革研究課題(基金號:JXJG-12-24-2)。

基金項目:吉首大學(xué)2013年實驗教學(xué)改革研究項目2013SYJG038資助

參考文獻:

[1] 寧子嵐.PBL教學(xué)法在《數(shù)據(jù)結(jié)構(gòu)》課程中的應(yīng)用[J].現(xiàn)代計算機(專業(yè)版),2011,9:30-31.

[2] 萬里勇,徐新愛.基于PBL的《數(shù)據(jù)庫原理及應(yīng)用》教學(xué)實踐研究[J].江西教學(xué)學(xué)院學(xué)報(綜合版),2012,33(3):70-72.

[3] 李東,張英濤,宋穎慧.“基于問題的學(xué)習(xí)”及其在計算機組成技術(shù)教學(xué)中的應(yīng)用[J].計算機教育,2011,22(11):43-46.

[4] 葉曉鳴,楊力.PBL與CBS相結(jié)合的軟件測試課程教學(xué)模式研究[J].科教文匯(下旬刊),2011,02:44-45.

第11篇

關(guān)鍵詞:智慧景區(qū); IT能力; 服務(wù)感知; 游客服務(wù)

收稿日期: 2013-03-18; 修訂日期: 2013-11-13

基金項目: 北京市教委重點項目 “基于Web 2.0的首都高新技術(shù)產(chǎn)業(yè)決策機制研究與應(yīng)用”(SZ201311417001)

作者簡介: 陳建斌(1970-),男,博士,北京聯(lián)合大學(xué)商務(wù)學(xué)院教授,研究方向為知識管理、商務(wù)智能等。鄭麗(1966-),女,北京聯(lián)合大學(xué)商務(wù)學(xué)院教授,研究方向為旅游電子商務(wù)。張凌云(1960-),男,北京聯(lián)合大學(xué)旅游學(xué)院教授,研究方向為旅游經(jīng)濟、旅游地理與旅游管理。2008年國際商用機器公司(IBM)基于物聯(lián)網(wǎng)、云計算等概念提出了“智慧地球”戰(zhàn)略①后,得到全球產(chǎn)業(yè)界的熱烈響應(yīng)和快速推廣,從而引發(fā)了“智慧城市”、“智慧旅游”等系列概念的誕生。2009年11月1日,國務(wù)院下發(fā)《關(guān)于加快發(fā)展旅游業(yè)的意見》,決定把旅游業(yè)培育成國民經(jīng)濟的戰(zhàn)略性支柱產(chǎn)業(yè)和人民群眾更加滿意的現(xiàn)代服務(wù)業(yè),為我國旅游業(yè)跨越式發(fā)展提供了政策支持。景區(qū)作為旅游產(chǎn)業(yè)的核心要素,它的智慧水平?jīng)Q定了服務(wù)質(zhì)量和游客滿意度,并極大地影響著產(chǎn)業(yè)戰(zhàn)略目標(biāo)的實現(xiàn)。一般認(rèn)為,智慧景區(qū)就是結(jié)合景區(qū)特點,將物聯(lián)網(wǎng)、云計算等新興信息技術(shù)集成起來構(gòu)建信息與決策網(wǎng)絡(luò),增強人類感知、控制和管理的能力,更加精細(xì)和動態(tài)地管理景區(qū),達(dá)到“智慧”狀態(tài)(李洪鵬,等,2011) 。智慧景區(qū)受到政府主管部門、行業(yè)協(xié)會及各地景區(qū)的重視,在國內(nèi)掀起了建設(shè)熱潮。但是,由于智慧景區(qū)的研究剛剛興起,其權(quán)威性闡釋尚未樹立,建設(shè)理論尚未完善,并且這些關(guān)鍵問題尚未引起人們的充分關(guān)注,導(dǎo)致實踐層面的形式化和無序化。本文從“智慧”的本質(zhì)出發(fā),首先探討智慧景區(qū)的實質(zhì)內(nèi)涵;然后以企業(yè)IT能力理論為指導(dǎo),構(gòu)建智慧景區(qū)的IT能力系統(tǒng)框架;最后,提出智慧景區(qū)建設(shè)的核心系統(tǒng),用于支持智慧目標(biāo)的實現(xiàn)。本文力圖在理論層面闡釋智慧景區(qū)的概念和能力建設(shè)的本質(zhì)要求,為景區(qū)信息化建設(shè)和向智慧狀態(tài)的演進提供指導(dǎo)。1智慧景區(qū)研究現(xiàn)狀關(guān)于智慧景區(qū)的研究尚不多。國外與“智慧景區(qū)(Smart Famous Scenic Sites)”相關(guān)的研究主要是探討景區(qū)的智能服務(wù)系統(tǒng),如為旅游景區(qū)提供決策支持、行程規(guī)劃和解說服務(wù)的專家系統(tǒng)(Venturini,Ricci,2006;Kramer,et al.,2007) 、目的地的推薦系統(tǒng)和基于上下文感知的移動式旅游服務(wù)系統(tǒng)(Fesenmaier,et al.,2006;Martin,et al.,2011)等。從中國知網(wǎng)檢索到的智慧景區(qū)論文僅有數(shù)篇,主要是探討智慧景區(qū)的內(nèi)涵與總體框架(邵振峰,等,2010;黨安榮,等,2011)、從數(shù)字景區(qū)向智慧景區(qū)的轉(zhuǎn)型探索(李洪鵬,等,2011)等。關(guān)于智慧景區(qū)的內(nèi)涵,黨安榮等(2011)認(rèn)識到要利用現(xiàn)代信息技術(shù)實現(xiàn)對景區(qū)全面、系統(tǒng)、及時的感知與可視化管理;李洪鵬等(2011)進一步明確智慧景區(qū)是利用最新技術(shù)“增強人類感知、控制和管理的能力,實現(xiàn)更加精細(xì)和動態(tài)的方式管理景區(qū),達(dá)到智慧狀態(tài)”。顯然,這些理解已經(jīng)注意到了“智慧”的實質(zhì)是能力的增強。張凌云等(2012)進一步圍繞能力建設(shè),提出了智慧旅游的CAA框架:智慧旅游的能力(Capabilities) 、屬性(Attributes) 以及應(yīng)用(Applications),定義了智慧旅游的核心能力模型。該文雖然明確提出智慧建設(shè)是能力建設(shè),但對核心能力的討論并未深入。

從相關(guān)文獻來看,多數(shù)智慧景區(qū)的理解存在著技術(shù)驅(qū)動的偏好,少數(shù)文獻涉及IT內(nèi)化為能力建設(shè)的必要性。智慧景區(qū)建設(shè),并不僅僅是技術(shù)及其系統(tǒng)的堆砌,而是需要從技術(shù)到人到企業(yè)運營管理的全面的變革,特別需要強調(diào)人的重要地位以及流程變革的關(guān)鍵作用。2智慧景區(qū)建設(shè)理論

2.1智慧景區(qū)的內(nèi)涵闡釋所謂智慧,是指對事物能迅速、靈活、正確地理解和解決的能力(《新華字典》第10版,商務(wù)印書館)。智慧景區(qū),當(dāng)然強調(diào)的是景區(qū)具備了對旅游資源和游客及其活動等要素迅速、靈活、正確地理解和解決的能力。因此,本文認(rèn)為,智慧景區(qū)是指能夠應(yīng)用物聯(lián)網(wǎng)、云計算等現(xiàn)代信息技術(shù)整合景區(qū)資源,在游客感知、決策支持和游客服務(wù)方面具備了獨特的企業(yè)能力,從而提升景區(qū)競爭優(yōu)勢、實現(xiàn)景區(qū)戰(zhàn)略的高度信息化的景區(qū),是基于數(shù)據(jù)集成、流程優(yōu)化后實現(xiàn)了“以游客為中心”管理模式的景區(qū)。智慧景區(qū)的實現(xiàn)路徑必須遵循信息化建設(shè)理論與方法。利用IT整合組織資源,建立競爭優(yōu)勢,這是基于資源觀的企業(yè)IT能力理論核心思想。

2.2企業(yè)IT能力理論基于資源理論提出的“IT能力理論”認(rèn)為,每個企業(yè)的IT資源和IT能力應(yīng)該是獨特的、復(fù)雜的、難以模仿的。并且,已有學(xué)者提出,信息技術(shù)發(fā)揮效能的關(guān)鍵在于集成(彭賡,霍國慶,2004)。單一IT能力成分,可以輕易被競爭對手獲取、模仿,不符合戰(zhàn)略性企業(yè)資源的特性。相比企業(yè)的其他能力,IT能力更強調(diào)各成分的協(xié)同效應(yīng),更強調(diào)IT資源和能力作為一個緊密的系統(tǒng)被使用。因此,“企業(yè)IT能力系統(tǒng)”是企業(yè)IT資源與能力的集成體,反映了企業(yè)IT能力的個性特征和競爭力特性(陳建斌,等,2010)。根據(jù)Bharadwaj(2000)的分類,IT能力系統(tǒng)的基本構(gòu)成包括IT基礎(chǔ)設(shè)施、人機綜合資源和無形資源。(1)IT基礎(chǔ)設(shè)施(IT Infrastructure)屬于有形資源,包括計算機、通訊產(chǎn)品與其它共享技術(shù)平臺以及數(shù)據(jù)庫。(2)人機綜合資源(Human IT Resources)包括技術(shù)性的信息技術(shù)技能(Technical IT Skills)與管理性的信息科技技能(Managerial IT Skills),前者是指系統(tǒng)分析設(shè)計、編寫程序等信息技術(shù)應(yīng)用能力,后者指企業(yè)信息部門的管理能力、統(tǒng)合最終用戶需求的能力,以及為了達(dá)到以上目標(biāo)必備的管理與領(lǐng)導(dǎo)技巧。(3)無形資源是指信息技術(shù)內(nèi)嵌的無形資源與能力(ITEnabled Intangibles),可分為顧客導(dǎo)向、知識資產(chǎn)、協(xié)同效應(yīng)等3個維度。協(xié)同效應(yīng)(也稱“綜效”)指的是企業(yè)內(nèi)資源與功能能夠?qū)崿F(xiàn)跨部門的共享,知識與信息的共享使企業(yè)能夠更迅速地響應(yīng)顧客需求。相應(yīng)地,IT能力系統(tǒng)可以包括3個層次的能力:IT基礎(chǔ)設(shè)施能力、IT人本能力和IT驅(qū)動的無形能力。其中,IT基礎(chǔ)設(shè)施能力更可細(xì)分為共享能力、服務(wù)能力和柔性能力(張嵩,等,2004)。

2.3智慧景區(qū)IT能力系統(tǒng)企業(yè)IT能力理論為智慧景區(qū)的建設(shè)提供了理論依據(jù)。一方面,信息化實踐證明,信息技術(shù)必須與業(yè)務(wù)緊密融合和集成,才能發(fā)揮其技術(shù)優(yōu)勢,鑄造企業(yè)競爭能力;另一方面,智慧景區(qū)本身需要管理和服務(wù)能力的提高,而不僅僅是技術(shù)裝備性能的提高。在技術(shù)采納和效能的浸延過程中,人作為能動要素發(fā)揮關(guān)鍵作用,所以,在IT能力系統(tǒng)中,有專門的人本能力體現(xiàn)。智慧景區(qū)強調(diào)景區(qū)在履行各項職能過程中表現(xiàn)出足夠的“智慧”。因此,景區(qū)信息化的過程,就是通過現(xiàn)代信息技術(shù)在景區(qū)管理與服務(wù)中的應(yīng)用,實現(xiàn)數(shù)字化、信息化、智能化和智慧化,從而實現(xiàn)管理水平和服務(wù)質(zhì)量的提升,實現(xiàn)服務(wù)模式和業(yè)態(tài)創(chuàng)新。其中,智能化強調(diào)景區(qū)結(jié)構(gòu)化、程序性決策的自動化;智慧化強調(diào)決策的柔性、靈活性和主動性。景區(qū)信息化的過程,是景區(qū)IT能力不斷培育和成長的過程;智慧景區(qū)的形成,是景區(qū)IT能力成為一種體系、對景區(qū)管理和服務(wù)實現(xiàn)高效支持的結(jié)果。

2.3.1智慧景區(qū)的IT能力及其系統(tǒng)框架智慧景區(qū)的IT能力主要包括以下3種能力。(1) IT基礎(chǔ)設(shè)施能力 IT基礎(chǔ)設(shè)施能力是智慧景區(qū)的IT能力體系中最基礎(chǔ)的部分,也是景區(qū)數(shù)字化和信息化的基礎(chǔ)條件。IT基礎(chǔ)設(shè)施能力包括以下3個層面。第一,共享能力,反映IT基礎(chǔ)設(shè)施覆蓋的物理區(qū)域和信息范圍。覆蓋區(qū)域由計算機和傳感器網(wǎng)絡(luò)的配置和布設(shè)范圍決定,反映景區(qū)能否實現(xiàn)部門內(nèi)部、部門之間、景區(qū)與游客、景區(qū)與供應(yīng)商、景區(qū)與政府和其他合作者的連接;信息范圍反映能夠處理的信息類型,如門票信息、辦公文檔、設(shè)施實時狀態(tài)信息等,反映業(yè)務(wù)信息的數(shù)字化、結(jié)構(gòu)化程度。第二,服務(wù)能力,反映IT 基礎(chǔ)設(shè)施的服務(wù)能力,表現(xiàn)為服務(wù)的數(shù)量和深度。從服務(wù)數(shù)量來看,一般包括業(yè)務(wù)系統(tǒng)管理、通信管理、數(shù)據(jù)管理、IT培訓(xùn)與教育、IT研發(fā)與管理、安全管理、體系結(jié)構(gòu)與標(biāo)準(zhǔn)管理、渠道管理等IT治理層面的內(nèi)容;從服務(wù)深度來看,表現(xiàn)為選擇性提供和廣泛性提供,即某種服務(wù)是所有部門都需要的,還是部分部門選擇性使用的,反映了這種服務(wù)的需求強度。第三,柔性能力,反映IT基礎(chǔ)設(shè)施應(yīng)用層面的靈活性,與業(yè)務(wù)流程緊密相關(guān),也是某個景區(qū)具有個性和競爭力的IT應(yīng)用層。其中應(yīng)用邏輯(業(yè)務(wù)邏輯) 的組件化及其之間接口的標(biāo)準(zhǔn)化是關(guān)鍵。IT基礎(chǔ)設(shè)施柔性的程度依賴于每一項IT基礎(chǔ)設(shè)施應(yīng)用所包含的業(yè)務(wù)流程的特征。(2) IT人力資源能力 景區(qū)的IT人力資源能力包括IT的技術(shù)技能和管理技能兩個方面。IT的技術(shù)技能是指景區(qū)信息技術(shù)部門或業(yè)務(wù)部門的信息化崗位員工所掌握的IT技能,主要包括技術(shù)人員的軟硬件技術(shù)方面的能力,如數(shù)據(jù)庫管理能力、程序編寫和修改能力、(網(wǎng)絡(luò))操作系統(tǒng)的使用和維護能力、服務(wù)器及各種網(wǎng)絡(luò)產(chǎn)品的使用能力等。它體現(xiàn)了景區(qū)通過建設(shè)業(yè)務(wù)信息系統(tǒng)或電子商務(wù)平臺,提高景區(qū)工作效率和服務(wù)質(zhì)量的能力。IT的管理技能是指景區(qū)規(guī)劃、開發(fā)和應(yīng)用信息技術(shù)來支持和提高景區(qū)服務(wù)能力的技能,如景區(qū)信息管理部門的戰(zhàn)略規(guī)劃能力,與顧客、供應(yīng)商互動整合其需求的能力,以及為了達(dá)到以上目標(biāo)所具有的管理與領(lǐng)導(dǎo)能力(戰(zhàn)略分析能力、技術(shù)管理能力、項目管理能力、業(yè)務(wù)需求識別能力、跨部門協(xié)調(diào)能力以及各種業(yè)務(wù)管理能力等)。上述兩者,技術(shù)能力是基礎(chǔ),管理能力是關(guān)鍵。一般說來,企業(yè)信息化與管理標(biāo)準(zhǔn)化是互相促進、相互依賴的關(guān)系。智慧景區(qū)的建設(shè),實質(zhì)上是景區(qū)利用信息技術(shù)促進“保護、管理和服務(wù)”三大職能持續(xù)改善的過程,最終表現(xiàn)為景區(qū)管理的高度智能、服務(wù)的高度智慧和保護的高度有效。因此,IT人力資源能力中,管理能力是最重要的,體現(xiàn)在管理業(yè)務(wù)的嵌入性。游離于業(yè)務(wù)流程之外的人力資源,無法形成企業(yè)能力。(3) 基于IT的智慧能力景區(qū)基于IT的無形能力可以稱為智慧能力,是集中體現(xiàn)景區(qū)信息化建設(shè)成果的層面,也是實現(xiàn)技術(shù)應(yīng)用與流程變革協(xié)同效應(yīng)的層面。基于IT的智慧能力可從3個方面進行考查。第一,客戶導(dǎo)向能力。包括對游客偏好的挖掘與跟蹤能力、整合各部門信息滿足游客需求的能力、IT部門與業(yè)務(wù)部門合作決策的能力。這種能力要求景區(qū)建立客戶導(dǎo)向的管理機制,培養(yǎng)以客戶為中心的經(jīng)營理念,實施以客戶為中心的業(yè)務(wù)流程,并以此為手段來提高景區(qū)的獲利能力、收入以及游客滿意度。第二,知識管理能力。是指衡量信息技術(shù)推動景區(qū)各種知識的集約、應(yīng)用、傳播和創(chuàng)新的能力。景區(qū)的智慧性,更重要的是決策能力的智慧性。決策依賴于對游客行為的準(zhǔn)確感知和對游客需求的正確把握,這些都屬于游客知識。而游客知識更多地分布在一線員工頭腦之中。智慧景區(qū)要求建立合理的知識治理機制、高效的知識管理制度和有效的知識管理系統(tǒng),并把知識管理融入業(yè)務(wù)處理,建立知識密集的景區(qū)服務(wù)與管理流程。第三,景區(qū)協(xié)同能力。通過信息系統(tǒng)實現(xiàn)資源共享、及時溝通、跨部門協(xié)作,低成本高效率研發(fā)新產(chǎn)品/新服務(wù),高度響應(yīng)游客需求的能力。協(xié)同是指系統(tǒng)的各個個體通過協(xié)作導(dǎo)致新的空間結(jié)構(gòu)、時間結(jié)構(gòu)和功能結(jié)構(gòu)形成的過程或狀態(tài)(Haken,1978)。基于IT的景區(qū)協(xié)同,是在景區(qū)戰(zhàn)略指導(dǎo)下,實現(xiàn)了技術(shù)應(yīng)用創(chuàng)新、流程創(chuàng)新和管理創(chuàng)新后,把景區(qū)相關(guān)資源全面集成一體,構(gòu)建成一個以游客需求為驅(qū)動力的能力系統(tǒng),實現(xiàn)了全面的時空和功能重構(gòu),表現(xiàn)為高度智慧的經(jīng)營實體。這種景區(qū)協(xié)同能力,由諸多IT資源與業(yè)務(wù)資源全面整合形成,具備了戰(zhàn)略競爭資源所需要的價值性、稀缺性、不可模仿和不可替代性等特性(陳建斌,等,2007)。

2.3.2智慧景區(qū)的IT能力系統(tǒng)框架景區(qū)的功能有三大類:資源保護、運營管理、游客服務(wù)。景區(qū)三大功能決定了它必須具備3個核心能力,即資源保護能力、運營管理能力和游客服務(wù)能力。而IT能力則是服務(wù)于3個核心能力,并高度嵌入這些核心能力,最終實現(xiàn)景區(qū)的高度智慧化。智慧景區(qū)的IT驅(qū)動的整體能力模型如圖1所示。

圖1智慧景區(qū)IT能力框架

3智慧景區(qū)的建設(shè)內(nèi)容智慧景區(qū)的建設(shè)內(nèi)容應(yīng)該遵循能力建設(shè)路徑,著重于“智慧”能力的培育和加強。智慧是一種理解和解決問題的能力,并且是“迅速、靈活、正確”的理解和解決。那么智慧的景區(qū),就應(yīng)該具備突出的理解游客、服務(wù)游客的能力。理解的前提是敏銳的感知和深邃的思考,服務(wù)的前提是快速的反應(yīng)和有效的實施。因此,本文認(rèn)為,“游客感知系統(tǒng)、決策支持系統(tǒng)和游客服務(wù)系統(tǒng)”是智慧景區(qū)的建設(shè)核心。

3.1游客感知系統(tǒng)游客感知系統(tǒng)是一個綜合性、靈敏性要求較高的神經(jīng)網(wǎng)絡(luò),既要把“神經(jīng)末梢”通過互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等伸展到游客可能到達(dá)的各個接觸點,也要把游客信息盡可能全面和及時地傳遞給數(shù)據(jù)中心和決策中心。這需要基于位置信息、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘技術(shù)和人工智能對游客行為進行詳盡分析,并進行全面的信息資源規(guī)劃和感知網(wǎng)絡(luò)建設(shè)規(guī)劃。游客感知系統(tǒng)包括由傳感器感知旅游資源的ID、屬性、狀態(tài)、位置等各類信息的神經(jīng)末梢、由無線傳感自組網(wǎng)絡(luò)技術(shù)與互聯(lián)網(wǎng)傳遞信息的神經(jīng)網(wǎng)絡(luò),以及GIS、商務(wù)智能、信息資源整合技術(shù)進行數(shù)據(jù)分析和再利用的大腦系統(tǒng)組成。景區(qū)對游客的感知,可以分為游前、游中和游后3個階段。游前,游客基于互聯(lián)網(wǎng)的信息查詢和預(yù)訂,能夠讓景區(qū)感知到游客的基本身份信息和游覽需求;游中,根據(jù)移動通信、GPS、RFID等,可以感知到游客的來源、游覽路線、交通工具和關(guān)注的景點、游覽內(nèi)容等;游后,可以根據(jù)游客反饋獲得游覽的體驗信息和改善信息。

3.2決策支持系統(tǒng)景區(qū)的決策支持是景區(qū)信息化研究的熱點,成果比較多,如景區(qū)的專家系統(tǒng)、推薦系統(tǒng)、導(dǎo)覽系統(tǒng)等(Venturini,Ricci,2006;Kramer,et al.,2007;Fesenmaier,et al.,2006;Martin,et al.,2011),應(yīng)用范圍主要有旅游監(jiān)測和預(yù)測(杜軍平,周亦鵬,2009;江兵,等,2011),也有面向游客的規(guī)劃系統(tǒng)(李強,等,2008)。其中,人工智能是智慧旅游用來有效處理與使用數(shù)據(jù)、信息與知識,利用計算機推理技術(shù)進行決策支持并解決問題的關(guān)鍵技術(shù)(張凌云,等,2012)。智慧景區(qū)的決策支持,應(yīng)該包括景區(qū)管理決策和游客個人決策兩個方面。這兩層決策又相互聯(lián)系、相互支持。因此,智慧景區(qū)的決策支持系統(tǒng)就是集成應(yīng)用多種決策技術(shù)(人工智能、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘與OLAP、Agent技術(shù)等),基于多種數(shù)據(jù)(傳感器數(shù)據(jù)、移動通信數(shù)據(jù)、網(wǎng)絡(luò)訪問數(shù)據(jù)、景區(qū)資源)建立景區(qū)游客行為模型和管理決策模型,并根據(jù)個性化推薦系統(tǒng)和實時監(jiān)測系統(tǒng),動態(tài)響應(yīng)游客的個人決策請求(預(yù)訂決策、路線決策、購物決策等),并輔助景區(qū)管理者做出調(diào)度決策(客流控制、資源調(diào)配、應(yīng)急救援等)。智慧景區(qū)的決策支持系統(tǒng)是大腦中樞,負(fù)責(zé)集中處理游客感知系統(tǒng)采集到的大量數(shù)據(jù),根據(jù)算法和模型進行仿真、挖掘,并驅(qū)動游客服務(wù)系統(tǒng)實施決策結(jié)果,為游客行為決策和景區(qū)管理決策提供支持,因此它是智慧景區(qū)的核心。

3.3游客服務(wù)系統(tǒng)游客服務(wù)系統(tǒng)是一個高集成度的信息系統(tǒng),既包括基于互聯(lián)網(wǎng)的旅游信息查詢、個性化推薦等數(shù)字服務(wù),也包括為游客提供實體服務(wù)的信息管理系統(tǒng)(如門禁系統(tǒng)、導(dǎo)覽系統(tǒng)、解說系統(tǒng)、餐飲管理系統(tǒng)、交通管理系統(tǒng)、住宿管理系統(tǒng)、娛樂設(shè)施管理、購物管理系統(tǒng)等)。游客服務(wù)系統(tǒng)是游客實際游覽過程中食、住、行、游、購、娛等實體服務(wù)的神經(jīng)系統(tǒng),應(yīng)具有以下特征。(1)高度集成性。即以“游客”及其行為為主體,通過建構(gòu)游客全生命周期模型,集中管理和調(diào)度景區(qū)資源,為游客提供全方位一致性的跟隨服務(wù)。(2)高度智能性。即由于有了決策支持系統(tǒng)的內(nèi)核驅(qū)動,服務(wù)系統(tǒng)具備了一定的“智能”性,能夠感知到游客的個性化需求,并提供相應(yīng)的個性化服務(wù)。(3)高度響應(yīng)性。即通過廣泛分布的游客信息感知單元,能夠及時感知和響應(yīng)游客需求并實現(xiàn)快速調(diào)度設(shè)施和服務(wù),讓游客感受到無所不在的即時服務(wù)。4結(jié)論與展望智慧景區(qū)建設(shè)是一個漸進的發(fā)展過程,任重道遠(yuǎn),不可能一蹴而就。智慧景區(qū)的實現(xiàn),與信息技術(shù)應(yīng)用效果、面向游客的流程重組、景區(qū)信息化的努力程度和科學(xué)態(tài)度密切相關(guān)。智慧景區(qū)并不是技術(shù)構(gòu)架起來的物理系統(tǒng),而是一個由“人、機、物、活動”構(gòu)建起來的包括制度創(chuàng)新在內(nèi)的社會系統(tǒng)。智慧景區(qū)的建設(shè)要點是,IT投入以后的景區(qū)智慧能力的培育與增強,以及各種IT資源和能力集成后形成的協(xié)同效應(yīng),從而構(gòu)建獨有的企業(yè)IT能力系統(tǒng)。本文從企業(yè)IT能力理論出發(fā),初步探討了智慧景區(qū)的能力內(nèi)涵和IT能力體系,并提出了圍繞智慧能力需要建設(shè)的3個核心系統(tǒng):游客感知系統(tǒng)、決策支持系統(tǒng)和游客服務(wù)系統(tǒng),為智慧景區(qū)的建設(shè)提供了一定的理論基礎(chǔ)。關(guān)于智慧景區(qū)建設(shè)能力模型的進一步研究和應(yīng)用,以及建設(shè)內(nèi)容的細(xì)化,或許是智慧景區(qū)未來的研究重點和發(fā)展方向。

參考文獻:

[1]陳建斌,方德英,汪惠.企業(yè)IT能力系統(tǒng)動態(tài)演變的分析模型研究[J].管理評論,2010(3):6368.

[2]陳建斌,方德英,黃愛華.多元化企業(yè)IT協(xié)同能力的構(gòu)成及其形成研究[J].外國經(jīng)濟與管理,2007(10):2631.

[3]黨安榮,張丹明,陳楊.智慧景區(qū)的內(nèi)涵與總體框架研究[J].中國園林,2011(9):1521.

[4]杜軍平,周亦鵬.基于數(shù)據(jù)的旅游管理決策支持系統(tǒng)研究[J].自動化學(xué)報,2009(6):834840.

[5]江兵,劉健康,胡崇德.太白山自然保護區(qū)旅游監(jiān)測決策支持系統(tǒng)研究[J].計算機工程與設(shè)計,2011(8):28972900.

[6]李強,衛(wèi)海燕,王威.面向游客旅游決策支持系統(tǒng)的設(shè)計與實現(xiàn)——以西安翠華山國家地質(zhì)公園為例[J].測繪科學(xué),2008(6):211213.

[7]李洪鵬,高蘊華,趙旭偉.數(shù)字景區(qū)轉(zhuǎn)型智慧景區(qū)的探索[J].智能建筑與城市信息,2011(7):112113.

[8]彭賡,霍國慶.企業(yè)信息系統(tǒng)進化中的信息集成軌跡[J].管理評論,2004(1):1520,63.

[9]邵振峰,章小平,馬軍,鄧貴平.基于物聯(lián)網(wǎng)的九寨溝智慧景區(qū)管理[J].地理信息世界,2010(5):1217.

[10]張凌云,黎巎,劉敏.智慧旅游的基本概念與理論體系[J].旅游學(xué)刊,2012(5):6674.

[11]張嵩,李文立,黃麗華.電子商務(wù)環(huán)境下企業(yè)IT基礎(chǔ)設(shè)施能力的構(gòu)成研究[J].計算機集成制造系統(tǒng),2004(11):14591465.

[12]Bharadwaj A S(2000).A resourcebased perspective on information technology capability and firm performance:An empirical investigation[J],MIS Quarterly,March,24(1),169196.

[13]Fesenmaier D,Werthner H,Wober K(2006).Destination Recommendation Systems:Behavioral Foundations and Applications[M].Cambridge,MA:CAB International.

[14]Haken H(1978).Synergetics[M].SpringesVerlag,Berling Hoidelberg,NewYork.

[15]Kramer R,Modsching M,Ten Hagen K(2007).Development and evaluation of a context driven,mobile tourist guide[J].International Journal of Pervasive Computing and Communication,3(4),378399.

[16]Martin D,Alzua A,Lamsfus C(2011).A contextual geofencing mobile tourism service[C].Information and communication technologies in tourism:191202.Vienna,Austria:Springer Verlag.

[17]Venturini A,Ricci F(2006).Applying Trip@dvice recommendation technology to [C].4th prestigious applications of intelligent systems(PAIS2006).The 17th European Conference on Articial Intelligence,Riva del Garda,Italy,Aug 28thSept 1st.

A Study on the IT Capability Model of Smart

Scenic Area and Its Core Components

CHEN Jianbin1, ZHENG Li1, ZHANG Lingyun2

(1.Business College of Beijing Union University;

2.Tourism Institute of Beijing Union University, Beijing 100025, China)

第12篇

(中國石油大學(xué)(北京)信息學(xué)院,北京102249)

摘要:針對當(dāng)前計算機基礎(chǔ)教學(xué)的現(xiàn)狀,分析石油院校計算機基礎(chǔ)教學(xué)發(fā)展與改革的歷程及面臨的困境,提出在當(dāng)前以計算機思維為導(dǎo)向的計算機基礎(chǔ)教學(xué)改革目標(biāo)指導(dǎo)下,如何面向?qū)I(yè)應(yīng)用能力培養(yǎng)計算機思維,闡釋其課程體系及其運行機制。

關(guān)鍵詞 :大學(xué)計算機基礎(chǔ)教育;計算思維;程序設(shè)計

文章編號:1672-5913(2015)17-0076-03

中圖分類號:G642

基金項目:中國石油大學(xué)(北京)本科教學(xué)改革項目( 2014yb098);中國石油大學(xué)(北京)研究生質(zhì)量與創(chuàng)新工程項目( 2013yb039)。

第一作者簡介:王新,女,副教授,研究方向為數(shù)據(jù)庫、數(shù)據(jù)挖掘,xinwang@cup.edu.cn。

0 引言

隨著計算機技術(shù)的飛速發(fā)展和廣泛應(yīng)用,計算機科學(xué)與多種學(xué)科相互滲透,產(chǎn)生了多種邊緣學(xué)科。計算機基礎(chǔ)課程內(nèi)容不斷地改革和調(diào)整,教學(xué)理論和教學(xué)目標(biāo)也在發(fā)展和深化,其中有幾次重大改革:①1997年提出的計算機文化基礎(chǔ)課程體系,以計算機技能培養(yǎng)為主;②2004年提出的大學(xué)計算機基礎(chǔ)課程體系,以計算機應(yīng)用能力培養(yǎng)為主;③2010年,以《九校聯(lián)盟( C9)計算機基礎(chǔ)課程教學(xué)發(fā)展戰(zhàn)略聯(lián)合聲明》為標(biāo)志,以計算思維培養(yǎng)為主的新一輪課程改革開始了。

1 計算機基礎(chǔ)教育現(xiàn)狀與面臨的困境

隨著互聯(lián)網(wǎng)的應(yīng)用與發(fā)展,計算機基礎(chǔ)教學(xué)產(chǎn)生了越來越多的困境。其主要原因:中小學(xué)信息技術(shù)教育的普及,入校的新生對計算機操作的技能大幅提升,使得計算機科學(xué)與技術(shù)具有平民化的趨勢,部分專業(yè)人士認(rèn)為計算機基礎(chǔ)教育可弱化或取消;按教育部要求,高校各專業(yè)總學(xué)分大幅縮減,計算機基礎(chǔ)課的教學(xué)學(xué)時被壓縮,教學(xué)資源配置不充分;很多人將計算機科學(xué)等同于計算機編程,淡化了計算機的科學(xué)意義,削弱了計算機學(xué)科的內(nèi)涵。計算機基礎(chǔ)課程教學(xué)內(nèi)容過分偏重計算機工具及其使用方法;教材基本上是有關(guān)領(lǐng)域的濃縮版,學(xué)生進入大學(xué)后,對第一門計算機課程興趣不大;課程教學(xué)在分層次、分類別上也存在明顯不足,使得計算機基礎(chǔ)教育教學(xué)自身的地位也有所降低;更為關(guān)鍵的是信息化素養(yǎng)與專業(yè)技能融合缺少具體的實施方案和有效的實現(xiàn)途徑。基于上述原因,2010年,教育部高等學(xué)校計算機基礎(chǔ)課程教指委明確提出:計算機基礎(chǔ)課程應(yīng)成為大學(xué)通識類課程;與大學(xué)通識類課程地位相適應(yīng),大力推動以計算思維為導(dǎo)向的計算機基礎(chǔ)課程的教改;持續(xù)開展在計算機基礎(chǔ)課程教學(xué)中體現(xiàn)計算思維能力培養(yǎng)的一系列研討、立項和交流培訓(xùn)工作。

2 石油高校計算機基礎(chǔ)教育重在計算思維的培養(yǎng)

眾所周知,石油、石化行業(yè)是計算機技術(shù)廣泛應(yīng)用的領(lǐng)域,石油高校計算機基礎(chǔ)教學(xué)承擔(dān)著培養(yǎng)石油、石化專業(yè)人才計算機應(yīng)用能力的重任,而信息技術(shù)與專業(yè)技術(shù)相融合是提升學(xué)生專業(yè)應(yīng)用能力和創(chuàng)新能力的迫切需求。培養(yǎng)創(chuàng)新型人才,首先要培養(yǎng)人才的科學(xué)思維方式,即訓(xùn)練人才的實證思維、邏輯思維和計算思維。由此可見,訓(xùn)練計算思維是培養(yǎng)復(fù)合型人才的需要。

3 面向?qū)I(yè)應(yīng)用能力,培養(yǎng)計算機思維

大學(xué)計算機課程的改革進程可分為4個層面:理論層面上研究計算思維的內(nèi)涵與表現(xiàn)形式;系統(tǒng)層面上規(guī)劃大學(xué)計算機課程的知識結(jié)構(gòu)和課程體系;操作層面上將大學(xué)計算機課程作為培養(yǎng)計算思維能力的有效手段;實踐層面上探索不同層次培養(yǎng)目標(biāo)、不同專業(yè)應(yīng)用需求的途徑。

鑒于以上指導(dǎo)意見,明確計算機基礎(chǔ)教育的總體目標(biāo)和課程的知識結(jié)構(gòu)、構(gòu)建課程體系、建設(shè)教學(xué)資源是我們深化大學(xué)計算機課程改革的總體思想。

計算機基礎(chǔ)教學(xué)的總體教學(xué)目標(biāo)分為3個層次,即“普及計算機文化,培養(yǎng)專業(yè)應(yīng)用能力,訓(xùn)練計算機思維能力”,為此需明確石油高校計算機基礎(chǔ)教學(xué)的基本要求和課程體系。

(1)計算機基礎(chǔ)教學(xué)的要求。面對石油各專業(yè),計算機基礎(chǔ)教育總體上應(yīng)使學(xué)生了解計算機科學(xué),會構(gòu)建計算環(huán)境,熟練掌握數(shù)據(jù)處理方法與表達(dá)方式,提高計算機應(yīng)用能力,善于靈活運用計算機解決問題。這就要求學(xué)生具體達(dá)到以下要求:比較系統(tǒng)地了解和掌握計算機系統(tǒng)與網(wǎng)絡(luò)、程序設(shè)計、數(shù)據(jù)庫以及多媒體技術(shù)等方面的基礎(chǔ)概念與基本原理,了解信息技術(shù)的發(fā)展趨勢;熟悉正確的程序設(shè)計方法與思想,具有初步的應(yīng)用軟件開發(fā)基礎(chǔ);具有數(shù)據(jù)庫應(yīng)用系統(tǒng)的初步設(shè)計、開發(fā)與應(yīng)用能力;能利用常用工具處理多媒體數(shù)據(jù),初步掌握多媒體應(yīng)用系統(tǒng)的集成與開發(fā)能力;培養(yǎng)良好的信息素養(yǎng),訓(xùn)練計算思維,能夠利用計算機手段進行問題表達(dá)與交流,學(xué)會像計算機科學(xué)家一樣思考與解決問題;利用Internet進行主動學(xué)習(xí),增強專業(yè)應(yīng)用能力,為專業(yè)學(xué)習(xí)奠定必要的計算機基礎(chǔ)。

(2)計算機基礎(chǔ)教學(xué)的知識結(jié)構(gòu)。按照教育部的指導(dǎo)意見,我校計算機基礎(chǔ)教育的知識結(jié)構(gòu)應(yīng)滿足3個層次、4個知識領(lǐng)域。

3個層次:①概念性基礎(chǔ),要求學(xué)生掌握計算機學(xué)科的基本概念和主要的基本理論知識,是各專業(yè)學(xué)生必學(xué)的內(nèi)容;②技術(shù)與方法基礎(chǔ),要求學(xué)生掌握本專業(yè)常用的計算機應(yīng)用軟硬件技術(shù)和相關(guān)理論方法,不同類別的專業(yè)有不同的側(cè)重點;③應(yīng)用拓展技能,結(jié)合各專業(yè)、各知識領(lǐng)域中有較大共性的、最主要的一些應(yīng)用性技能,使信息技術(shù)與專業(yè)技能相結(jié)合,不同類別的專業(yè)各有側(cè)重。

3個層次的教學(xué)過程始終貫穿一條主線:網(wǎng)絡(luò)數(shù)據(jù)庫多媒體,以計算思維訓(xùn)練為導(dǎo)向。

4個知識領(lǐng)域:計算機系統(tǒng)與平臺、程序設(shè)計基礎(chǔ)、數(shù)據(jù)分析與信息處理、信息系統(tǒng)開發(fā)與應(yīng)用,使學(xué)生充分了解計算機軟硬件系統(tǒng)的基本結(jié)構(gòu)和工作原理,問題分析與表示方法,系統(tǒng)設(shè)計與實現(xiàn)的主要算法,數(shù)據(jù)的組織、管理以及處理過程,應(yīng)用系統(tǒng)實現(xiàn)與平臺構(gòu)建的流程。

(3)構(gòu)建計算機基礎(chǔ)教學(xué)課程體系。①課程設(shè)置指導(dǎo)思想:根據(jù)我校不同專業(yè)對計算機應(yīng)用的不同要求,從知識、能力、素質(zhì)要求出發(fā),計算機基礎(chǔ)教學(xué)課程設(shè)置的原則是:以訓(xùn)練計算機思維為導(dǎo)向,重基礎(chǔ)、強實踐,培養(yǎng)學(xué)生的綜合應(yīng)用能力;②計算機基礎(chǔ)教學(xué)的典型核心課程主要包括大學(xué)計算機基礎(chǔ)(大學(xué)計算機基礎(chǔ)理論+大學(xué)計算機基礎(chǔ)實踐)、算法與程序設(shè)計基礎(chǔ)、計算機硬件技術(shù)基礎(chǔ)(微機原理與應(yīng)用、單片機原理與應(yīng)用)、數(shù)據(jù)庫技術(shù)與應(yīng)用、網(wǎng)絡(luò)技術(shù)與應(yīng)用、多媒體技術(shù)與應(yīng)用,不同類別的專業(yè)可根據(jù)學(xué)分要求選取不同的知識模塊(見表1);③課程設(shè)置方案:各專業(yè)采用“1+X”的方案,即大學(xué)計算機基礎(chǔ)+若干必修/選修課程,而將大學(xué)計算機基礎(chǔ)實踐作為獨立設(shè)置的實踐環(huán)節(jié),以滿足各專業(yè)認(rèn)證的實踐需求。對本校各類專業(yè)選修計算機課程的建議見表1。

4 主要的改革措施和成果

(1)加強師資隊伍建設(shè)。在各高校中從事計算機基礎(chǔ)教學(xué)的教師通常被認(rèn)為是“沒有前途的”,導(dǎo)致基礎(chǔ)教學(xué)的師資不穩(wěn)定。我校2010年之后經(jīng)過院系調(diào)整,明確了由軟件工程系組織管理計算機基礎(chǔ)教學(xué),基礎(chǔ)課教學(xué)由計算機學(xué)科教師共同承擔(dān),形成了穩(wěn)定的基礎(chǔ)課教師隊伍,教師均為計算機學(xué)科的碩士、博士,年齡在35~50歲之間,精力充沛、教學(xué)經(jīng)驗豐富。

(2)激勵教學(xué)研究,鼓勵發(fā)表教改論文。計算機基礎(chǔ)教學(xué)內(nèi)容更新快、變化大,授課對象層次參差不齊,必須不斷地研究教學(xué)內(nèi)容、教學(xué)方法與教學(xué)手段、考核與評價方式、教材選用與教材建設(shè)以及教學(xué)過程的內(nèi)在規(guī)律。近年來學(xué)校對大班授課、小班討論,卓越班和創(chuàng)新班的培養(yǎng)方案,研究型、研討型、MOOCs、翻轉(zhuǎn)課堂、知識碎片化等授課方式,以及任務(wù)驅(qū)動、項目管理、案例化教學(xué)等教學(xué)改革項目予以大力支持,鼓勵教師發(fā)表高水平的教學(xué)改革論文。

(3)教學(xué)團隊建設(shè)。計算機基礎(chǔ)課程授課面大,上同一門課程的教師較多,教學(xué)團隊的管理極為重要。團隊發(fā)展規(guī)劃是否科學(xué)、日常教學(xué)活動組織安排是否合理,關(guān)系到每個教師的成長。重點建設(shè)公共基礎(chǔ)課教學(xué)團隊是學(xué)校團隊建設(shè)的原則。目前計算機軟件基礎(chǔ)課程教學(xué)團隊為北京市優(yōu)秀教學(xué)團隊,C語言教學(xué)團隊為校級優(yōu)秀教學(xué)團隊,大學(xué)計算機基礎(chǔ)教學(xué)團隊為校級培育教學(xué)團隊。

(4)積極輔導(dǎo)學(xué)生參加學(xué)科競賽。學(xué)科競賽是展現(xiàn)學(xué)生應(yīng)用能力的平臺,也是促進學(xué)生學(xué)習(xí)興趣的有效途徑。計算機基礎(chǔ)課教師承擔(dān)著全校學(xué)生參加全國信息技術(shù)應(yīng)用水平大賽(原ITAT大賽)、藍(lán)橋杯大賽(全國軟件專業(yè)人才設(shè)計與創(chuàng)業(yè)大賽)以及各種計算機相關(guān)應(yīng)用學(xué)科競賽的課外輔導(dǎo)工作,承擔(dān)校內(nèi)C語言程序設(shè)計大賽的考試與評審工作。

5 結(jié)語

鑒于計算機基礎(chǔ)教學(xué)的學(xué)時被逐漸壓縮的事實,提高各專業(yè)相關(guān)人員對計算機應(yīng)用能力和計算思維的認(rèn)識極為重要,這是信息社會中培養(yǎng)具有科學(xué)思維的創(chuàng)新人才的要求,而構(gòu)建與學(xué)校特色、學(xué)生層次相適宜的課程體系和運行機制是培養(yǎng)計算思維的有力保障,研究并實施新的教學(xué)方法與手段是訓(xùn)練計算思維的有效途徑,探討并執(zhí)行信息素質(zhì)與專業(yè)素質(zhì)相互滲透的實施方案是培養(yǎng)具有綜合應(yīng)用能力的復(fù)合型創(chuàng)新人才之有效途徑。

參考文獻:

[1]陳國梁,董榮勝,計算思維與大學(xué)計算機基礎(chǔ)教育[J].中國大學(xué)教學(xué),2011(1): 7-11.

[2]劉桂松,李茂國.大學(xué)計算機系列課程改革思考[J].中國大學(xué)教學(xué),2012(11): 39-41.

[3]教育部大學(xué)計算機課程教學(xué)指導(dǎo)委員會,關(guān)于申報大學(xué)計算機課程改革項目的通知[Z],2012.

[4]教育部高等學(xué)校計算機基礎(chǔ)課程教學(xué)指導(dǎo)委員會,高等學(xué)校計算機基礎(chǔ)教學(xué)發(fā)展戰(zhàn)略研究報告暨計算機基礎(chǔ)課程教學(xué)基本要求[M].北京:高等教育出版社,2009: 21-23.

亚洲精品无码久久久久久久性色,淫荡人妻一区二区三区在线视频,精品一级片高清无码,国产一区中文字幕无码
亚洲中文精品在线观看 | 亚洲精品网站在线观看 | 中文成人无字幕乱码精品区 | 亚洲欭美日韩颜射在线二 | 中国精品视频久久久久久 | 人人做人人爱在碰一区三区 |