聚類分析論文

時間：2023-02-01 01:35:12

開篇：寫作不僅是一種記錄，更是一種創造，它讓我們能夠捕捉那些稍縱即逝的靈感，將它們永久地定格在紙上。下面是小編精心整理的12篇聚類分析論文，希望這些內容能成為您創作過程中的良師益友，陪伴您不斷探索和進步。

聚類分析論文

第1篇

1.1城郊農戶此種類型的農戶主要是對其生活、農業種植、畜禽養殖、鄉村旅游進行污染區分。①污染源區分：農家樂是目前鄉村旅游的重要形式，其污染源包括污水、人類尿便等，鄉村旅游污染和旅游人數之間有著直接的關系。所以，這一類污染的產污單元可以看做是每一位鄉村游客。②污染強度的劃分：生活污水（包括垃圾、人類尿）排放強度=每戶游客污水日排放量/每戶游客數。

1.2種養結合戶此種類型農戶的污染源劃分主要是根據農戶種植污染、畜禽養殖污染、農戶生活污染等進行劃分。其中，畜禽養殖污染源的劃分同典型養殖戶；農戶生活、農戶農業種植污染源識別同典型種植戶。

2農村環境污染物排放的核算

2.1農村環境污染物具體排放量的計算研究得知，各污染源污染實物的排放量多少是和流失系數、產污系數等密切相關的。而農村環境污染具有極其明顯的地域性，所以我們計算中需要的參數值必須通過對某一地區內各種相關聯的因素進行測定和綜合分析才能得出。目前，得出這些參數的方法一般有兩種，一是通過特定地區的污染發生學實驗研究來得出，二是通過相關的文獻進行篩選、調研。

2.2農村環境污染敏感性的調研這里提到的敏感性主要是指調研區域地表水環境對農村各種社會經濟活動的反應的敏感程度。可以反映產生地表水水體富營養化的概率的大小，敏感性分為5級，即不敏感、輕度敏感、中度敏感、高度敏感、極敏感。根據相關的調查，對農村環境污染的敏感性評價可以采用污染物（COD、TN、TP）的排放濃度結合水質評價模型進行評定。具體可有以下3種方法。①單向水質指數法。在確定各基本單元的基本指數后，用污染物（COD、TN、TP）的水質指數作為變量，進行全面的聚類分析，然后根據分析結果，劃分敏感級別。②加權指數法。運用加權指數法可以反映出污染物（COD、TN、TP）在不同地區對環境污染的影響。首先要確定影響農村環境污染敏感性發熱污染物（COD、TN、TP）的排放濃度，然后再依據加權指數法計算出各基本敏感單元的敏感性數值。③內梅羅綜合指數法。如果單項水質指數的數值變化很大，為了更加有效的突出各個高值的影響，就可以采用內梅羅平均值法。同樣，在確定了各基本單元的內梅羅指數后，以其指數為變量。進行綜合的聚類分析，然后根據分析結果劃分敏感性等級。

3污染程度的區分

首先確定環境污染中的主要污染物、總污染負荷，然后與區域相結合確定重點污染區域，進而確定其污染程度。

3.1水質系數和排放濃度要想全面的反映出區域污染的狀況，要從排污總量和排污濃度兩方面上來進行考慮，水質系數反映評價標準和污染物濃度之間的關系，其中：污染物水質指數=該污染物排放濃度/該地環境質量標準

3.2聚類分析進行聚類分析要運用SPSS軟件，采用Q型聚類，通過對農村環境污染源等標污染的負荷率進行綜合的聚類分析，然后來區分不同區域的主要污染類型，比如種植污染型、養殖污染型、綜合污染型、生活污染型等。

4結語

第2篇

摘要對北京體育大學2003-2012年體操方向碩士學位論文的關鍵詞詞頻統計與分析，研究高頻詞之間的結構關系，探究北京體育大學體操方向碩士學位論文的選題方向、研究內容及其不同的特點，分析熱點的形成原因與未來發展趨勢。

關鍵詞北京體育大學碩士學位論文研究熱點

一、研究方法與對象

研究方法主要采用詞頻統計法與共詞聚類分析法。詞頻統計法能夠揭示或表達文獻核心內容的關鍵詞或主題詞在某一研究領域中出現的頻次高低來確定該領域研究熱點和發展動向的文獻計量法。共詞聚類分析法是一種內容分析方法，通過對一組詞兩兩統計它們在同一片文獻中出現的頻率，以此為基礎對這些詞進行聚類分析，從而反映出詞與詞之間的親疏關系，進而分析這些詞所代表的學科和主題的研究結構。

二、研究生學位論文的共詞聚類分析

（一）關鍵詞詞頻統計與分析

本文利用《CNKI中國優秀碩士學位論文全文數據庫》，搜索出2003―2012年北京體育大學體操方向碩士學位論文共73篇，以73篇學位論文中的關鍵詞為調研對象，通過共詞分析法中的聚類分析探索各高頻關鍵詞之間的內在關系，歸納出北京體育大學體操碩士學位論文研究的熱點，以及各個不同研究方向的親疏性。本研究利用Excel對前期檢索出的學位論文進行關鍵詞統計，共得到碩士學位論文關鍵詞283個，平均每篇碩士學位論文含關鍵詞3.9個。然后對統計結果進行以下處理：去除對反應主題沒有積極意義的詞，如“展望”、“問題”等，對表達同一個意思的關鍵詞進行標準化處理，如“高職院校”、“職業技術院?！薄ⅰ奥毤几咝！钡葮藴驶癁椤案呗氃盒！?，“高等院校”、“高等學?！?、“高?！薄ⅰ按髮W”等標準化為“高?！?。

經過多次比較，最終選擇詞頻大于的關鍵詞作為高頻關鍵詞，從而確定個體操方向碩士學位論文的高頻關鍵詞（表1）。這個關鍵詞總的出現頻次為65次，占關鍵詞總頻次的36.3%。從高頻關鍵詞分布可以看出，北京體育大學體操方向碩士研究生重點關注的研究對象集中在“體育教育專業”、“分析”、“普通高?！?、“競技體操”、“北京市”、“教學理念”、“現狀”、“發展對策”等。

表1 碩士學位論文高頻關鍵詞表

序號關鍵詞詞頻

1 體育教育專業 12

2 分析 10

3 普通高校 8

4 競技體操 8

5 北京市 7

6 教學理念 7

7 現狀 7

8 發展對策 6

（二）構造詞篇矩陣、相似矩陣

對于高頻關鍵詞共現頻次的統計，本研究利用SPSS17.0，以每篇學位論文為一條記錄，記錄的內容為高頻關鍵詞是否在學位論文的關鍵詞出現（出現為1，否則為0），構造出詞篇矩陣。以詞篇矩陣為基礎，在SPSS軟件中進行相關分析，數據類型選擇“binary”二元變量，相似系數選擇“Ochiai”系數，構造出高頻關鍵詞的相似矩陣（見表2）。相似矩陣中的數字為相似數據，數字的大小則表明詞與詞之間的距離遠近，數值越大則表明詞與詞之間的距離越近，相似度越好；反之，數值越小，表明詞與詞之間的距離越遠，相似度越差。相似矩陣對角線的數據為1，表明某高頻關鍵詞自身相關度。

表2 碩士學位論文高頻關鍵詞的相似矩陣（部分）

體育教育專業分析普通高校競技體操北京市教學理念現狀發展對策

體育教育專業 1.000 0.060 0.286 0.004 0.192 0.321 0.334 0.215

分析 0.060 1.000 0.030 0.121 0.018 0.006 0.076 0.023

普通高校 0.028 0.030 1.000 0.150 0.030 0.068 0.119 0.029

競技體操 0.004 0.121 0.150 1.000 0.008 0.192 0.043 0.020

北京市 0.192 0.018 0.030 0.008 1.000 0.192 0.035 0.078

教學理念 0.321 0.006 0.068 0.192 0.192 1.000 0.087 0.186

現狀 0.334 0.076 0.119 0.043 0.035 0.087 1.000 0.100

發展對策 0.215 0.023 0.029 0.020 0.078 0.186 0.100 1.000

（三）北京體育大學體操方向碩士學位論文的研究熱點可以概括為以下幾類：

1.競技體操的發展對策。包括關鍵詞：競技體操、發展對策、后備人才。

2.北京市普通高校體育教育專業教學理念。包括關鍵詞：北京市、普通高校、體育教育專業、教學理念。

3.體育教育專業與教學能力。包括關鍵詞：體育教育專業、教學能力。

三、研究熱點的特點分析

（一）北京體育大學體操方向碩士學位論文的研究熱點比較寬泛，選取對象比較廣泛，包括普通高校、體育院校、競技體操、體操普修課、教學理念等。

（二）碩士學位論文注重對教學理念及競技體操發展狀況的研究，旨在通過現狀研究，探尋發展的脈絡與經驗。

（三）碩士學位論文注重對基本理論研究，研究內容寬泛。在理論分析上顯得薄弱、創新能力欠缺。

參考文獻：

[1] 高寶立，劉小強.高等教育研究熱點分析：兩個維度、四項指標――以現代大學制度研究為例[J].教育研究.2008（09）.

[2] 遲景明，吳琳.近十年我國高等教育學學科研究熱點和趨勢――基于研究生學位論文的共詞聚類分析[J].中國高教研究.2011（9）：20-24.

[3] 馬費成，張勤.國內外知識管理研究熱點――基于詞頻的統計分析[J].情報學報，2006.25（02）.

第3篇

論文關鍵詞：聚類分系,網絡營銷,策略,客戶關系

0前言

現代科學技術的迅猛發展，特別是在互聯網的應用和開發上更加的迅速，企業必須通過網絡對自己的產品加強宣傳以增強自己的競爭力?？蛻羰且粋€非常重要的、有價值的重要資源，現在如何更好地從數據庫中挖掘出客戶中有價值的信息，更好的培植和經營與有價值客戶的關系，拋棄那些無利可圖沒有發展前景而且營銷費用高的客戶，并且可以針對不同價值的客戶給與不同的政策同時制定出個性化的營銷策略，這些才能夠保證企業的生存發展。對于這一切數據挖掘無疑是行之有效的好方法之一。本文以一個網絡營銷公司為例，提出了一套可操作性的對客戶價值評價方法，然后使用數據挖掘技術中比較常見和常用的聚類分析算法對客戶信息進行聚類從而達到非常重要的信息并為企業在網絡營銷中提供決策依據。

1聚類分析

聚類（clustering）是對于數據挖掘技術是非常重要的一部分，現在也是數據挖掘技術中關鍵的一種。聚類的意義就是針對物理或邏輯上的數據對象的進行自動分類，最后將數據對象分為多個類或簇的過程。對于聚類結果要使得數據對象在同一個分類中具有最大的相似度，而在不同的類中具有最小相似度。聚類的現實意義就是在于可以將數據按照一定得關系進行自動的分類，事先不知道所有的數據對象共有多少類，通過算法的處理最后得到一個分類結果進行應用。譬如在市場研究領域中，特別是針對網絡營銷的企業或網站，從大量的網絡數據進行分析聚類，可以講客戶分成不同的類別，針對這些類別不同的購買力和興趣愛好來進行個性化的營銷手段，提高企業的經濟效益。目前研究人員大多針對于聚類分析算法的改進和完善進行研究，進而提高聚類分析的工作效率。著名的算法有：CLARANS，BRICH，DBSCAN，CURE，STING，CLIGUE和WaveCluster等。

2聚類分析應用于企業客戶資源管理

現針對某電子商務公司進行分析，該電子商務公司的客戶分布在全國各地以及國外一些地區，現僅列出具有代表性的10個大客戶：吉林，黑龍江，山東，江蘇，浙江，安徽，湖南，緬甸，印度，南非等。在數據挖掘的目的就是從客戶中找到一些共同點，在對這些客戶數據進行處理前要使用聚類分析的方法進行研究看看這10個客戶能否有一些共同之處以便企業針對不同類型的客戶給與不同的對策，首先對該公司采用專家打分的方法，而且還有通過網上問卷調查和訪談的方式，收集各地銷售專員的意見等方式，然后對數據加以綜合，最后聚類分析法確定各項指標的權重。

那么在具體實施聚類分析法的時候可分為5個步驟進行：

第1步：首先對各項指數構建層次結構，其中被評定的10個大客戶作為方案層，客戶價值放在目標層中進行處理，各項指標是準則層，按照這樣的分層結構來構造客戶關系評價系統中個指數的結構圖，見圖2-1所示；

表2-1指標權重值表

指標

權重

0.0378

0.0401

0.0135

0.0161

0.0251

0.0060

0.0038

0.0091

0.0192

指標

權重

0.0381

0.1498

0.1721

0.0021

0.0201

0.0085

0.0053

0.0231

0.0701

指標

權重

0.0212

0.0312

0.0754

0.1841

0.0145

0.0510

0.0078

0.0684

從數據可以看出有兩種情形：一是緬甸和南非，從數據中可看出這類客戶的當前價值很小，但是具有很大的隱含價值，勢必會有一天他們的成長給企業會帶來豐厚的物質利益，這樣具有發展潛能的客戶應該采取措施激發潛能；二是安徽和印度這類客戶，雖然從數據中看出這類客戶當前價值很小，但是就這兩個省份的地理位置和經濟狀況來分析他們隱含著較大的價值。對于這一類的客戶，企業就應該采取靈活的措施，激發他們的購買能力促使該類型的客戶不斷地向前發展；

第2類是“維持型”客戶，他們會源源不斷的為企業提供利潤，如黑龍江和江蘇，他們這類客戶根據以往的交易記錄分析到得結果就是目前價值大，不過沒什么發展的潛能，或者說在某種情況下它的時常還會萎縮，當前這類客戶會給企業帶肋比較豐厚的利潤但是就長期發展而言卻不是利潤的主要來源，他們在某種情況下會流失掉，會被其他的企業競爭對手的介入而流失，為此對于企業一方面要維持與這類客戶的良好關系，保持穩定的客戶關系，另一方面還要采取一些營銷手段來刺激該類客戶的消費，提供一些個性化的服務和策略；

第3類“淘汰型”客戶，這類用戶就如同雞肋了，對于企業的現在和將來都意義不大，目前的銷售份額較小，企業對他們營銷的成本還很高，年利潤率很低，根據分析這類客戶包括浙江、湖南和吉林，他們沒有長期的發展的趨勢，所以企業采取的策略就是應充分挖掘他們給企業帶來的當前價值后逐漸地放棄他們；

第4類是“貴賓型”客戶，這類用戶是企業的主要經濟利潤的來源，在某種程度上可以說是企業生存的保證，他對企業是關系到生死存亡的重要客戶，從數據中看山東就是該企業的這類貴賓型的客戶，他的當前價值和潛在價值都很大，企業必須認真對待，細心呵護與這類客戶的關系，以及該客戶企業的關鍵性人物的關系，加強與這類客戶的溝通和關系的培養，同時還要提高警惕，防止競爭對手搶走這些貴賓型客戶。針對貴賓型客戶企業就應該對其進行一對一的營銷策略，進行良好的客戶需求溝通，盡最大可能滿足他們的需求，適當給與一些特殊政策來加強和他們的關系。從不同角度來加強客戶對企業的忠誠度、滿意度等。企業根據這些重要的信息就可以針對不同的客戶采取合適的銷售策略。

第4篇

關鍵詞：洞庭湖區生態經濟區劃生態經濟建設

洞庭湖位于長江中游荊江河段南岸，地處湖南省北部和湖北省南部間，是我國第二大淡水湖泊。本文中的洞庭湖區僅指的是洞庭湖湖南省部分（未包括湖北省的公安、石首、松滋等），范圍包括岳陽市、常德市、益陽市三個市，共24個縣（市、區），土地面積為45363 km ，占到湖南省土地總面積的21.4%（具體見圖1）。在經濟上取得巨大成就的同時，洞庭湖區的生態環境卻令人擔憂，湖區生態經濟建設更顯得刻不容緩。

1.湖區區劃指標的建立

由于生態經濟區劃的復雜性、綜合性，強調自然和人文的有機耦合，因此在指標的選取上就必須做到全面，指標必須包含生態、經濟、社會等多方面的因素。本文在參照前人指標體系選擇的基礎上，結合湖南洞庭湖區的實際情況，分別從社會、經濟和生態方面選取了24個指標來構建本文生態經濟區劃的指標體系①。（見表1）

2.SPSS指標數據分析處理

2.1主成分分析

2.1.1將原始數據進行標準化處理

本文選取了20個行政單位，選取2004年的指標24個，這樣就組成一個20×24的原始數據矩陣。其中對原始數據矩陣X用以下公式進行標準化處理。公式如下：

2.1.2計算所有變量的相關矩陣R，得到相關系數矩陣：

2.1.3因子提取

采用主成分分析法，利用相關系數矩陣R進行因子提取。在SPSS中可以得到所有指標的特征值。根據特征值大于1的提取原則，并且公共因子的在變量總方差中所占的累計百分數達到84.661%，所以得到了能夠綜合反映洞庭湖區的生態經濟狀況的5個公因子。（見表2）

2.1.4因子旋轉

為便于對主因子進行解釋，知道每個主因子的意義，本文對因子載荷矩陣進行了旋轉。本文用的是最常用的最大方差旋轉法（Varimax）。（旋轉后的主成分特征值、貢獻率和累計貢獻率見表3）

2.1.5主成分的確定

計算5個主成分的得分。由20個區域5個主成分的因子得分組成一個新的數據矩陣S；由這個數據矩陣S組成下一步聚類分析的原始數據，根據主成分得分及方差貢獻確定權重（見表4），根據權重值，算出各區域綜合因子得分，并進行排序（見表5）。

2.2聚類分析

本文采用了系統聚類法（Hierarchical Cluster），定義各樣本點之間距離采用的是平方歐氏距離（Euclidean distance），接著計算出每2個樣本間的歐氏距離系數D ，其公式為：

式中：D ―i，j兩點的距離系數；X ―第i點第k因子的值；X ―第j點第k因子的值；m―因子的個數；q―指數。（公式：3）

然后根據距離系數，按照最短距離法，從矩陣表中選擇距離系數相似的樣本歸并為一類，將其組成新的序列，繼續計算新類同其它樣本之間的距離，如此反復，每進行一次縮小一類，直到得到所需的結果為止。通過系統聚類，可以得到樹狀譜系圖（圖2所示）。

從以上的聚類結果來看，在取歐氏距離為2.3時，可以將湖區分為7類，從綜合聚類結果來看，由于生態經濟區劃的劃分首先強調的連片性和相似性，故為了綜合考慮起見，本文又對三類指標分別進行了主成分分析，并得到了各自的主成分綜合得分表，在初步聚類結果的基礎上，結合生態和經濟、社會單類指標主成分綜合得分，并參照湖區的實際情況，最終可得中心城市生態經濟區、北部沿湖平原生態經濟區、中部丘崗綜合生態經濟區、環湖山地丘陵生態經濟區四個區域（區劃圖見圖3，分區結果和特點見表6和表7）。

注釋：

①本文數據來源主要是2005―2006年湖南省統計年鑒；2005年湖南省年鑒；2004年湖南省國土資源廳統計的湖南省各個縣區土地利用現狀數據；湖南省國土委員會辦公室和湖南省經濟研究中心1985年編寫的洞庭湖區整治開發綜合考察研究專題報告等。

參考文獻：

［1］張麗珍，孟令堯等.平泉縣生態經濟特征及其分區開發整治模式［J］.1999.16，（2）：12-16.

［2］胡月明，馮艷芬，江華，徐劍波，李強，陳飛香.中山市國家級生態示范區生態經濟評價及可持續發展對策研究［J］.2001.22，（3）：13-15.

［3］左長清.關于建設江西生態經濟區的思考［J］.2002，（11）：13-14.

［4］李紅巖.洞庭湖區生態經濟區劃與建設初步研究：［碩士學位論文］.長沙：湖南師范大學，2007.

［5］王克英.洞庭湖治理與開發［M］.長沙：湖南人民出版社，1998：3-4.

［6］金相燦等.中國湖泊富營養化［M］.北京：中國環境出版社，1990：234.

［7］張小紅.生態經濟區區劃模型與建設研究――以華容縣為例.［碩士學位論文］.長沙.湖南師范大學，2006.

［8］王麗.生態經濟區劃理論與實踐初步研究――以黃山市為例.［碩士學位論文］.蕪湖：安徽師范大學，2005.

第5篇

統計時將同一機構不同部門合并為同一機構，如華東師范大學言語聽覺康復科學研究院、特殊教育系等合并為華東師范大學進行統計；同一機構不同稱謂或機構有更名的合并為同一最新稱謂進行統計，如上海交大新華醫院、上海第二醫科大學附屬新華醫院合并為上海交大新華醫院，中國醫科大學第二臨床學院、第二附屬醫院合并為中國醫大盛京醫院進行統計。文獻關鍵詞對論文關鍵詞進行分析，可以了解我國兒童語言發育研究的重點和范圍。利用bi－comb軟件對1576篇文章的6049個關鍵詞進行統計，抽取詞頻大于22的30個關鍵詞為高頻關鍵詞，通過對高頻關鍵詞統計可以看出國內兒童語言發育涉及的研究面較為廣泛，但是僅僅停留在高頻關鍵詞的簡單統計，很難歸納出研究的主要方面，因此需要通過聚類分析深入挖掘這些高頻關鍵詞之間的聯系［1］。通過bicomb軟件對上表中的高頻關鍵詞建立共詞矩陣，再利用gcluto軟件進行聚類分析，得出高頻關鍵詞聚類樹圖，研究對象和內容兒童語言發育的研究對象廣泛，包括語言發育異常的兒童和正常兒童。語言發育異常的研究對象主要包括出現口吃、構音障礙、發育性語言障礙的兒童，以及存在影響語言發育的因素如聽力障礙、孤獨癥、智力低下和腦癱等疾病的兒童。對異常兒童的研究內容涉及病因、臨床表現、診斷、康復治療等方面。研究者在研究語言發育時對正常兒童的界定標準一致，即選擇不存在上述影響語言發育因素的兒童。對正常兒童語言發育規律的探討，包括發音、詞匯、句子、語法、語用等方面的研究。通過文獻梳理，可以發現在對正常兒童進行研究時個案研究居多，群體研究相對較少。研究材料和方法國內對兒童語言發育情況進行測評的方法較缺乏，在研究中主要采用以下方法。第一種方式，采用標準的結構化測試，包括圖片詞匯測試、丹佛發育篩查試驗、蓋澤爾發展量表、韋克斯勒學齡前和學齡初期智力量表等。目前標準測試中還只有圖片詞匯測試是直接用于語言測評的工具，其它結構化測評都只能部分或間接通過智能水映兒童語言能力。第二種方式，采用語言樣本分析，即在兒童熟悉的環境中，由他們自由地做一些常做的活動并進行錄音，采集語言樣本后進行轉錄并利用語言樣本分析程序自動分析［2］。語料測評可較客觀的得到兒童的語言水平，但需要兒童有足夠的語言表達能力后才能收集語料，不能應用于還沒語言表達能力的年幼兒童。近年來，有學者開始采用新的方式來評估兒童的語言能力。例如，北大醫院梁衛蘭等［3］利用父母報告方式，通過撫養人根據兒童日常的表現，選擇兒童會的詞匯和手勢，評估嬰幼兒語言和溝通能力。還有學者采用自行研究設計的量表，其中有代表性的是上海劉曉等［4］編制的《早期語言發育進程量表》。這些測評方法能較好的反映年幼兒童的語言能力，有待于在臨床進行推廣。

年代和學科分析從年代分布可以看出，研究國內兒童語言發育的文獻量近十年增長較快，圖1顯示呈現逐年上升趨勢，發展趨勢良好。通過表1的主要研究學科可以看出，兒童語言發育引起了醫學、語言學、心理學、教育學等多個學界的關注，隨著相關學科的快速發展，國內兒童語言發育研究也將進一步開展，未來可更多的開展學科之間的交叉研究。期刊分析根據布拉德福定律：核心區、相關區、非相關區期刊數量成1∶n∶n2的關系［5］，將729種刊載兒童語言發育論文的期刊，按照刊載論文的數量，以遞減順序排列，按照公式計算若前27種期刊中刊載33．3％以上的文獻方能形成核心期刊區。排在最前面的27種期刊刊載文獻約占論文總數的29％，前40種期刊才達到33．3％的比例，故目前尚未形成核心期刊群。雖然該領域尚未形成核心期刊群，但有關兒童語言發育的文獻較多的刊登于表2中所列期刊，提示作者向此類期刊投稿，可能會提高命中率。作者和機構分析以普賴斯定律對作者群進行分析，核心作者的論文量應該占全部相關論文總量的一半，核心作者最低發文數N的值為：N＝0．749（Gmax）1／2），其中Gmax為所統計的年限中最高產的那位作者的論文數［6］，在本次研究中為27，故N取整數為4。作者論文4篇以上為56人，多數文章為合作完成，共127篇，占總論文數8．1％，遠低于兒童語言發育論文總和的50％，提示兒童語言發育研究的核心作者群仍處于形成階段。根據發文機構統計結果顯示，主要發文機構包括多個教育機構和醫學機構，提示可加強教育和醫學機構之間的相互合作，推廣醫教結合模式。

關鍵詞頻次表反映了我國兒童語言發育研究重點及熱點分布。對進行聚類分析得出的聚類樹國內兒童語言發育研究的高頻關鍵詞大致可聚為五類。第一類是新生兒聽力篩查，第二類主要是嬰幼兒語言發育，第三類是語言障礙兒童的語言能力及語言訓練，第四類主要是學生的詞匯、句子等方面的發展，第五類是學齡前兒童的語言習得。摘要分析通過文獻摘要分析，可以看出在對正常兒童進行研究時個案研究居多，群體研究相對較少。基于個案得出的數據未必能代表群體的發育規律。正常兒童的語言發育規律，是研究異常兒童發育異常的基礎，可更多地開展正常兒童語言發育規律的群體調查。國內對兒童語言發育情況進行測評的方法較缺乏，主要通過結構化測評和語言樣本分析方法進行測評，對年幼兒童語言能力進行測評的方法較少，新的測評方法有待于研究和推廣。綜上所述，國內兒童語言發育研究的總體發展趨勢良好，發表文獻量逐年增加，呈多學科發展的態勢，引起了醫學、語言學、心理學、教育學等學界的關注，未來可更多地開展學科之間的交叉研究。目前尚未形成核心期刊群和穩定的研究群體，主要發文機構包括多個教育機構和醫學機構，提示可加強教育和醫學機構之間的相互合作，推廣醫教結合模式。對正常兒童進行研究時群體研究相對較少，應更多地開展正常兒童語言發育規律的群體調查研究。國內語言發育測評的方法較缺乏，新的測評方法有待于研究和推廣。

作者：潘虹地趙亞茹汪永娟梁萃陶旭煒李雪寧單位：中國醫科大學附屬盛京醫院發育兒科

第6篇

關鍵詞：Web；挖掘；PSO

隨著Internet的迅速發展，World Wide Web已深入到社會生活的方方面面。Web可以說是目前最大的信息系統，其數據具有海量、多樣、異構、動態變化等特性。人們使用Web，一般有如下需求[1]：

獲取相關信息或服務；

從Web信息中發現新的知識；

提供個性化服務：不同的用戶對信息、服務有不同的要求。

為了解決上述問題，人們迫切需要能自動地從Web上發現、抽取和過慮信息的工具，由此產生了Web挖掘。

Web挖掘就是從Web文檔和Web活動中發現和抽取潛在的、用戶感興趣的有用模式和隱藏的知識[2]。

1.Web挖掘

WEB挖掘可以認為包括以下四個子任務[3,4]：資源發現、信息選擇和預處理、概括和泛化、分析。

資源發現是一個從Web上的聯機資源中檢索數據的過程。信息選擇和預處理是一個信息轉變的過程。它可以是除去停用詞，詞干處理，發現訓練集中的短語，以及得到關系或邏輯表示等。概括過程是應用數據采掘技術獲得知識。最后的分析是對采掘結果的驗證和解釋，在此過程中應該發揮人的作用。

Web文本信息的特征獲取是指自動地從Web文本信息中抽取出代表其內容主題的特征詞條形成特征矢量來表示Web文本。它影響到下一步Web文本分類的質量。文本挖掘問題的一個主要難點是特征矢量的維數過高，對于大多數學習算法來說都難以承受。目前已有多種方法被用于特征抽取，比如文檔頻次門限方法、信息增益方法、χ2分布方法、互信息熵方法、基于奇異值分解的潛在語義索引方法（LSI）以及基于遺傳算法的特征提取算法等。

聚類技術是對符合某一訪問規律特征的用戶進行用戶特征挖掘。Web使用挖掘中存在兩種類型的聚類：使用聚類(用戶聚類)和頁面聚類。根據聚類的結果聚類方法可分為層次聚類與非層次聚類。在不同的方法中，人們研究了獲得較高的計算效率的問題。

在Web使用挖掘過程中，對用戶、Web頁面等Web對象進行聚類時，存在明顯的模糊性，模糊聚類也因此成為目前Web聚類分析研究的主流。

2.Web挖掘中存在的問題

Web數據挖掘[5]與傳統數據挖掘不同，Web頁面的結構比一般文本文件復雜很多，它可以支持多種媒體的表達。人們最初是希望通過Web來實現世界各種信息的互通，在這個平臺上自然希望任何的信息都可以表達了。因此也造成了互聯網數據的復雜性這個特點。而在互聯網上文檔一般是分布的，異構的，無結構或者半結構的。許多新技術的產生為解決這個難題提供了一條可行的道路，如XML技術。還有，互聯網上的數據動態性極強，頁面本身的內容和相關的鏈接經常更新。而互聯網面對的客戶也各不相同，這些都造成了用戶行為模式分析的困難度。

現行Web挖掘方法很多，解決Web信息應用部分問題，但存在一定的不足，如：由于用戶查詢固有的主觀性、不精確性和不確定性，大多數Web檢索系統僅用一個簡單的檢索模型，側重于檢索效率，忽視了檢索的準確性。不能進行軟決策，現有查詢是基于“硬拋棄”法，而且取決于查詢與檢索出文檔的相關性，但相關性只是文檔的部分屬性，不是很分明的界限。頁面分級還不全面，還沒有考慮各種參數的權重，如點擊位置、相鄰性和頻率等,分級還很少考慮用戶的特點。

為處理Web數據特征，克服目前現有的Web挖掘方法的局限，軟計算方法是一個很好的方法。軟計算是一組協同的方法，它提供一種處理現實中模糊狀態信息靈活處理能力。它們的目標是通過探索不精確、不確定、近似推理和局部正確的最大可能限度，達到易理解的、健壯的和低代價的解決方案，類似人的決策過程。軟計算技術包括模糊邏輯(fuzzy logic，FL)、粗糙集(rough set，RS)、人工神經網絡(artificial neural network，ANN)和遺傳算法(genetic algorithm，GA)[ 5-8]。

現有的Web文檔特征抽取算法文章證明這些特征抽取方法都有一些局限。傳統的聚類分析把每個待辨識的對象嚴格地劃分到某個類中，各個類別的界限是分明的。然而現實世界存在著大量的界限劃分不嚴格的聚類問題。即問題具有一定的模糊性，如在區分“優”和“良”等級時，就需要模糊劃分。在Web使用挖掘過程中，對用戶、Web頁面等Web對象進行聚類時，存在明顯的模糊性，模糊聚類也因此逐漸成為Web聚類分析研究的主流。

3.粒子群優化算法

粒子群優化(Particle Swarm Optimization, PSO)算法[1]是Kennedy和Eberhart受人工生命研究結果的啟發、通過模擬鳥群覓食過程中的遷徙和群聚行為而提出的一種基于群體智能的全局隨機搜索算法，與其他進化算法一樣，也是基于“種群”和“進化”的概念，通過個體間的協作與競爭，實現復雜空間最優解的搜索；同時，PSO又不像其他進化算法那樣對個體進行交叉、變異、選擇等進化算子操作，而是將群體(swarm)中的個體看作是在D維搜索空間中沒有質量和體積的粒子(particle)，每個粒子以一定的速度在解空間運動，并向自身歷史最佳位置pbest和鄰域歷史最佳位置gbest聚集，實現對候選解的進化。PSO算法具有很好的生物社會背景而易理解、參數少而易實現,對非線性、多峰問題均具有較強的全局搜索能力,在科學研究與工程實踐中得到了廣泛關注[3-8] 。

由于PSO 中粒子向自身歷史最佳位置和鄰域或群體歷史最佳位置聚集，形成粒子種群的快速趨同效應，容易出現陷入局部極值、早熟收斂或停滯現象。同時，PSO的性能也依賴于算法參數。為了克服上述不足，國內外學者相繼提出了各種改進措施。主要有粒子群初始化、鄰域拓撲、參數選擇和混合策略四類。

4.結論

由此可見，由于Web信息的獨特性，和傳統的數據挖掘相比，Web挖掘還有很多需要解決的難題需要我們針對實際應用加以解決。

參考文獻：

[1]吉林大學博士學位論文 Web挖掘中若干問題的研究許建潮 2005.6.10.

[2]Raymond Kosala,Hendrik Blockeel, Web Mining Research: A Survey, SIGKDD Explorations,2(1),pages 1-15,July 2000.

[3]中國科學院博士學位論文 WEB信息檢索與分類中的數據采掘研究李曉黎 2001.5.21.

[4]周龍鑲，陽小華．基于用戶訪問模式的WWW瀏覽路徑優化[J]．軟件學報，2001，12(6)，846～850.

[5]Jianhan Zhu，Jun Hong,John G Hughes．Using Markov Models for Web Site Link Prediction．In：Proceedings ofthe thirteenth ACM conference on Hypertext and hypermedia．Maryland(USA)，2002，169~170.

[6]浙江大學博士畢業論文 Web訪問信息挖掘若干關鍵技術的研究余軼軍 2006.4.1.

第7篇

相關合集：統計學論文

相關熱搜：統計學統計學原理

一、數據統計分析的內涵

數據分析是指運用一定的分析方法對數據進行處理，從而獲得解決管理決策或營銷研究問題所需信息的過程。所謂的數據統計分析就是運用統計學的方法對數據進行處理。在實際的市場調研工作中，數據統計分析能使我們挖掘出數據中隱藏的信息，并以恰當的形式表現出來，并最終指導決策的制定。

二、數據統計分析的原則

（1）科學性。科學方法的顯著特征是數據的收集、分析和解釋的客觀性，數據統計分析作為市場調研的重要組成部分也要具有同其他科學方法一樣的客觀標準。（2）系統性。市場調研是一個周密策劃、精心組織、科學實施，并由一系列工作環節、步驟、活動和成果組成的過程，而不是單個資料的記錄、整理或分析活動。（3）針對性。就不同的數據統計分析方法而言，無論是基礎的分析方法還是高級的分析方法，都會有它的適用領域和局限性。（4）趨勢性。市場所處的環境是在不斷的變化過程中的，我們要以一種發展的眼光看待問題。（5）實用性。市場調研說到底是為企業決策服務的，而數據統計分析也同樣服務于此，在保證其專業性和科學性的同時也不能忽略其現實意義。

三、推論性統計分析方法

（1）方差分析。方差分析是檢驗多個總體均值是否相等的一種統計方法，它可以看作是t檢驗的一種擴展。它所研究的是分類型自變量對數值型因變量的影響，比如它們之間有沒有關聯性、關聯性的程度等，所采用的方法就是通過檢驗各個總體的均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響。（2）回歸分析。在數據統計分析中，存在著大量的一種變量隨著另一種變量的變化而變化的情況，這種對應的因果變化往往無法用精確的數學公式來描述，只有通過大量觀察數據的統計工作才能找到他們之間的關系和規律，解決這一問題的常用方法是回歸分析?；貧w分析是從定量的角度對觀察數據進行分析、計算和歸納。

四、多元統計分析方法

（1）相關分析。相關分析是描述兩組變量間的相關程度和方向的一種常用的統計方法。值得注意的是，事物之間有相關關系，不一定是因果關系，也可能僅僅是伴隨關系；但如果事物之間有因果關系，則兩者必然存在相關關系。（2）主成分分析。在大部分數據統計分析中，變量之間是有一定的相關性的，人們自然希望找到較少的幾個彼此不相關的綜合指標盡可能多地反映原來眾多變量的信息。所謂的主成分

分析就是利用降維的思想，把多指標轉化為幾個綜合指標的多元統計分析方法，很顯然在一個低維空間識別系統要比在一個高維空間容易的多。（3）因子分析。因子分析的目的是使數據簡單化，它是將具有錯綜復雜關系的變量綜合為數量較少的幾個因子，以再現原始變量與因子之間的相互關系，同時根據不同因子，對變量進行分類。這些因子是不可觀測的潛在變量，而原先的變量是可觀測的顯在變量。（4）聚類分析。在市場調研中，市場細分是最常見的營銷術語之一，它按照一定的標準將市場分割為不同的族群，并使族群之間具有某種特征的顯著差異，而族群內部在這種特征上具有相似性。聚類分析就是實現分類的一種多元統計分析方法，它根據聚類變量將樣本分成相對同質的族群。聚類分析的主要優點是，對所研究的對象進行了全面的綜合分析，歸類比較客觀，有利于分類指導。（5）判別分析。判別分析是判別樣品所屬類型的一種多元統計方法。若在已知的分類下，遇到新的樣本，則可利用此法選定一種判別標準，以判定將該新樣品放置于哪個類中。由定義我們可以知道判別分析區別于聚類分析的地方，而在判別分析中，至少要有一個已經明確知道類別的“訓練樣本”，從而利用這個數據建立判別準則，并通過預測變量來為未知類別的觀測值進行判別。與聚類分析相同的地方是，判別分析也是利用距離的遠近來把對象歸類的。

第8篇

關鍵詞：管理科學;工程領域;熱點;分析;數據

根據不同時期的對外政策和社會發展特點，我國的管理科學與工程曾經出現過幾個不同的階段，包括建國初的計劃管理階段、之后的重建管理階段以及當今的管理科學繁榮發展階段。每個時期內都有學者通過各種不同的方法對當下管理科學與工程領域的熱點問題進行過分析，比較普遍的方法是借鑒權威期刊和論文中的數據，通過對收集到的關鍵詞進行對比分析，得出管理科學與工程領域的熱點。我國市場經濟的發展和社會環境的變化為管理科學與工程帶來了變化，也為其帶來了良好的發展契機，要進一步完善管理科學與工程工作，將挑戰變為機遇，就必須對管理科學與工程領域的熱點進行全方面詳細的研究，對其發展趨勢做預測，做到時刻掌握有效信息，促進管理科學與工程行業的全面發展。

1 以往的數據研究與文獻分析

回顧以往的相關文獻我們不難發現，對管理科學與工程領域熱點分析的文獻綜合起來大致都離不開兩個內容：對國內外管理科學與工程領域熱點的對比研究分析和國內管理科學與工程領域熱點分析。就前者來說，以張玲玲為例等學者采用關鍵詞作為數據的收集分類方式，在數據庫中搜索關鍵詞后將相關論文歸類到一起，對于那些文中出現不止一個關鍵詞的文獻，則將其分類到不同的學科領域中去。最后再加權平均論文的增長速度，用最終數據來得出該時期管理科學與工程領域的熱點，并對國內外熱點進行對比分析，總結出國內外差異形成的原因與差異表現所在。同樣研究國內外熱點比較的還有李群霞等，他依據文章關鍵詞的檢索量，以論文總量和論文增長速度兩個因素作為基準總結出國內外管理科學與工程熱點;后者的代表人物有繆園等，他以管理科學與工程科學代碼為基礎，收集獲得國家自然科學資助的管理科學與工程科學項目的統計數據，建造評價模型，對國內管理科學與工程熱點進行非線性評價，最終得出管理科學與工程領域的熱點，并對其發展趨勢進行預測分析。

2 管理科學與工程領域熱點數據的研究方法

2.1 共詞分析法與矩陣的構建。共詞的含義就是共同出現的詞語，共詞分析法主要是對同時出現在不同文獻中的各領域具有代表性的專業性詞匯進行分析統計，通過對共詞出現頻率的分析，研究各學科之間內在的聯系和交叉特征，展現學科內在的結構和組成脈絡。使用這種方法時要注意，文章的關鍵詞必須是能概括出文章中心內容和整體思想的濃縮詞，這時如果兩篇文章之中包含多個相同的關鍵詞即“共詞”，那么就可以說這兩篇文章在研究的主題和內容方面有相通之處。對所有的關鍵詞進行統計之后，管理科學與工程領域的高頻關鍵詞就會出現。而靠簡單的排列方式遠不能準確分析出管理科學與工程領域的熱點，這時，要構建共詞矩陣和相異矩陣，通過直觀的矩陣來反映關鍵詞之間的關系。在矩陣的基礎上對關鍵詞進行多元統計，有共同關鍵詞的文章數量越多，其共詞之間的“距離”也就越小，在此基礎上采用聚類分析，就能夠清晰的顯示出管理科學與工程學科熱點與發展趨勢。

2.2 繪制戰略坐標圖。戰略坐標圖是由二維坐標演化而來的一種直觀表示因素之間內在聯系表現形式，最早由Law等人提出。在戰略坐標圖上，同樣分為X軸（向心度）和Y軸（密度），代表不同的主題要素。向心度表示一個因素與其他多因素相互聯系的程度高低，密度表示各因素之間內在聯系的強度高低，一般情況下，密度與向心度的計算都是采用取平均值的方法。

3 分析研究結果并得出結論

3.1 聚類分析法。聚類分析顧名思義，就是將具有相同特征的事物或者同類事物劃分到一類中再進行分析，這種方法是根據“變量之間存在著一定程度上的相似性”的思想演變形成的。在同一批任務變量中找出統計量來測量任務變量之間的相似程度，并根據統計量依據相似程度的不同將變量歸為不同的類團，直至將所有變量歸類完畢。在選定好關鍵詞后，繪制高頻關鍵詞詞頻值的折線統計圖以及聚類樹狀圖，就可以直觀得看出，近幾年激勵機制、委托和不對稱信息關系強度居高不下，說明未來一段時間內這些內容仍舊會是研究的熱點;而在管理科學與工程的研究方法方面，層次分析法逐漸被冷落，車輛路徑算法和蟻群算法逐漸成為新的研究熱點。

3.2 多維尺度分析法。通過對觀測個體之間的距離進行準確的測定來發現個體之間存在的結構關系和數據聯系，是多維尺度分析法的運行原理。多維尺度分析法旨在用二維或三維的空間距離形式表現出個體之間的關系，并根據相似度將個聚合為不同的類別，接近中心的個體則越接近核心。這時引用SPSS軟件，將繪制好的矩陣導入并根據多維尺度分析功能對矩陣進行分析，最終得出直觀效果圖。通過效果圖就可以看出每一個類別中的核心詞語，距離核心較遠的關鍵詞則依舊不夠成熟，無法成為管理科學與工程領域的熱點和發展趨勢，而那些越接近核心的關鍵詞則為管理科學與工程領域的熱點。

綜上所述，通過采用共詞分析法、共詞矩陣與相異矩陣的構建以及戰略坐標圖的繪制等方法對管理科學與工程領域熱點進行分析，我們可以得出，近年來，管理科學與工程領域的熱點從以前的“信息技術”“知識管理”等詞匯，轉變為現在的“博弈”“激勵機制”“委托”“電子商務”“信用風險”等多個新的關鍵詞。除此之外，單靠關鍵詞頻數來判斷熱點仍舊存在單一性和局限性，對共詞分析法進行改造和完善也是大家義不容辭的責任。

參考文獻：

[1]張永安.管理科學學術規范體系構成的分析框架與應用性分析[J].科學學與科學技術管理，2009（08）.

[2]彭學君.國內外管理科學與工程學科研究熱點比較[J].衡水學院學報，2008（05）.

第9篇

關鍵詞：汽車后市場；用戶聚類；智能推薦算法

項目資助：國家科技支撐（2013BAH13F01）資助

1. 引言

進入新世紀以來，我國就進入了汽車產業高速發展的時代，已成為全球最大的汽車生產國與最大的汽車消費市場。從我國宏觀經濟發展水平和當前的人均汽車保有量來看，我國汽車市場仍然孕育著巨大的發展潛力。

目前在我國的汽車產業高速發展的同時顯現出汽車后市場服務的缺位，即汽車后市場服務缺乏品牌意識，服務的理念和服務質量、服務的可信度、服務的標準化、服務的人性化均十分淡漠。在汽車服務業企業，提供的服務和產品大同小異，較難提出差異化的項目來構建企業獨特性，客戶粘度低，具有較高的話語權。傳統的汽車服務推薦只是針對車型、車主職業等信息來對客戶進行一個粗略的歸類，由具體的接待人員來進行推薦，通常無法取得很好的效果。對客戶偏好的深度挖掘，以及更加個性化、人性化的推薦服務，提供更好的客戶體驗是提高服務業企業的市場競爭力的有力工具。

2. 汽車后市場服務業發展現狀

隨著我國汽車工業的迅猛發展，汽車售后服務業在整個產業鏈中的重要作用逐漸顯現出來，其成為各大汽車廠商追逐的新的利潤增長點。不管是汽車企業、汽車消費者還是政府的相關部門，都對售后服務給予了前所未有的關注?？蛻舻南M行為反映出了他們對需求并不清晰，客戶很多時候并不清楚自己到底需要什么樣的服務，不能很好的識別自己需要的服務。同時，服務提供方也并不能主動的對客戶進行服務，更多的是被動地響應客戶的要求，服務質量難以有質地提升。

目前汽車售后服務大多采用“被動響應”服務模式，即當汽車零部件出現故障時才對其進行維修和保養。由于客戶駕駛行為習慣對汽車各零部件造成的磨損程度不同，導致汽車出現故障的概率和所需要的維修服務也因人而異。因此，可以考慮通過分析客戶駕駛行為對汽車零件性能產生的影響，選取合適的影響指標對零件的磨損進行測度，并結合零部件的正常使用壽命來預測其可能出現的故障和時間，主動的提供相應的服務來提高售后服務的質量和效率。

汽車產品在性能、價格和外形等方面逐步趨于同質化，消費者更加關注產品附加值，從而使服務成為了競爭的主角。依據客戶消費記錄對客戶群進行細分，可以使企業根據客戶價值級別的不同決定如何在客戶中分配企業有限資源，然后根據客戶的不同需求，設計和實施不同的客戶保持策略。

3. 數據挖掘在汽車售后服務中的應用

數據挖掘作為數據庫知識發現的核心部分，目前存在很多數據挖掘方法和算法。根據挖掘任務分，有如下幾種知識發現任務：分類知識發現、數據總結、數據聚類、關聯規則發現、序列模式發現、依賴關系或依賴模型發現、異常發現和趨勢預測等。運用最多的是分類知識發現和數據聚類算法。

客戶偏好挖掘和推薦的基本流程是：根據客戶歷史消費記錄對客戶進行偏好挖掘，并對客戶進行聚類分析；根據兩種以上的服務或者產品同時被消費的頻度，利用關聯規則將服務或產品進行聚類；利用關聯規則算法將用戶和服務產品進行匹配，推出針對性的智能化的推薦。

3.1對客戶進行偏好挖掘

從用戶行為信息中挖掘出用戶偏好并構建偏好文檔是進行商品特征與用偏好匹配推薦的基礎。消費者細分的方法很多。有依據人口統計指標的細分、消費者心理細分、生活習慣細分、購買動機細分等等。在現實中對單個消費者個體的研究是不可能的。通過使用數據挖掘，可以根據所擁有的數據特征挖掘劃分不同的消費者群，“分群”意味著把有相似特征的消費者歸為同一組，即建立用戶群，同時把不同用戶群之間的差異最大化。

消費者行為特征挖掘的技術是聚類。聚類是探索型數據挖掘技術?？梢允褂迷S多種不同類型的聚類技術。聚類數據挖掘能夠根據已測度的變量將相似消費者歸到一起，同時使不同類型的消費者群組之間的差異最大化。本質相同的群組具有特定的消費者行為描述，所有聚類技術只要正確使用，都能產生恰當的分組。

3.2服務產品的聚類分析

類似于在購買鐵錘的顧客當中，有70%的人同時購買了鐵釘；在超市買面包的人有70%會購買牛奶。關聯算法簡單來講就是對同時被消費的商品進行聚類，并分析這些相關產品的頻度是否滿足將其關聯起來的最低置信度。

關聯規則挖掘過程主要包含兩個階段：

【一】：必須先從資料集合中找出所有的高頻項目組（Frequent Item sets）【若支持度大于等于所設定的最小支持度（Minimum Support）門檻值時，則{A，B}稱為高頻項目組】

【二】：再由這些高頻項目組中產生關聯規則（Association Rules）【在最小信賴度（Minimum Confidence）的條件門檻下，若一規則所求得的信賴度滿足最小信賴度，稱此規則為關聯規則】。

在汽車售后服務中，就是要通過關聯規則運算，形成服務和商品的一個組合產品，這些強關聯的組合產品，在客戶選擇了組合中的任意一種產品或服務之后，都會依據算法向他推薦另一個與前者有著強關聯關系的產品或服務。

3.3客戶類型和產品服務類型進行匹配

利用匹配算法，將消費者的類型與產品服務的類型進行匹配，分析出不同的客戶群體最有可能進行那種類型的消費。以及不同消費群體的偏好認知程度不同，對推薦的接受程度差異也很大。

從汽車質量等級、汽車燃油和機油等級、汽車行駛道路環境、汽車外部環境、客戶駕駛技術、汽車修理頻率和汽車行駛里程，提取客戶的這七個因素數據對客戶行為進行數據挖掘分析，對汽車用戶進行劃分，分析出不同的駕駛習慣、經歷、環境的不同，進行汽車維修的項目和頻率也是不同的。

4. 結論

與汽車前市場相比，汽車后市場領域具有更大的發展空間和發展潛力。但是汽車后市場的現狀是，服務與產品的差異化程度低，服務人員的整體水平參差不齊，客戶體驗成為留住客戶的關鍵。深入分析汽車消費者的偏好特征，對不同類型的客戶，盡可能的做出貼近其需求和偏好的產品或服務推薦，只有這樣才可以增強客戶的忠誠度，提高客戶粘度，進而為培養客戶、發展客戶、留住客戶打好基礎。智能化推薦，改善客戶體驗，也是汽車服務業取得進一步突破的一種有效的途徑。

參考文獻

[1]黃武漢，孟祥武，王立才.移動通信網中基于用戶社會化關系挖掘的協同過濾算法[J].電子與信息學報，2011，33（12）：3002—3007.

[2]張璇.汽車售后服務業客戶駕駛偏好分析研究（D）.武漢理工大學碩士論文，2012，5.

第10篇

關鍵詞：聚類分析；福建?。桓劭谖锪鳎桓偁幜?/p>

中圖分類號：U691 文獻標識碼：A

Abstract： As a starting point of maritime silk road， the degree of development of port logistics in Fujian is socially significant.This paper based on the major ports in Fujian province， design 11 key indicators from the perspective of port logistics in harbor and city dimensions. Then gather the country's 18 major ports data in 2014， use cluster analysis to analysis and classify the data， get conclusion of the three major ports in Fujian province at the posterior segment in the national rankings. Then summarizes the main issues， proposed to improve the collection and distribution system， improve the level of intensive port， harbor and accurate positioning of targeted policy recommendations.

Key words： cluster analysis； Fujian province； port logistics； competitiveness

0 引言

水路運輸作為最主要的國際運輸方式，對國際貿易的進一步發展和全球一體化的進一步深入貢獻巨大。在新加坡、香港等經濟較為發達的國家和地區，港口逐漸成為其參與國際貿易的主要通道。港口物流是隨著現代港口的發展逐漸發展起來的，它是指中心港口城市利用其自身口岸優勢，以先進的軟硬件環境為依托，強化其對港口周邊物流活動的輻射能力，發展具有涵蓋物流產業鏈所有環節特點的港口綜合服務體系。港口物流主要功能包括貨物集港、拼箱運輸、到港拆箱、送貨，以及包括報關、信息管理、咨詢信息、供應鏈金融等相關服務[1-2]。隨著“一帶一路”政策的提出和實施，福建省作為海上絲綢之路的起點，如何進一步結合自身特色推進港口物流發展，成為大家關注的焦點。

本文以2014年全國18個主要港口數據為基礎，結合城市和港口物流方面的主要指標，通過系統聚類分析法得出福建三大主要港口在全國港口中的發展地位，進而提出針對性的發展建議。

1 聚類指標及港口選擇

聚類分析是一種多元統計分析方法，通過設立合理指標對觀測對象間的相似程度進行分類，達到“物以類聚”的目的[3]，聚類分析需先構建聚類分析指標體系，有效的指標體系設計需要遵循科學性、系統性、動態性等多重原則[4]。福建省港口物流對于福建省經濟的進一步發展影響巨大，為了進一步發揮海上絲綢之路的優勢，本文在系統分析近幾年來港口物流主要文獻基礎上，立足福建省港口物流情況，主要設計港口指標（貨物吞吐量、外貿吞吐量、內貿吞吐量、集裝箱吞吐量）和城市指標（GDP、第一產業產值、第二產業產值、第三產業產值、進出口總額、人口、面積）兩類共11個。

福建省經過幾年的整合形成三大主要港口，分別為廈門港（原廈門港和漳州港合并）、福州港（原福州港和寧德港合并）、湄洲灣港（湄洲灣南北兩岸港口合并）。本文以福建三大主要港口為基礎，選擇長三角港口群（上海港、寧波港、連云港和南京港）、珠三角港口群（廣州港、深圳港和汕頭港）、環渤海地區港口群（大連港、天津港、青島港、日照港）、西南沿海港口群（湛江港和海口港）以及內河港代表重慶港和九江港等15個港口為對比對象，搜集整理2014年相關數據（按照貨物吞吐量降序排列）如表1所示。

貨物吞吐量指標顯示福建三大港口均排在中后部，與上海港、天津港、廣州港等港口相比差距較大。在集裝箱吞吐量方面，廈門港要稍好，處于中游，福州港與湄洲灣港屬于墊底層次。

城市方面，由于福建港口進行了一系列的資源整合，因此本文采用的城市指標數據分別是廈門和漳州總和、福州和寧德總和、泉州和莆田總和。GDP指標顯示，福建三大港口所在城市的GDP處于中游偏下的位置，上海遙遙領先，天津、廣州、深圳、重慶等市緊隨其后。上海和深圳兩地的進出口總額獨占鰲頭，而廈門港所在城市的GDP在中游偏上位置，福州港和湄洲灣港所在城市的GDP則在中游偏下的位置。

2 聚分析過程及結果

2.1 聚類指標數據標準化處理

本文選取的指標數據單位和變異程度有一定差異性，比如城市GDP是以億元為單位的，但面積的單位卻是平方公里。因此需要對這些數據進行標準化處理，本文采取SPSS22.0求變量Z分數，它能真實地反映出變量之間的相對距離，經過SPSS的無量綱化之后，這些變量值的平均值和標準差分別為0和1[5-6]。

在SPSS軟件的數據試圖中，輸入標準化后的數據，在菜單欄中選擇系統聚類選項。并將港口名稱標注成個案，可以更方便地觀察聚類結果。在聚類方法中選擇“組之間的鏈接”選項，樣本與小類、小類與小類的距離測量方法選擇“歐式距離平方”選項，經過SPSS軟件的運算之后，得到的輸出結果如圖1所示。

2.2 聚類分析結果

聚類分析可以按照需求分成無數個類，若分成三類，則上海港為第一類，重慶港為第二類，其他港為第三類；若分成四類，則深圳港從其他港口中單獨出來；若分成五類，廣州港、天津港、大連港、青島港及寧波港從其他港口中獨立出來；若分成六類，則廣州港、天津港為第四類，大連港、青島港和寧波港為第五類，其他為第六類。但分至第四類后，第五六類的各港口之間差距已經非常小。上海作為中國最大的沿海城市，經濟實力雄厚，上海港港口功能齊全、各項指標均處前列，排列第一當之無愧。重慶作為中國的直轄市之一，城市較大、人口眾多，在西部城市中經濟實力雄厚，貿易往來豐富，城市指標的靠前一定程度上彌補了港口相關指標的不足。而福建三大港口均處于最后一類，并且三者之間的差距非常小，雖然廈門港集裝箱吞吐量等相關指標處于中等，但是城市較小、經濟實力一般，對港口的帶動作用還有待進一步加強，綜合而言其類別處在后列，福州港和湄洲灣港類似。

3 福建省港口物流問題總結及發展建議

通過聚類分析結果可知，福建三大主要港口在選取的18個港口中表現差強人意，處于中后段位置，特別是與上海港、深圳港等國際大港相比有較大差距[7]，集疏運體系的不完善、臨港產業不發達、港口集約化程度低、港口整合有待進一步加強等問題制約著福建省港口物流的進一步發展。

福建省港口要進一步提升競爭地位，在全國港口中脫穎而出，為海上絲綢之路做更好的貢獻，需要結合自身特點，不斷改善軟硬件環境，完善集疏運體系、提升集約化水平。

首先，不斷完善集疏運體系。福建省應以整合后的福建三大港口為重點，加快集疏運體系建設，打造集公路、鐵路、水路運輸結合的綜合集疏運體系。應加大投資，建立港口專用鐵路支線，形成水鐵無縫銜接，并積極落實部分干線快速鐵路的客貨兼運模式，提高鐵路貨運能力。同時，福建省需要提升現有疏港公路等級，實現沿海港口與干線公路、國省道、工業區之間的順暢連接。

其次，提升港口集約化水平。集約化水平的提升可以很好地解決港口分散、規模化和專業化不足的問題。加快大型港區與周邊小港區的整合，整合現有資源打造“兩集兩散兩液”：即廈門港海滄港區和福州港江陰港區重點發展集裝箱運輸，羅源灣可門港區和湄洲灣北岸港區致力打造大宗散貨運輸中心，湄洲灣南岸港區、漳州古雷港區則重點發展以臨港工業為依托、液體散貨運輸，以減少資金分散使用，發展幾個重要港口，實現以點帶面。

第三，大力發展福建臨港產業。福建各港口可根據自身獨有的資源稟賦和臨港企業的分布狀況，大力發展具有戰略性的臨港新興產業，培育現代化的臨港物流和產業集群，如福州羅源灣可大力發展電力、冶金、機械等臨港產業；漳州東山灣大力發展石化臨港產業。同時，還需不斷擴展相關臨港產業的現代物流功能，建設綜合型的物流園區。

第四，深入整合各港區。繼續深化福建港口管理體制改革，積極學習借鑒國內外先進做法，將福建沿海港口資源和功能進行大整合，統一運營。實現分層建設：第一層重點建設廈門東南國際航運中心和福州集裝箱和大宗散貨運輸相協調的國際航運主樞紐港，形成大碼頭大城市；第二層服務于主樞紐港的輔助港口的建設，可將泉州灣港口建設成輔助廈門東南國際航運中心和福州國際航運主樞紐港的支線港；第三層是離中心城市較遠且經濟增長活力不足地區的港口建設，如寧德港、漳州港，實現有主有輔，各有側重。

4 結論

海洋經濟是21世紀各國經濟新增長點，作為海洋大國，古代海上絲綢之路從福建泉州起源，延伸多個國家。如今，我國重啟海上絲綢之路大計，作為起源的福建省迎來進一步發展海洋經濟及港口物流的契機。本文主要通過搜集國內18個主要港口數據，運用系統聚類分析福建省三大主要港口在全國的地位，通過對其排名中后段的現狀分析，總結出問題，并提出不斷完善集疏運體系、提升港口集約化水平、大力發展臨港經濟等政策建議。

參考文獻：

[1] 陳夢. 港口物流核心文獻綜述（2010-2015）[J]. 物流科技，2016（4）：86-87，101.

[2] 陳夢. 港口物流文獻分析（2010-2015）[J]. 物流科技，2016（3）：77-80.

[3] 黃順泉，曲林遲，余思勤. 中國港口功能的聚類和判別[J]. 交通運輸工程學報，2011（4）：76-83.

[4] 陳繼紅，鄭師禹，羅萍，等. 基于模糊聚類的長三角港口物流服務功能歸類與對策[J]. 北京交通大學學報（社會科學版），2015（10）：89-98.

[5] 曾倩琳，王瑩. 海峽西岸經濟區無水港群的網絡布局――基于模糊聚分析法和SPSS17.0軟件[J]. 科技和產業，2010（10）：1

-4.

第11篇

【關鍵詞】會計學;共詞分析;知識圖譜;研究熱點

會計是經濟的組成部分,會計學科在社會科學領域占據著重要的位置。隨著社會和經濟的發展,我國會計也發生了巨大的變化。回顧過去,改革開放的30年,是我國會計棄舊揚新、逐步發展和變革的30年,尤其是進入21世紀后的近5年,我國會計的發展更是迅速。那么會計學現在的研究現狀如何,研究熱點有哪些,未來有潛力的研究方向是什么等等一系列的問題吸引著越來越多的學者。有關會計研究的文獻迅速增長,給廣大研究人員從浩瀚的研究論文中把握會計學的研究熱點和研究前沿等問題帶來了挑戰,而科學知識圖譜方法可以作為研究人員應對這一挑戰的有效工具。本文將基于詞頻分析和共詞分析法,借助科學知識圖譜技術對我國會計學論文進行可視化分析,指出我國會計學主流學術領域和研究熱點。

一、數據來源與方法

(一)數據采集

本文采用的數據來源于

在知識群2中,環境會計、利益相關者、會計國際化等高頻詞聚集在一起,表明知識群2的中心是會計政策和形式的選擇。不同的利益相關者需要不同的會計信息內容和表現形式。為了與國際接軌,需要會計國際化;為了表現公司的環境責任,需要研究環境會計;為了減緩委托人和人的沖突,需要財務會計信息……因為存在眾多的利益相關者,為了較少交易成本,又需要監管層確定會計政策和形式來協調各利益相關者的利益。在這個知識群中,有2個研究熱點:(1)會計國際化。由于國際經濟發展的需要,客觀上要求各國在制定會計政策和處理會計事務中,逐步采用國際通行的會計慣例,已達到國際間會計行為的相互溝通、協調、規范和統一。會計準則的國際協調趨勢是研究的熱點。(2)環境會計。也稱綠色會計,其最早是作為社會責任會計的一部分出現的。隨著環境的問題日益嚴重及可持續發展戰略的提出,環境會計成為我國會計研究的熱點。

在知識群3中,管理會計、會計信息質量、注冊會計師、審計質量、會計盈余等高頻關鍵詞聚集在一起,表明知識群3 的中心是會計信息質量。盈余管理、會計穩健性和會計盈余影響會計信息質量;會計制度、會計準則、國際會計準則會影響會計信息披露的質量;公司內部治理狀況(公司治理)和外部監督(會計師事務所)也是影響會計信息披露的質量的重要因素。這一知識群中的研究熱點有3個:(1)管理會計。以企業現在和未來的資金運動為對象,以提高經濟效益為目的,為企業內部管理提供經營管理決策的科學依據為目標而進行的經濟管理活動。對成本控制問題是研究的熱點。(2)會計盈余。會計盈余和現金流量直接的矛盾一直是現在財務會計理論爭論的焦點,新會計準則下上市公司的會計盈余問題和新會計準則對盈余管理空間的遏制作用等問題都是研究的熱點。(3)注冊會計師的審計質量。加強我國注冊會計師審計質量的控制是研究的熱點。

三、結論

從對關鍵詞的詞頻分析可以看出,會計學研究里最常出現的關鍵詞是會計準則,其次是與會計信息質量有關的內容。從共詞知識圖譜可以看出,會計學論文主要集中在三個知識群,第一個知識群的研究熱點都是圍繞著新會計準則,第二個知識群是以會計政策和形式的選擇為中心,第三個知識群是對會計信息質量的熱點研究。會計準則給予了會計政策的選擇空間,會計政策的選擇影響了信息質量。所以第二個知識群是第一個知識群和第三個知識群的連接和過度。

上述研究大致勾勒出我國會計學論文的研究熱點,揭示出知識群的內部結構。我們可以發現,會計學研究里最關心的是會計信息問題,從信息的披露到信息的形式和質量,由于信息的復雜性和無窮性,未來仍然可以做出更深層次的研究;其次,會計的研究緊緊圍繞會計實踐,這從圍繞準則的研究可以看出,有理由推測以后的會計研究仍然會遵循這一原則;最后,對前沿的課題諸如環境會計、人力資源會計所做的研究仍不全面,這意味著未來有很大的研究空間。

當然由于cssci并未能全面搜集我國會計學的論文,以及與國外會計學論文的研究熱點相比,我國會計學的熱點是否緊跟前沿,都是今后仍需研究的地方。

【參考文獻】

[1] 陳超美.citespaceⅱ:科學文獻中新趨勢與新動態的識別與可視化[j].情報學報,2009(3).

[2] 劉則淵,王賢文,陳超美.科學知識圖譜方法及其在科技情報中的應用[j].數字圖書館論壇,2009(10).

[3] 李長玲,翟雪梅.我國情報學碩士學位論文的共詞聚類分析[j].情報科學,2008.

第12篇

印度黃檀是一種喜光落葉大喬木，屬于豆科蝶形花亞科。它起源于印度干旱地區，具有速生、耐旱和耐瘠薄等優良特性。一年生印度黃檀幼苗的樹高可達3m，胸徑可接近10cm。在印度的分布區域內其絕對最高溫度39qc～49℃，絕對最低溫度4oC～6oC，年降雨量760～4570mm。印度黃檀能在瘠薄、疏松或低鹽土中生長，但在干硬的粘土中，容易受到病害，成活率低J。印度黃檀具有多種的用途。它的葉子可以作飼料和藥材，主干可以被加工制成世界上名貴的紅木家具。在印度，除了柚木之外，印度黃檀是最重要的栽培樹種。由于它的速生、耐旱和耐瘠薄等優良特性，無論在印度還是美國都被認為是一種理想的城市和園林綠化樹種引。

2印度黃檀適生陛區劃方法的研究現狀

樹種的適生性區劃是林業區劃的一種表現形式。林業區劃是指根據林業的特點，在研究有關自然、經濟和技術條件的基礎上，分析、評價林業生產的特點與潛力，按照地域分異的規律進行分區劃片。中國在1950年以后，為了大力發展農業，提高農業的經濟效益，借鑒前蘇聯的農業科學技術，開展了農業區劃工作。當時林業區劃從屬于農業區劃。隨著國民經濟的發展，國家對林產品的需求量越來越大，而由于受林業本身生長周期長、見效慢等特點以及中國復雜的地理環境的影響，合理的林業區劃對降低林業生產的風險、提高林業工作的效率和質量具有重要的作用。

目前，常用的林業區劃方法可分為與計算機結合的數量定量區劃方法和基于地理信息系統技術的區劃方法7．引。在樹種適生性區劃研究當中，用得比較多的數量定量區劃方法為傳統的聚類分析方法、主成分分析法、模糊數學法和灰色關聯度法。基于地理信息系統技術的區劃方法是利用ArcGIS或ArcView等軟件的空間分析和制圖功能，結合由數量定量方法所建立的數學模型進行區劃。

樹種的區域性試驗為數學建模提供了基礎數據。顯然，區域性試驗數據的正確性是保證區劃結果正確的前提。因此，對樹種區域性試驗方法的研究是適生性區劃研究的一個重要部分。

2．1印度黃檀的區域性試驗研究

由于印度黃檀對環境的適應能力比較強，許多國外學者對其進行了深入的研究，其中大多數的研究都從微觀的角度來分析印度黃檀的生理特征，而對印度黃檀的區域性研究較少。國內對印度黃檀的專項研究僅見于中國林業科學研究院資源昆蟲研究所對印度黃檀木材解剖構造及物理力學和化學性質的初步研究’加J，而對其區域性試驗和適生性區劃尚未見報道。印度黃檀的區域性研究主要體現在不同試驗方法下印度黃檀與其它樹種在適生性方面的比較研究。

IanHUNTER在印度的卡納塔克邦對一年生的印度黃檀、赤桉和大桉幼苗分別做了4種不同的灌溉水平和9種不同的施肥量的研究。最后發現充足的水分和N肥量是印度黃檀快速生長的關鍵因素。PSMINHAS等用咸水和正常的溝渠水分別對印度黃檀和埃及樹膠進行灌溉，得出咸水灌溉使得印度黃檀的生長量比用灌溉時少了53％。BSINGHandGSINGH在焦特布爾對4個月生的印度黃檀的繁殖苗做了5種不同灌溉水平的試驗，證明了水分是影響印度黃檀生長的關鍵因子¨。由于印度黃檀屬于喜光樹種，在一定的水肥條件下，它的存活率跟種植密度大致成反比的關系。

在印度黃檀的區域性試驗中，許多學者主要考慮了水分、土壤性質和種植密度的問題，而忽視了溫度因子。在同一氣候類型的區域內，由于地形起伏造成局部溫度的差異也反映在同種植物生長的差異性上。

在印度黃檀的區域性試驗中，應該重點考慮溫度、水分、土壤性質和種植密度與生長量、保存率和結實率的關系，并對這些因素做出詳細的數據記錄，為適生數學建模提供準確的數據。

2．2數量定量區劃方法

從2O世紀80年代末開始，數量定量的區劃方法應用到林業區劃當中，逐步取代傳統的帶有很大主觀臆斷性的林業區劃方法’?？抵拘鄣葢米V系圖聚類分析方法，劃分了長江流域以南的楊梅適生性分布區。譜系圖聚類分析方法應用簡單，但最大的缺點是聚類圖不直觀，而由星座圖聚類分析方法得出的聚類圖的效果顯然是比較好的。陳建新等運用了主成分分析方法，突出了廣東禿杉區劃中貢獻率較大的因子和優化了各因子在區劃中的綜合貢獻率，取得了良好的區劃效果。主成分分析法對多個變量起降維的作用，減少了計算量，但存在丟失有效信息的現象，并且不同統計軟件下的主成分分析結果有一定的差別。

在區劃過程中，有些個體是介于兩個或兩個以上的類別之間，帶有模糊性。利用模糊數學進行區劃更加符合實際。朱斌等對安徽省栽培蘋果的生態氣候條件進行了模糊聚類分析，初步劃出了安徽蘋果經濟栽培南線引。宋于洋等將層次分析法和模糊數學綜合評價法相結合，對新疆天然甜型葡萄酒原料種植區域進行了區劃研究，得出了各個地區的適生性評分¨。模糊函數在確定適生性閥值水平時帶有主觀性，結合其它方法可以提高區劃的準確度。

從系統論的角度看，林業生產系統是一個典型的本征灰色系統。樹種適生性區劃可以用灰色系統理論和方法來解決。張志剛等運用灰色關聯度法分析了l0個雜種棉后代在不同生態點的主要農藝及經濟現狀進行了分析。為了更加客觀地進行分類，李寶根在福建省森林景觀資源等級區劃中，先用灰色關聯度法確定各因子的關聯度值，再用聚類分析法進行分類，取得了滿意的效果。灰色關聯度法的計算比模糊數學法要簡單，但是容易丟失區域間的邊界信息。

利用數量定量方法進行區劃，主成分分析法和聚類分析法忽略了引種地與種源產地之間的關系，模糊數學方法雖然較為合理，但計算量比較大?；疑P聯度法相對模糊數學方法來說，雖然計算要簡單，效果相似，但是與其它數量定量區劃方法一樣，模型需要大量的原始數據，并且區劃結果難以保持區塊的空間連續性和行政界線的完整性。

2．3基于地理信息系統技術的區劃方法

應用地理信息系統技術進行樹種適生性的區劃，是目前比較流行的林業區劃方法。相對于數量定量方法而言，它具有節省大量外業和內業的工作量以及制圖效果好等優點。地理信息系統技術的區劃一般先確定區劃需要考慮的環境因子，利用DEM圖、行政區劃圖等生成數據底圖，再通過數量定量的方法建立各因子對區劃的綜合評價模型，得出各因子的評分，通過空間疊加分析生成區劃圖。

朱琳等采用模糊數學的綜合評判方法，計算出各要素的隸屬度，建立了單因子柵格圖層。張超等先用逐步聚類的方法對福建永安縣森林資源進行了預分類，然后用ArcGIS得出了以林班和以村為單位的永安市林業區劃圖引。數量定量方法得出的區劃圖往往忽視了地域之間的連續性。數量定量的方法與ArcGIS軟件結合，能較好地保留地域間的連續性和快速有效地取得區劃結果。數學模型是地理信息系統技術進行區劃的基礎。

ArcGIS在區劃中的一個突出特點是可以通過空間插值的方法，根據已知點的數值來生成一些未知點的值J。姚圣賢等在櫻桃氣候的區劃中運用ArcGIS的三角網距離加權平均法對光、溫和水三要素進行內插J。為了達到空間插值的目的，在ArcGIS中建立環境因子數據庫，利用現有的數據建立一個函數關系式，使這個關系式最大限度地逼近已知空間點的數據，通過ArcGIS的空間分析功能求出某一環境因子或綜合的環境因子在某個地區的空間分布規律。ArcGIS的空間插值和分析功能節省了區劃工作中大量的外業工作，提高了區劃的精度。

3存在的問題及發展方向

印度黃檀是一種抗旱、抗瘠薄的喜光樹種。在熱帶或亞熱帶地區，水分和土壤性質對其生長起重要的作用。許多研究針對其生長狀況與水分、土壤肥力和種植密度之間的關系進行研究。對于區域性試驗來說，目前的研究還不能全面反映綜合的環境因子對印度黃檀生長狀況的影響。

傳統的林業區劃方法與統計軟件和分類繪圖軟件相結合，大大減少了計算量和提高了制圖的效率。其應用簡單、數量關系明確等優點仍然使它廣泛應用于林業區劃工作當中。但是，傳統的林業區劃方法需要大量的外業數據，而中國地形復雜多樣，很多山頭地塊的數據難以從氣象臺站或外業調查中獲取，區劃圖精度較低，效果粗糙，只能勉強滿足大尺度范圍內的區劃要求。

利用地理信息系統技術進行區劃，克服了傳統林業區劃中的缺陷，既節省了大量的外業工作，又提高了區劃圖的精度和效果?；诘乩硇畔⑾到y技術的區劃結果，其準確性與選擇的數學模型有很大的關系。數學模型的建立只是根據某一時段的環境值建立的，而且區劃的效果也因不同的數學模型而有所差異。因此，如何選擇和建立合適的數學模型以及如何開發出一個相對通用的區劃系統必然是以后研究的方向。

在印度黃檀的適生性區劃中，根據研究區域地形和氣候的復雜性，可以把整個研究區域分成若干小區，實行分區建模，克服用一個模型推算整個區域環境因子空間分布情況的缺陷，提高區劃的精度。

聚類分析論文