本站小編為你精心準備了方向玫瑰圖社會經濟論文參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
1.1可視化效果圖1中分別給出了利用三種不同的分析工具對相同的社會經濟重心軌跡進行分析的結果。其中圖1(a)為原始軌跡的顯示結果;圖1(b)為傳統方向玫瑰圖方法的可視化結果;圖1(c)為本文中的語義方向玫瑰圖。語義方向玫瑰圖將社會經濟重心軌跡各自對應的經濟屬性作為語義信息與全局軌跡方向玫瑰圖的方法相結合,以可視化的形式表達。在語義方向玫瑰圖中每個詞的位置代表了該經濟屬性對應的重心軌跡在該方向區間內移動的距離大小即移動模式的顯著性。同時,詞匯的字體大小與該經濟重心移動的顯著性也成正比。因此,在圖中詞的位置離中心越遠,字體越大,代表該經濟屬性所代表的經濟重心軌跡在該方向上移動的模式越顯著。對比圖1中三種不同方法的實驗結果可知:1)語義方向玫瑰圖可從語義的角度對社會經濟重心軌跡進行統計分析,最終直接以語義信息代表經濟重心在圖上表達。因此,語義方向玫瑰圖給使用者提供了一種更直觀更易理解的分析方法。2)語義方向玫瑰圖從整體角度上看可反映經濟重心軌跡的全局移動特性。同時,圖中單個詞匯又能反映其所代表的單條重心軌跡的顯著移動模式,從而能更直接更全面的傳遞出經濟重心軌跡的顯著移動模式的信息。
1.2形式化定義語義方向玫瑰圖是基于帶有語義信息的重心軌跡Pj進行統計分析的,語義重心軌跡以式(1)的形式表達。式中n是軌跡上的采樣點數,(xi,yi,ti,wj)表示的是在ti時刻移動物體狀態;xi,yi為重心軌跡的空間位置信息;wj為語義信息,即軌跡所代表重心的經濟屬性名,如“國內生產總值”、“工業產量”等。
2生成方法
根據帶有語義信息的社會經濟重心軌跡數據,按照上式(3)即可計算出八個方向區間內每個語義詞匯的詞頻,得到每個詞在圖中顯示的極坐標位置。一般情況下,由于軌跡數量較多,為了保證語義方向玫瑰圖分析的有效性和可行性,可根據軌跡語義詞匯的重要性即其所代表軌跡移動模式的顯著性大小進行排序和篩選,僅對移動模式最為顯著語義詞匯進行分析和表達。此外,由于詞匯之間難免會出現許多重疊部分,影響可視化效果。因此,最后還可圖中的詞匯位置進行微調,以減少詞與詞的重疊碰撞。由此可知,語義方向圖的生成過程可分為以下幾個步驟:統計各個方向區間的詞頻;根據顯著性對詞匯排序和篩選;文字位置微調。接下來,本文將詳細闡述語義方向圖的生成過程。表1為實現語義方向玫瑰圖的偽代碼。
2.1統計各個方向區間詞頻先將[0°,360°]劃分成8個等間隔的方向區間。根據式(5)確定軌跡Pj上的矢量kkkj,x,y,w所處的方向區間km。中[]代表取整數。2.2計算tf-idf并排序過濾在信息檢索領域中,有研究人員提出了tf-idf的概念來衡量某一個詞在整篇文檔中的重要性[15]。在本文中,同樣可以用tf-idf來詞匯在語義方向圖中的重要性。其中tf反映詞代表軌跡移動模式在全局中的顯著性,而idf則反映的是該詞是否常見。由于各個方向的重要性實際上相同的,因此只考慮詞頻的距離值。其中,N和num分別代表所有方向區間的個數與所計算詞出現的方向區間的個數。在取對數之后,idf的值能更好的表達一個詞出現的區間越少,則這個詞越重要的特點。此外,在idf的基礎上加1是為了處理idf等于0的情況。從上式(6)中可看出,tf-idf值越大,表示這個詞越有意義越重要,其代表的軌跡移動模式顯著性越強。計算出各區間內各個詞的tf-idf后,即可根據tf-idf值的大小在每個方向區間中選擇出tf-idf最大的若干個詞匯進行顯示。此外,若數據在縱軸上出現小指聚集或有異常值的情況下,可以對縱向的R軸進行了一個如下式(7)的指數變換,以保證語義方向圖的效果更好。式中R和R’分別為變換前后的縱軸距離值。下圖2(a)即經過指數變換之后的可視化結果。
2.3文字位置微調為了提高空間利用率以及可視化顯示效果,很多研究詞云的人提出了各種不同的方法來避免詞匯重疊。例如,FernandaB.Viégas使用了一種隨機貪婪算法,即每次給與其他詞重疊的詞移動一個新位置,直至不再重疊,實現逐步逼近最優解的過程[16]。本文即通過這種類似的貪婪算法解決詞與詞之間相互重疊的問題。以下為實現文字位置微調的貪婪算法的基本流程:(1)碰撞檢測首先依次對一個詞與其他所有詞進行碰撞檢測。若檢測得該詞與另一個詞有重疊時,則進行下一步;若與其他所有詞都無重疊,則對下一個詞進行判斷。檢測碰撞的一個比較簡單的方法就是檢測兩個詞的外接矩形是否相交。(2)位置隨機微調若某兩個詞有碰撞,則隨機選擇其中一個,并對這個詞的位置在一定的限制條件下進行隨機的調整,包括角度和距離兩個方面。其中限制條件有兩個。第一,在進行調整時,其距離和角度的移動步長應該是在某一個范圍內的隨機值,不能太大。此外,對于字體較大即較移動模式較顯著的詞,其移動幅度應較小,盡量保持其原有的分布;第二,在微調的過程中,不能移出詞匯所在區間范圍。(3)循環至無碰撞或終止在完成對一個詞的移動后,返回第一步檢測碰撞,直至所有的詞都不發生重疊的現象。在實際過程中,多數情況下很難找到最優解,即所有詞都不重疊,特別是當顯示的詞數量較多時。因此,此處可以限制一個合理的循環次數。當循環了足夠多的次數或者所有詞都不重疊時,終止循環。
3應用研究
3.1數據來源與實驗工具本文以1985年到2004年間我國大陸地區的國內生產總值(GDP)、客運量、醫療機構數、就業人口等40項經濟指標的重心軌跡數據為例,利用語義方向玫瑰圖的方法對其進行統計分析。根據得到的語義方向玫瑰圖,發現隱含于經濟重心軌跡數據中的顯著移動模式,反映出在所研究時間段內研究區域內部各項經濟指標重心的整體移動特征以及模式顯著的單項經濟指標重心移動特征。該實例應用數據來自統計局經濟年鑒。本文中實現的分析工具和探索性分析方法都是由Python編程語言實現。其中主要用到python中專門用于繪圖的matplotlib庫。
3.2實驗結果如圖2(a)與2(b)為該實例應用進行文字位置微調前后的語義方向玫瑰圖。結果表明:1)從整體模式上看,移動角度在[0°,90°]以及[180°,270°]之間的軌跡多,頻率高,由此計算所得這兩個區間內語義詞匯的詞頻矢量中的r值較大,所以區間內詞匯字體較大,顏色較深,即軌跡移動模式較顯著。圖上大部分語義詞匯集中于東北與西南兩方向上,即1985年到2004年間我國各項經濟指標主要在東北、西南方向上移動。這主要與改革開放和西部大開發政策頒布初期我國整體社會經濟活動主要向西南和東部聚集,但之后該趨勢明顯減弱,開始向東北方向擴散有關[17]。2)從單項經濟指標移動模式來看,軌跡在某一方向區間移動的距離越長,即詞頻矢量中的r值越大,在圖中就表現為詞匯所處位置離中心越遠,字體越大,顏色也越深,說明其往該方向上移動的模式越顯著。由此可見,圖中反映的重心軌跡移動模式最為顯著的經濟屬性為客運量、衛生機構數、集體企業以及油料產量。在1985年至2004年間全國客運量重心顯著往北方移動,這是由于北京是我國的經濟政治文化重心,交通便利,與全國各地的經濟文化等方面交流緊密,流動人口多,且改革開放以來,北京和天津的旅游業發展迅速[18];隨著改革開放之后,上海、江浙及廣東等東部沿海地區經濟地位的快速提升和發展,特別是外向型經濟[19],引起集體企業重心向東聚集;而且,東部沿海地區經濟地位提升后,人口也隨之增多,必然導致東部地區衛生機構數的增加;而反映了農業發展的油料產量重心主要向西南方向移動,與該時間段內西部大開發政策帶動很大程度上帶動了西部地區的發展的情況一致,且在全國范圍內,西部地區經濟地位仍然較低,因此農業在其經濟產業中占主導地位[20]。
4結束語
本文詳細描述了語義方向玫瑰圖的生成過程與方法,并以實例數據為例,通過語義方向玫瑰圖分析工具對社會經濟重心軌跡移動模式進行挖掘。結果表明語義方向玫瑰圖結合了軌跡語義信息與方向玫瑰圖,從語義的角度進行統計分析,以一種更全面直觀的可視化形式,有效的同時反映出顯著的單條或多條相關社會經濟重心軌跡的移動模式以及各經濟重心移動的整體分布格局。下一步的研究工作主要有三點:1)在語義方向玫瑰圖中添加時間維度,反映出重心移動在所研究時間段內的歷史變化過程,以表達出經濟重心軌跡移動的時空模式特征。2)增強用戶交互,實現圖中的語義詞匯與實際地理空間內的原始軌跡的對應和鏈接。3)合理控制詞匯位置微調的程度。在滿足研究對詞匯位置精度需求的情況下,盡量減少詞與詞之間的重疊碰撞,優化可視化效果。
作者:劉汝倩佘冰朱欣焰咼維單位:武漢大學測繪遙感信息工程國家重點實驗室