基於arcpy實現空間資料聚類,kmeans

阿新 • • 發佈：2019-01-07

並不能直接進行空間資料的聚類，原理是讀取要素的x，y座標來進行聚類，然後將聚類中心儲存為空間資料以達到效果

# encoding: utf-8
from sklearn.cluster import KMeans
import numpy as np
import arcpy
import pandas as pd
from arcpy import env
env.workspace=r"D:\84.gdb"
target="bujiandian"
cursor=arcpy.SearchCursor(target)
allfea=[]
dic={}
name="ysdm"#程式碼要素列別的欄位
for row in cursor :
    ls=[]
    if(dic.has_key(row.getValue(name))):
        dic[row.getValue(name)]+=1
    else:
        dic[row.getValue(name)] = 1
    ls.append(row.getValue(name))
    ls.append(row.getValue("ptx"))
    ls.append(row.getValue("pty"))
    allfea.append(ls)
data2=pd.DataFrame(allfea,columns=[name,"ptx","pty"])
dataFilter=data2.query(name+"=='9000402'")
#取座標進行聚類
df1 = dataFilter.ix[:,1 :]
kmeans = KMeans(n_clusters=3, random_state=10).fit(df1)
#dfl是聚類的結果
df1['jllable'] = kmeans.labels_
df_count_type = df1.groupby('jllable').apply(np.size)

##聚類中心
cent=kmeans.cluster_centers_
#將聚類中心儲存為空間資料
sr = arcpy.SpatialReference(4326)
fc=arcpy.CreateFeatureclass_management( r"D:\cs","test.shp", "POINT", "", "","", sr)
arcpy.AddField_management(r"D:\cs\test.shp", "leibie", "TEXT")
cursor=arcpy.InsertCursor(fc)
for line in cent:
    feature = cursor.newRow()
    # Add the point geometry to the feature
    vertex = arcpy.CreateObject("Point")
    vertex.X = line[0]
    vertex.Y =line[1]
    feature.shape = vertex
    # Add attributes
    feature.leibie = "shumu"
    # write to shapefile
    cursor.insertRow(feature)
del cursor
del fc

基於arcpy實現空間資料聚類,kmeans

並不能直接進行空間資料的聚類，原理是讀取要素的x，y座標來進行聚類，然後將聚類中心儲存為空間資料以達到效果 # encoding: utf-8 from sklearn.cluster import KMeans import numpy as np import arcpy import pa

資料探勘筆記-聚類-KMeans-原理與簡單實現

K中心點演算法（K-medoids）提出了新的質點選取方式，而不是簡單像k-means演算法採用均值計演算法。在K中心點演算法中，每次迭代後的質點都是從聚類的樣本點中選取，而選取的標準就是當該樣本點成為新的質點後能提高類簇的聚類質量，使得類簇更緊湊。該演算法使用絕對誤差標準來定義一個類簇的緊湊程度。如果

python資料分析與挖掘之聚類kmeans演算法

聚類不指定類別進行分類（劃分（分裂）法，層次分析法、密度分析法）、網格法、模型法 Kmeans演算法屬於分裂法隨機選擇k各點作為聚類中心計算各個點到這K個點的距離將對應的點聚到與它最近的這個聚類中心重新

在Spark SQL對人類資料實現K-Means聚類，並對聚類中心格式化輸出

簡介本篇博文對UCI提供的 Machine-Learning-Databases 資料集進行資料分析，並通過K-Means模型實現聚類，最後格式化輸出聚類中心點。本文主要包括以下內容：通過VectorAssembler來將多列資料合成一列features

MATLAB學習之路（一）實現簡單的基於歐式距離的新型聚類演算法（Clustering by fast search and find of density peaksd）

大學本科三年，眨眼而已，對於一個考研黨來說，本科時間已所剩不多，大三上學期初次接觸到MATLAB。的確如大牛們所說，強大的計算能力，充足的數學工具，帶來使用者極大的便利。在大資料的學習過程中，MAT

基於歐幾里德聚類的鐳射雷達點雲分割及ROS實現——學習總結

1、特別說明本部落格是在復現大神部落格的過程中遇到問題的解決方式，具體的部落格地址是： https://blog.csdn.net/AdamShan/article/details/83015570#commentsedit 寫的非常好的博主，在此大力推薦！！！ 2、實現過程

基於大資料聚類社群的作弊使用者發現方法

前面的文章中我們講道，像趣頭條類的APP對於收徒和閱讀行為給予使用者現金獎勵的方式勢必會受到大量羊毛黨黑產的注意，其實單個使用者能薅到的錢是沒有多少的，為了達到利益最大化，黑產肯定會利用各種手段構建大量賬號來薅APP運營企業的羊毛，因為收徒的獎勵遠高於閱讀，所以賺取收徒獎勵就成了最嚴重的薅羊毛手段。前文提到為

第十篇：K均值聚類(KMeans)

步驟中國小結 logo kmeans 實現調整 r語言 img 前言本文講解如何使用R語言進行 KMeans 均值聚類分析，並以一個關於人口出生率死亡率的實例演示具體分析步驟。聚類分析總體流程 1. 載入並了解數據集；2. 調用聚類函數進行聚類

python實現一個層次聚類方法

mac ima 優先隊列 () don 標簽中位數 filepath normal 層次聚類(Hierarchical Clustering) 一.概念　　層次聚類不需要指定聚類的數目，首先它是將數據中的每個實例看作一個類，然後將最相似的兩個類合並，該過程叠代計算只到剩

聚類-----KMeans

create mllib edi cit clust package contex kmean local package Spark_MLlib import org.apache.spark.ml.clustering.KMeans import org.apach

通過IDEA及hadoop平臺實現k-means聚類算法

綜合 tle tostring html map apache cnblogs cos textfile 有段時間沒有操作過，發現自己忘記一些步驟了，這篇文章會記錄相關步驟，並隨時進行補充修改。 1 基礎步驟，即相關環境部署及數據準備數據文件類型為.csv文件，excel

基於arcpy實現工作中需要實現功能的經驗和代碼總結：

命名 parameter gem 叠代器 aps .... pri 工具箱文件夾不知道從哪兒總結起，就按時間順序整理吧。關鍵詞：arcgis，python，批量，字段，地圖發布 1.給不同的要素添加不同的批量字段（例如：給“閥門”要素添加“本點號”、“點類型”、“狀

【R統計】基於相似系數的聚類分析

ant 建模 sub plc str 選擇 pre light 均值題目：對48名應聘者數據的自變量作聚類分析，選擇變量的相關系數作為變量間的相似系數（cij），距離定義為dij=1-cij。分別用最長距離法、均值法、重心法和Ward法作聚類分析，並畫出相應的譜系圖。

使用Java實現K-Means聚類演算法

第一次寫部落格，隨便寫寫。關於K-Means介紹很多，還不清楚可以查一些相關資料。個人對其實現步驟簡單總結為4步: 1.選出k值,隨機出k個起始質心點。 2.分別計算每個點和k個起始質點之間的距離,就近歸類。 3.最終中心點集可以劃分為k類,

基於echarts實現實時資料傳輸效果

效果圖：程式碼片段： const targetCoord = [1000, 140] const curveness = 0.2 const linesData = [] const categories = [{ name: '流入中', itemStyle: {

資料聚類

1相似度分析相似性度量準則是聚類分析用來度量資料之間差異化的一個重要標準。聚類分析中數據之間相似程度較大，需要按照某種聚類準則進行分離資料。在這樣的一個過程中，需要使用相似性度量來衡量資料之間的相似及不同。在相似性度量中，距離度量是最常使用的一個準則，用來衡量資料之間的差異性，一般

通過TSNE將高維資料聚類結果以二維的方式展示出來

#!/usr/bin/env python #-*- coding:utf-8 -*- #接k_means.py #k_means.py中得到三維規範化資料data_zs； #r增加了最後一列，列索引為“聚類類別” from sklearn.manifold import TSNE tsne=

資料聚類演算法-K-means演算法

深入淺出K-Means演算法摘要：在資料探勘中，K-Means演算法是一種 cluster analysis 的演算法，其主要是來計算資料聚集的演算法，主要通過不斷地取離種子點最近均值的演算法。 K-Means演算法主要解決的問題如下圖所示。我們可以看到，在圖的左邊有一些點，我們用肉眼可以看出來有四

大資料聚類演算法效能比較及實驗報告

在大資料領域這個聚類演算法真是起到了十分重要的作用，只有通過有效地聚類才能得到非常直觀的結果。有一個實驗要求對比兩種大資料聚類演算法的效能，具體的程式碼也不是由我實現的，我只是改了一部分，主要還是部落格大佬們的程式碼，我這裡借用了一下~~ 具體的實驗報告和

TensorFlow學習（二）資料聚類分析

本文通過K均值演算法作為例子研究資料聚類分析一、無監督學習概念無監督學習可以從給定的資料集中找到感興趣的模式。無監督學習，一般不給出模式的相關資訊。所以，無監督學習演算法需要自動探索資訊是怎樣組成的，並識別資料中的不同結構。二、什麼是聚類聚類就是對大量未知

基於arcpy實現空間資料聚類,kmeans

相關推薦