亚洲一区中文字幕在线电影网,中文字幕亚洲欧美一区,亚洲乱码中文字幕综合

Python中使用K-means算法

來源：千鋒教育

發布人：xqq

時間： 2023-11-09 10:42:22

python中使用K-means算法

k-means是機器學習中最常用的聚類算法，關于k-means算法的數學原理、算法、偽碼等已有相當豐富的文獻，在此不再贅述。

1、調用以下庫

importnumpyasnp#用于抽樣和生成隨機數

fromsklearn.clusterimportKMeans#sklearn自帶的Kmeans算法,用于嚴重本文算法結果是否正確

importmatplotlib.pyplotasplt#結果可視化

importsys#需要用到sys.exit()函數

若不需要驗證聚類結果是否可以不使用Sklearn庫。

2、生成用于訓練的隨機數據

np.set_printoptions(suppress=True)#令numpy的結果不以科學計數法的方式輸出

Data=np.array([[1.0,2.0],[1.5,1.8],[3,4],[6,8],[8,8],[1,0.6],

[9,11],[7,10]])#你也可以通過抽樣的方式來更快的獲得測試數據

3、定義用于選擇隨機初始點和簇數(k)的函數

defK_means(data,k):

globalMean

mean=[]

a=np.max(data[:,0])

b=np.min(data[:,0])

c=np.max(data[:,1])

d=np.min(data[:,1])

foriinrange(k):

x=np.random.uniform(a,b,1)

#此處返回array

y=np.random.uniform(c,d,1)#此處返回array

mean.append([float(x),float(y)])

Mean=np.array(mean)

returnMean

在上面的代碼中，為了限定初始點(x,y)的位置不會超出樣本點的范圍，因此均勻抽樣的上下限是指訓練數據(a,b)和(c,d)的最小橫距。

4、定義可視化函數,繪制測試數據散點圖

defvision(data,cell):

plt.figure(figsize=(12,6))

ax1=plt.subplot(121)

ax1.scatter(Data[:,0],Data[:,1])#原始數據散點圖

ax1.scatter(point[:,0],point[:,0])#同時將隨機選取的初始點表示出來

plt.xlabel("x")

plt.ylabel("y")

plt.title("scatterof"+"rural"+"data")

ax2=plt.subplot(122)

ax2.scatter(Data[:,0],Data[:,1])#原始數據散點圖

ax2.scatter(data[:,0],data[:,1])#經過迭代后最終確定的聚類點

plt.xlabel("x")

plt.ylabel("y")

plt.title("scatterof"+cell+"data")

plt.show()

聚類結果的可視化對于判斷聚類結果的準確性至關重要。

5、定義迭代過程,通過不斷計算各個樣本對聚類點的歐式聚類,來不斷更新聚類點

defiteration(Data,point):

A=[]

B=[]

foriinrange(len(Data)):

d1=np.sqrt(sum(pow(Data[i]-point[0],2)))

d2=np.sqrt(sum(pow(Data[i]-point[1],2)))

ifd1>d2:

A.append(list(Data[i]))

else:

B.append(list(Data[i]))

iflen(A)==len(Data)orlen(B)==len(Data):

print("初始化錯誤")

sys.exit(0)

new_x1=np.mean(np.array(A)[:,0])

new_y1=np.mean(np.array(A)[:,1])

new_x2=np.mean(np.array(B)[:,0])

new_y2=np.mean(np.array(B)[:,1])

new_point=np.array([[new_x1,new_y1],[new_x2,new_y2]])

returnnew_point

注意,上段代碼中加入了一個if語句

iflen(A)==len(Data)orlen(B)==len(Data):

print("初始化錯誤")

sys.exit(0)

由于初始點是隨機產生的，所以這個條件語句是非常必要的，因此有可能所有的樣本點都只接近一個聚類中心而遠離另一個聚類中心，這樣就不能形成兩個聚類中心，程序將會報錯，因此我們需要排除出現這種情況的可能性。一旦所有樣本點都接近一個聚類中心時令程序停止。

以上就是Python中使用K-means算法，希望能對大家有所幫助!更多Python學習教程請關注 IT培訓機構:千鋒教育。

聲明：本站稿件版權均屬千鋒教育所有，未經許可不得擅自轉載。

python中最小二乘法如何理解?

python入門:方差和標準差的區別

猜你喜歡LIKE

行業資訊 更多>>

長沙口碑好的云計算培訓機構有哪...

長沙哪個云計算培訓班靠譜

長沙培訓云計算哪個口碑好

長沙如何選擇云計算培訓機構

技術干貨

pythoncontextmanager()的轉換

熱

pythoncontextmanager()的轉換

技術問答 在線提問>>

張同學在線提問

unity編輯器怎么調中文

在Unity編輯器中進行中文設置是非常簡單的，...詳情

劉同學在線提問

linux創建多級目錄的命令os.mkdir的方法

在Linux中，要創建多級目錄，你可以使用os.mk...詳情

師資團隊 更多>>

陸神

原去哪兒網高級架構師

北京大學計算機系畢業

HTML5學科教研總監

千鋒威哥

OCP認證專家

15年以上開發經驗

Java學科首席技術官

宋宋

原阿里后端架構師

北京郵電大學碩士

Python學科首席技術官

盧老師

北京大學博士后

北京科技大學博士

人工智能學科總監

索爾

原阿里后端架構師

浙工大計算機系畢業

Java學科高級講師

jackfrued

曾任職華為成都研究所

計算機應用技術博士

Python學科教學主管

快速通道 更多>>

課程介紹
點擊獲取大綱
就業前景
查看就業薪資
學習費用
了解課程價格
優惠活動
領取優惠券
學習資源
領3000G教程
師資團隊
了解師資團隊
實戰項目
獲取項目源碼
開班地區
查看來校路線

網友熱搜更多>>

IT行業年齡有限制嗎女生學IT Java薪資待遇零基礎Web培訓 Python就業如何學UI設計大數據學習路線 java培訓學費軟件測試培訓轉行學Linux 網絡安全基礎知識網絡營銷培訓 unity培訓 30歲還能學it嗎大數據技術學什么 python培訓費

Python中使用K-means算法

10年以上業內強師集結，手把手帶你蛻變精英

請您保持通訊暢通，專屬學習老師24小時內將與您1V1溝通

今日已有369人領取成功

猜你喜歡LIKE

python實現WSGI的框架

python打開文本文件有哪些方法?

python使用loguru操作日志

最新文章NEW

python-=是什么意思

pythonre是什么?

python列表追加元素出錯的解決

相關推薦HOT

pythonfor循環是什么

pythoncontextmanager()的轉換

python使用items()遍歷鍵值對

python實例方法中self的作用

熱門推薦

行業資訊 更多>>

長沙口碑好的云計算培訓機構有哪...

長沙哪個云計算培訓班靠譜

長沙培訓云計算哪個口碑好

長沙如何選擇云計算培訓機構

技術干貨

技術問答 在線提問>>

張同學在線提問

unity編輯器怎么調中文

劉同學在線提問

linux創建多級目錄的命令os.mkdir的方法

師資團隊更多>>

陸神

千鋒威哥

宋宋

盧老師

索爾

jackfrued

快速通道 更多>>

課程介紹

就業前景

學習費用

優惠活動

學習資源

師資團隊

實戰項目

開班地區

最新開班信息 更多>>

網友熱搜 更多>>

關于千鋒

新聞資訊

熱點話題

千鋒學習站 | 隨時隨地免費學

掃一掃進入千鋒手機站

行業資訊更多>>

技術問答在線提問>>

快速通道更多>>

最新開班信息更多>>

網友熱搜更多>>