<option id="mwy0y"><strong id="mwy0y"></strong></option>
  • <ul id="mwy0y"><sup id="mwy0y"></sup></ul>
  • <ul id="mwy0y"></ul>
  • <del id="mwy0y"><dfn id="mwy0y"></dfn></del><ul id="mwy0y"><sup id="mwy0y"></sup></ul>
  • <abbr id="mwy0y"></abbr>

    千鋒教育-做有情懷、有良心、有品質的職業教育機構

    400-811-9990
    手機站
    千鋒教育

    千鋒學習站 | 隨時隨地免費學

    千鋒教育

    掃一掃進入千鋒手機站

    領取全套視頻
    千鋒教育

    關注千鋒學習站小程序
    隨時隨地免費學習課程

    上海
    • 北京
    • 鄭州
    • 武漢
    • 成都
    • 西安
    • 沈陽
    • 廣州
    • 南京
    • 深圳
    • 大連
    • 青島
    • 杭州
    • 重慶
    當前位置:長沙千鋒IT培訓  >  技術干貨  >  聚類和降維有什么區別與聯系?

    聚類和降維有什么區別與聯系?

    來源:千鋒教育
    發布人:xqq
    時間: 2023-10-11 07:21:51

    一、聚類和降維的區別與聯系

    區別

    降維就是復雜的高維數據信息簡化為更容易閱讀的低維數據信息,就像素描把三維的立體圖形繪制在二維的平面上,而我們可以通過繪制而成的二維平面來了解到三維物體本身是什么,卻不用我們到作者的繪畫現場去看畫的東西到底是什么樣。我們需要通過對單細胞轉錄組數據降維,來獲得更容易閱讀的低維數據信息。

    聚類就是歸類,按照一定的標準來進行歸類就是聚類。我們得到降維后的數據后,就能根據聚類算法對細胞進行分群聚類,通過可視化圖來呈現更直觀的效果。這里,我們還是以樹葉比作細胞來方便大家理解。我們把不同年份的葉子比作不同種類的細胞來進行分類。由于上述摘葉子(降維)的方式不同,我們最終呈現出來分葉子(聚類)的可視化情況也會有所不同。

    相同或相近年份的葉子會在一定程度上相似(如顏色、大小、葉脈紋路等),就好比我們同類細胞或者相近來源的細胞,他們某些基因表達量是相近的。將不同年份的葉子顏色、大小、葉脈紋路等的差異理解為不同細胞的基因的表達情況和表達量的差異。

    聯系

    降維和聚類是同時進行的兩個獨立過程,將兩者結果合并才是我們最終得到的可視化結果。但這個合并過程中一定會存在矛盾的地方,這也是影響了可視化圖中分群邊界與聚集遠近的最主要原因。

    PCA是經典的線性降維方式,每一個維度代表了數據的一個特征信息,用越多的特征信息去描述一個數據就越接近真實;取用的維度越少,信息的丟失量越多。而在可視化中,我們只能使用“最有特色”的兩個或三個主成分去描述數據,這就使得大量的細胞無法被良好地區分開,最終呈現的結果就是不同類型的細胞類型之間的邊界不明顯。

    此外,還需要提及的一點是,并不是所有聚類分出的同種細胞都會降維在一起。在可視化圖中相同的細胞類型可能也會有較遠的分布。

    tSNE的算法使得高維的相近距離在低維觀測的時候有一定幾率變成較遠距離,可視化圖上就會看起來不像是同一簇細胞。而UMAP雖然能比tSNE更好地將相似細胞簇聚集,不同類細胞簇分開,但當UMAP的計算距離和聚類的計算距離差異較大時,可視化結果就也會顯示同一個細胞聚類被分了開來。

    延伸閱讀:

    二、搭梯子摘(tSNE)

    以一個隨機的位置作為起始點,架個梯子爬上去摘,每次摘一部分就得爬到樹下放葉子,然后再爬上梯子繼續摘,那整個過程就會變得十分漫長,耗時耗力,但優點是能有效地還原一部分樹生長高度的位置信息,并能將生長在一起的葉子放在同一摞。

    這種方法與之對應的降維法便是非線性降維tSNE算法,由于tSNE的計算過程較為復雜且耗時長,往往需要先通過PCA進行預降維處理。PCA降維過的數據再進行tSNE降維(降至二維或三維)實現可視化。而tSNE算法其實主要就是通過將臨近的相似點距離收縮,較遠的(非相似)點距離增大將各集群邊界分開。

    以上就是關于聚類和降維有什么區別與聯系的內容希望對大家有幫助。

    聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。

    猜你喜歡LIKE

    boxcode是什么軟件?

    2023-10-11

    er圖橢圓表示什么?

    2023-10-11

    ic與id的區別是什么?

    2023-10-11

    最新文章NEW

    業務需求管理辦法有哪些優點?

    2023-10-11

    軟路由是什么?

    2023-10-11

    什么是操作系統中資源分配的基本單位?

    2023-10-11

    相關推薦HOT

    更多>>

    快速通道 更多>>

    最新開班信息 更多>>

    網友熱搜 更多>>