2019年12月20日 星期五

Kmean演算法

今天S提到有一家鞋子代工公司希望我們能幫它們多間工廠,設計一個人工智慧方法,能依照員工上下班打卡紀錄,偵測異常狀況。我上網搜尋到微軟的網站有在討論abnormal data的問題,如下,內容是利用Kmean演算法來做,故我去找kMean的資料來看。
https://msdn.microsoft.com/en-us/magazine/jj891054.aspx
Kmean的過程是:
  1. 從N個向量隨機選取K個向量作為分群中心,K個群。
  2. 對剩餘的向量,測量到K個群中心的距離,並歸類到最近的群。
  3. 重新計算每個群的中心。
  4. 重覆1~3步驟,直到新的群中心和舊的相等,或小於Threshold。

Kmean的缺點:
  1. 中心點的選擇影響演算法效率,容易局部最佳化。
  2. 需事先設定K數,必需靠經驗。
  3. 易受異常偏離資料影響,造成群中心不正常偏離。

沒有留言:

張貼留言

IKEA吊櫃廚櫃

 好不容易裝好IKEA買來的吊櫃,花了三天。 從組裝,鑽牆,上牆調水平,累死我了。