今天S提到有一家鞋子代工公司希望我們能幫它們多間工廠,設計一個人工智慧方法,能依照員工上下班打卡紀錄,偵測異常狀況。我上網搜尋到微軟的網站有在討論abnormal data的問題,如下,內容是利用Kmean演算法來做,故我去找kMean的資料來看。
https://msdn.microsoft.com/en-us/magazine/jj891054.aspx
https://msdn.microsoft.com/en-us/magazine/jj891054.aspx
Kmean的過程是:
- 從N個向量隨機選取K個向量作為分群中心,K個群。
- 對剩餘的向量,測量到K個群中心的距離,並歸類到最近的群。
- 重新計算每個群的中心。
- 重覆1~3步驟,直到新的群中心和舊的相等,或小於Threshold。
Kmean的缺點:
- 中心點的選擇影響演算法效率,容易局部最佳化。
- 需事先設定K數,必需靠經驗。
- 易受異常偏離資料影響,造成群中心不正常偏離。
沒有留言:
張貼留言