본문 바로가기

machinelearning4

[Outlier Detection in High-Dimensional Data] (OUTRES) Statistical Selection of Relevant Subspace Projections for Outlier Ranking Paper ieeexplore.ieee.org/abstract/document/5767916?casa_token=GOPwF1ieLbcAAAAA:d8Tm9ZFsIugvR5LDZajFhwAVKbZkdkOu2HSXY2Gxhu6JGB_5PTYhTwUF3QaLQD5PfFfegkhk Abstract OUTRES는 outlier detection in high-dimensional data에서의 문제를 해결하기 위해 observation 마다 relevant subspace를 찾는 (Local) Subspace Outlier Mining 방법론 입니다. 이 때, relevant subspace는 SOD와 다르게 변수 조합이 여러개인 multiple subspace가 제공됩니다. 이 때문에 다양한 관점 (multipl.. 2020. 9. 19.
[Outlier Detection in High-Dimensional Data] (FB) Feature Bagging 리뷰 Paper dl.acm.org/doi/abs/10.1145/1081870.1081891?casa_token=fJmH04B3mzMAAAAA:Qpesfom07GOIXjeXBWxcIkHNmHrdFTDtJyjE1VXV3HmWQtyeeTKQlb2RE3GQa7ALJ-lFWnYzSPPu Introduction Feature Bagging은 supervised learning에서 널리 사용되는 Bagging 아이디어에 착안하여 High-Dimensional 데이터에서 Unsupervised learning 관점으로 Outlier를 탐지하는 새로운 방법을 제안합니다. Motivation 기존 outlier detection 방법론의 경우 데이터의 전체 변수 (full-dimension)를 모두 이용해 이상치를 탐지합니다.. 2020. 9. 12.
[Anomaly Detection] Extended Isolation Forest 설명 Extended Isolation Forest 논문 리뷰 2018년에 발표된 Extended Isolation Forest 논문을 바탕으로 정리한 글입니다. 본문의 표현은 원문의 내용을 참고하여 작성하였습니다. (Hariri, Sahand, Matias Carrasco Kind, and Robert J. Brunner. ”Extended isolation forest.” arXiv preprint arXiv:1811.02141 (2018).) Contents Motivation What Makes This Problem? Solution Notation Methodology Empirical Results Summary Introduction Extended Isolation Forest 는 Isolat.. 2020. 6. 14.
[Anomaly Detection] Isolation Forest 설명 목차 Introduction Anomaly detection 이란? Anomaly detection은 대다수의 정상 데이터들과 다른 양상을 보이는 희귀한 케이스를 탐지하는 걸 목표로 하는 Machine Learning의 연구분야 중 하나입니다. Anomaly detection이 사용될 수 있는 분야는 굉장히 다양한데, 대표적으로 금융회사에서 사기 고객을 판별하거나 (Fraud detection) 네트워크를 가지고 있는 포탈 회사에서 정상적이지 않은 접근을 탐지 (Network intrusion detection) 예들을 생각해 볼 수 있습니다. Anomaly detection 문제의 특성 Anomaly detection은 그 문제의 특성상 class의 imbalanced가 굉장히 심합니다. 극단적인 경우.. 2020. 5. 2.