DBSCAN
Một phần của loạt bài về |
Học máy và khai phá dữ liệu |
---|
DBSCAN (là viết tắt của cụm từ tiếng Anh: density-based spatial clustering of applications with noise, tạm dịch là phân cụm không gian dựa trên mật độ các ứng dụng với nhiễu) là một thuật toán phân tích cụm do Martin Ester, Hans-Peter Kriegel, Jörg Sander và Xiaowei Xu đề xuất vào năm 1996.[1] Đây là thuật toán phân cụm dựa theo mật độ phi tham số: với một tập các điểm đã cho trong một số không gian, thuật toán sẽ gom nhóm các điểm với nhau (các điểm có nhiều hàng xóm lân cận với bán kính cố định (fixed-radius near neighbors)) thành một nhóm, và đánh dấu là các điểm ngoại lệ nếu chúng nằm tách biệt với các điểm đã gom nhóm ở các vùng mật độ thấp (các điểm có các hàng xóm gần nhất ở khoảng cách quá xa). DBSCAN là một trong những thuật toán phân cụm phổ biến nhất và cũng được trích dẫn nhiều nhất trong các tài liệu khoa học.[2]
Tham khảo
[sửa | sửa mã nguồn]- ^ Ester, Martin; Kriegel, Hans-Peter; Sander, Jörg; Xu, Xiaowei (1996). Simoudis, Evangelos; Han, Jiawei; Fayyad, Usama M. (biên tập). A density-based algorithm for discovering clusters in large spatial databases with noise. Proceedings of the Second International Conference on Knowledge Discovery and Data Mining (KDD-96). Association for the Advancement of Artificial Intelligence. tr. 226–231. CiteSeerX 10.1.1.121.9220. ISBN 1-57735-004-9.
- ^ “Archived copy”. Bản gốc lưu trữ ngày 21 tháng 4 năm 2010. Truy cập ngày 18 tháng 4 năm 2010.Quản lý CS1: bản lưu trữ là tiêu đề (liên kết) Đa số các bài báo khai thác dữ liệu được trích dẫn theo tìm kiếm học thuật của Microsoft; DBSCAN ở hạng 24.