Bước tới nội dung

Ma trận đồng xuất hiện

Bách khoa toàn thư mở Wikipedia

Ma trận đồng xuất hiện hay phân bố đồng xuất hiện (còn được gọi là ma trận đồng xuất hiện mức xám - GLCMs) là một ma trận được định nghĩa trên một hình ảnh. Nó biểu diễn phân bố của các giá trị điểm ảnh (mức xám hoặc màu sắc) đồng xuất hiện tại một độ lệch nhất định. Nó được sử dụng như một phương pháp phân tích kết cấu với nhiều ứng dụng khác nhau, đặc biệt là trong phân tích hình ảnh y khoa.[1][2]

Phương pháp

[sửa | sửa mã nguồn]

Cho một hình ảnh mức xám . Ma trận đồng xuất hiện tính số lần các cặp điểm ảnh có giá trị và độ lệch cụ thể xuất hiện trong hình ảnh.

  • Độ lệch, , là một toán tử vị trí có thể áp dụng cho bất kỳ điểm ảnh nào trong hình ảnh (bỏ qua hiệu ứng biên). Ví dụ, có thể chỉ "một xuống, hai sang phải".
  • Một hình ảnh với giá trị điểm ảnh khác nhau sẽ tạo ra một ma trận đồng xuất hiện kích thước với độ lệch đã cho.
  • Giá trị tại vị trí của ma trận đồng xuất hiện cho biết số lần trong hình ảnh mà các giá trị điểm ảnh thứ xuất hiện trong quan hệ được xác định bởi độ lệch.

Với một hình ảnh có giá trị điểm ảnh khác nhau, ma trận đồng xuất hiện C kích thước được định nghĩa trên hình ảnh kích thước , tham số hóa bởi độ lệch , như sau:

Trong đó: là các giá trị điểm ảnh; là vị trí không gian trong hình ảnh I; độ lệch xác định quan hệ không gian mà ma trận này được tính toán; và biểu thị giá trị điểm ảnh tại vị trí .

‘Giá trị’ của hình ảnh ban đầu đề cập đến mức xám của điểm ảnh cụ thể, nhưng có thể là bất kỳ giá trị nào, từ giá trị bật/tắt nhị phân đến màu 32-bit và hơn thế nữa. (Lưu ý rằng màu 32-bit sẽ tạo ra một ma trận đồng xuất hiện kích thước 232×232!)

Ma trận đồng xuất hiện cũng có thể được tham số hóa theo khoảng cách, , và góc, , thay vì độ lệch .

Bất kỳ ma trận hoặc cặp ma trận nào cũng có thể được sử dụng để tạo ra một ma trận đồng xuất hiện. Tuy nhiên, ứng dụng phổ biến nhất của chúng là đo lường kết cấu (texture) trong hình ảnh, vì vậy định nghĩa tiêu biểu như trên giả định rằng ma trận là một hình ảnh.

Cũng có thể định nghĩa ma trận trên hai hình ảnh khác nhau. Ma trận như vậy có thể được sử dụng cho ánh xạ màu (color mapping).

Tên gọi khác

[sửa | sửa mã nguồn]

Ma trận đồng xuất hiện cũng được gọi là:

  • GLCMs (ma trận đồng xuất hiện mức xám)
  • GLCHs (biểu đồ đồng xuất hiện mức xám)
  • ma trận phụ thuộc không gian

Ứng dụng trong phân tích hình ảnh

[sửa | sửa mã nguồn]

Dù xem xét cường độ hay giá trị mức xám của hình ảnh, hoặc các thành phần màu sắc khác nhau, ma trận đồng xuất hiện có thể đo lường kết cấu của hình ảnh. Vì ma trận đồng xuất hiện thường lớn và thưa, nên các số đo khác nhau của ma trận thường được sử dụng để thu được tập hợp đặc trưng hữu ích hơn. Các đặc trưng được tạo ra bằng kỹ thuật này thường được gọi là đặc trưng Haralick, theo Robert Haralick.[3]

Phân tích kết cấu thường quan tâm đến việc phát hiện các đặc điểm của hình ảnh mà không thay đổi khi xoay. Để xấp xỉ điều này, các ma trận đồng xuất hiện tương ứng với cùng một quan hệ nhưng được xoay tại các góc đều nhau (ví dụ 0, 45, 90 và 135 độ) thường được tính toán và cộng lại.

Các phép đo kết cấu như ma trận đồng xuất hiện, "biến đổi wavelet" (wavelet transform), và "khớp mô hình" (model fitting) đã được ứng dụng đặc biệt trong phân tích hình ảnh y khoa.

Ứng dụng khác

[sửa | sửa mã nguồn]

Ma trận đồng xuất hiện cũng được sử dụng trong xử lý từ ngữ trong xử lý ngôn ngữ tự nhiên (NLP).[4][5]

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ “Texture Analysis Using the Gray-Level Co-Occurrence Matrix (GLCM) - MATLAB & Simulink - MathWorks United Kingdom”. uk.mathworks.com. Truy cập ngày 26 tháng 6 năm 2020.
  2. ^ Nanni, Loris; Brahnam, Sheryl; Ghidoni, Stefano; Menegatti, Emanuele; Barrier, Tonya (26 tháng 12 năm 2013). “Different Approaches for Extracting Information from the Co-Occurrence Matrix”. PLOS ONE. 8 (12): e83554. Bibcode:2013PLoSO...883554N. doi:10.1371/journal.pone.0083554. ISSN 1932-6203. PMC 3873395. PMID 24386228.
  3. ^ Robert M Haralick; K Shanmugam; Its'hak Dinstein (1973). “Textural Features for Image Classification” (PDF). IEEE Transactions on Systems, Man, and Cybernetics. SMC-3 (6): 610–621. doi:10.1109/TSMC.1973.4309314.
  4. ^ [Francois Chaubard, Rohit Mundra, Richard Socher. CS 224D: Deep Learning for NLP. Lecture Notes. Spring 2016.
  5. ^ Bryan Bischof. Higher order co-occurrence tensors for hypergraphs via face-splitting. Published 15 February 2020, Mathematics, Computer Science, ArXiv

Liên kết ngoài

[sửa | sửa mã nguồn]