Top Ad unit 728 × 90

Latest news

recent

Biểu đồ thống kê tần xuất (Histogram)

Là biểu đồ dạng thanh (bar) thể hiện tần số phân phối (phân phối xác xuất), thông qua quá trình thống kê để tính tóan cường độ xuất hiện của các loại phần tử trong một nhóm được khảo sát, ở một phạm vi xác định.
Đây là một khái niệm rất phổ biến, được sử dụng rộng rãi từ lĩnh vực kỉ thuật tới kinh tế. Thông thường một Histogram có dạng như sau:
Trong bài viết này chúng ta sẽ đi vào xem xét Histogram trong trường hợp ứng dụng vào xử lý ảnh như là một ví dụ. Nhìn vào hình trên ta thấy một ảnh cậu bé ở dạng đa mức xám (gray scale) và một biểu đồ Histogram tương ứng với tấm ảnh đó. Trục ngang của biểu đồ đại diện cho các loại phần tử, ở đây là các giá trị (intensity) của một pixel có thể có [0, 255], trong một số tài liệu người ta còn gọi các loại phần tử này là bins. Trục đứng là số lần xuất hiện của mỗi loại phần tử trong nhóm khảo sát (bức ảnh với n pixel). Từ phân tích trên cho thấy việc tính tóan Histogram của một bức ảnh hay một vùng (region) trong ảnh đơn giản chỉ là duyệt các pixel của ảnh hay vùng ảnh rồi đếm xem trong n pixel xem xét đó có bao nhiêu pixel có giá trị là 0, có bao nhiêu pixel giá trị là 1, ...255. Kết quả thống kê đó chính là nội dụng tạo ra biểu đồ Histogram của ảnh. Dưới đây là mả nguồn C cho quá trình tính toán này (trích từ VnSLib).

Việc tính toán Histogram sẽ chỉ tổ mang gói xôi nếu bạn không hiểu tại sao phải tính và làm thế nào để sử dụng Histogram phục vụ cho các xử lý cao cấp hơn.Thật ra định nghĩa của Histogram đã 80% trả lời cho những câu hỏi này, nó đã nói cho bạn thấy thông tin mà một Histogram thể hiện, vấn đề của 20% còn lại chỉ là làm sao để phân tích những thông tin đó, ứng dụng uyển chuyển vào từng tình huống cụ thể. Thông thường từ một Histogram ta có thể chú ý để suy ra hình dạng chung của tần số phân tán  (frequency distribution) , tính đối xứng (Symmetry ) và độ lệch (Skew) của phân tán,  thể thức (Modality ) của Histogram  là đơn, đôi hay đa thể thức(unimodal, bimodal, hay multimodal), từ đó mới có những kết luận hay lấy thông tin đó xử lý tiếp ở mức cao hơn. Đó chính là lý do tại sao bên cạnh những nhân viên thu thập và xử lý số liệu lại phải cần có các chuyên gia phân tích số liệu. Tiếp theo sau tôi sẽ đưa ra một cách phân tích và ứng dụng của Histogram trong xử lý ảnh như là minh họa thực hành. Ví dụ chúng ta có một hình và kết quả phân tích histogram như sau:
Một yêu cầu đặt ra là người ta muốn chuyển bức hình này sang hình nhị phân mà vẫn thể hiện rỏ các vùng  phân biệt. Từ histogram ta có thể thấy nó thuộc dạng thức bimodal do vậy trong tấm hình này có 2 lớp giá trị thuộc về 2 loại vùng phân biệt tương ứng với mỗi modal, chính vì lý do đó mà người ta chọn giá trị giữa 2 modal làm threshold cho việc phân họach nhị phân, ở đây là giá trị 120 (để hiểu thêm đọc bài sau). Kết quả là sau khi tiến hành phân họach nhị phân ta có:
 
Còn rất nhiều các ứng dụng phức tạp khác của Histogram mà chúng ta sẽ xem xét trong các bài viết tiếp theo.

Binh Nguyen - Bioz
Biểu đồ thống kê tần xuất (Histogram) Reviewed by Bioz Nguyen on 10:44:00 PM Rating: 5
All Rights Reserved by IEEV © 2009 - 2016
Powered By Blogger, Designed by Sweetheme

Contact Form

Name

Email *

Message *

Powered by Blogger.