Phòng Quản lý khoa học công nghệ và Hợp tác quốc tế
Địa chỉ:119, Ấp Bắc, Phường 5, TP. Mỹ Tho – Tiền Giang
Điện thoại liên hệ:
Email:
04-04-2024
Sáng ngày 03/4/2024 vừa qua, Trường Đại học Tiền Giang đã tổ chức Họp đánh giá kết quả thực hiện nhiệm vụ KH&CN cấp Trường “Nghiên cứu ứng dụng lý thuyết đại diện hạng thấp trong phân loại hình ảnh” do TS. Nguyễn Hoàng Vũ - Phó Hiệu trưởng Trường Đại học Tiền Giang làm chủ nhiệm và ThS. Trần Quốc Cường - Phó Trưởng Phòng Quản lý CSVC là thành viên tham gia thực hiện đề tài.
Hội đồng xét duyệt do TS. Lê Minh Tùng - Phó Hiệu trưởng Trường Đại học Tiền Giang làm chủ tịch cùng các thành viên khác, gồm TS. Dương Văn Hiếu - Trưởng Khoa KTCN, TS. Bùi Quang Thịnh - Khoa SP&KHCB, ThS. Dương Thanh Dũ - Khoa KTCN và ThS. Phạm Quốc Thịnh - Chuyên viên Phòng QLKHCN&HTQT, Trường Đại học Tiền Giang.
Tóm tắt nội dung nghiên cứu của đề tài:
Công nghệ phân loại hình ảnh là một trong những công nghệ được ứng dụng rộng rãi trong nhiều lĩnh vực hiện nay. Đây là một kỹ thuật xử lý hình ảnh để tự động hóa tất cả công việc như một hệ thống thị giác của con người có thể thực hiện. Về cơ bản, đây là một cách tiếp cận để phát hiện và xác định các đặc trưng của một đối tượng trong hình ảnh kỹ thuật số. Kỹ thuật này có thể được dùng để phân tích sâu hơn và ứng dụng đa dạng như nhận dạng khuôn mặt, nhân dạng mẫu, nhận dạng giọng nói, nhận dạng kí tự, phân đoạn hình ảnh… Rất nhiều các công ty lớn, những công ty công nghệ đã tìm cách để ứng dụng công nghệ hình ảnh trong việc sản xuất trên nhiều thiết bị.
Hiệu quả của quá trình phân loại hình ảnh phụ thuộc nhiều vào dữ liệu hình ảnh trong quá trình thu thập, như: độ sáng tối của hình ảnh, độ nghiên, kích thước, thành phần bị che khuất, … Hiện nay, phân loại vẫn chưa đảm bảo đạt được độ chính xác 100%. Cũng như mọi lĩnh vực cần phân tích dữ liệu, dữ liệu do thu thập có lúc là dữ liệu tốt, có khả năng sử dụng, hoặc dữ liệu phải bỏ qua. Tuy nhiên, ứng dụng của phân loại vẫn khẳng định nó là một công cụ tuyệt vời, ứng dụng ngày càng nhiều hơn trong lĩnh vực trí tuệ nhân tạo. Qua quá trình tiếp cận những đặc điểm nổi bật của lý thuyết LRR, nhóm nghiên cứu mong muốn ứng dụng lý thuyết LRR để nghiên cứu một thuật toán phân loại hình ảnh mới nhằm nâng cao hiệu quả phân loại, khắc phục những hạn chế tồn tại do quá trình thu nhận ảnh sinh ra. Độ chính xác của quá trình phân loại hình ảnh phụ thuộc rất nhiều vào dữ liệu và phương pháp trích xuất đặc điểm cùng với việc xây dựng thuật toán phù hợp. Chính vì vậy, việc nghiên cứu các thuật toán mới để cải thiện hiệu quả phân loại hình ảnh trong từng ứng dụng khác nhau vẫn còn là vấn đề thách thức. Với khả năng xử lý tốt với dữ liệu bị hỏng hoặc nhiễu của lý thuyết LRR, nhóm tác giả đề xuất thực hiện đề tài: “Nghiên cứu ứng dụng lý thuyết đại diện hạng thấp trong phân loại hình ảnh”. Việc nghiên cứu thuật toán phân loại hình ảnh sử dụng LRR kết hợp với phương pháp học từ điển sẽ góp phần làm đa dạng hóa các phương pháp, nâng cao độ chính xác, làm hoàn thiện dần bài toán phân loại hình ảnh trong thực tế. Phương pháp đề xuất còn có khả năng nhận dạng được mức độ tương quan giữa các thông tin trong dữ liệu và từ điển, nhằm mục tiêu cải thiện hiệu suất phân loại hình ảnh kể cả khi hình ảnh huấn luyện và kiểm tra đều bị hỏng với nhiễu lớn.
Nghiên cứu đề tài này tại trường Đại học Tiền Giang trong giai đoạn hiện nay là rất cần thiết với mong muốn nghiên cứu và công bố phương pháp mới trong lĩnh vực xử lý ảnh, góp phần tạo ra các ứng dụng hiệu quả trong lĩnh vực trí tuệ nhân tạo. Kết quả đề tài không chỉ đóng góp về mặt học thuật áp dụng trong lĩnh vực máy học, mà còn có thể triển khai vào giảng dạy, nghiên cứu có giá trị trong cùng lĩnh vực, đặc biệt có thể chuyển giao để tích hợp trong những ứng dụng như: phân loại hình ảnh trong nhận dạng đối tượng, nhận dạng khuôn mặt… và các ứng dụng thực tiễn trong lĩnh vực xử lý hình ảnh và trí tuệ nhân tạo.
Đề tài đã nghiên cứu thành công lý thuyết đại diện hạng thấp, đồng thời ứng dụng lý thuyết này để xây dựng một phương pháp học từ điển mới trong phân loại hình ảnh. Với thuộc tính phục hồi không gian con và làm sạch dữ liệu, phương pháp học từ điển với đại diện hạng thấp đã tạo ra từ điển với độ phân biệt cao, đại diện tốt cho dữ liệu huấn luyện cho dù hình ảnh có nhiễu hoặc hư hỏng. Ngoài ra, tận dụng ưu điểm của các ràng buộc trong quá trình huấn luyện từ điển như: ràng buộc cục bộ trên từ điển không mạch lạc, mô hình đề xuất đã cải thiện khả năng đại diện và khả năng phân biệt của từ điển. Từ điển được tạo giảm thiểu sự tương đồng giữa các nguyên tử từ điển liên kết với các lớp khác nhau và ràng buộc hạng thấp trên từ điển đã cải thiện sự tương đồng giữa các hệ số mã hóa từ cùng một lớp. Điều này đồng nghĩa với giải pháp đề xuất đã khắc phục được các tạp nhiễu và hư hỏng trên hình ảnh huấn luyện, đồng thời giải quyết được vấn đề tương đồng giữa các hình ảnh ở các lớp khác nhau. Mô hình đề xuất được giải quyết bằng cách vận dụng lý thuyết tối ưu một cách hiệu quả. Mô phỏng kết quả giải thuật được thực hiện trên phần mềm Matlab. Phương pháp đề xuất được thử nghiệm và so sánh với các giải thuật học từ điển tương tự. Mô hình đề xuất đã đạt được hiệu quả phân loại hình ảnh vượt trội, cho thấy khả năng ứng dụng thực tế của thuật toán. Ngoài ra, mô hình đề xuất còn đạt hiệu quả rất cao khi giảm đáng kể số nguyên tử của từ điển, điều này góp phần tối ưu không gian lưu trữ và tăng tốc độ tính toán khi áp dụng trong thực tế. Kết quả thực hiện đề tài không chỉ có ý nghĩa về mặt học thuật mà còn có thể sử dụng trong các nghiên cứu sâu hơn, nghiên cứu ứng dụng và là nguồn tài liệu giảng dạy, tham khảo.
QUỐC THỊNH
Phòng Quản lý khoa học công nghệ và Hợp tác quốc tế