dc.description.abstract |
Hiện nay, các kỹ thuật được sử dụng để phân loại và truy xuất ảnh thường sử dụng thông tin văn bản (text) từ nguồn thông tin phụ trợ (metadata) của dữ liệu ví dụ như nhãn, chú giải (tag), bình luận (comment) của người dùng (ví dụ như Google tìm kiếm văn bản). Tuy nhiên không phải lúc nào các thông tin này cũng có sẵn, cũng chính xác, đặc biệt lại phụ thuộc lớn vào quan điểm của người dùng cũng như ngôn ngữ mà người dùng sử dụng. Hơn nữa việc mô tả bức ảnh bằng một vài từ khóa không phải công việc dễ dàng. Việc gán nhãn ảnh bằng tay còn thực sự khó khăn tốn kém và trở lên bất khả thi khi số lượng ảnh tăng lên rất nhanh chóng như hiện nay.
Xu hướng hiện tại là gán nhãn ảnh một cách tự động sử dụng trực tiếp nội dung ảnh (image content), gán các nhãn cho ảnh đó, qua đó giúp dễ dàng quản lí ảnh cũng như tìm kiếm ảnh. Vấn đề này vẫn luôn nhận được sự quan tâm của các nhà nghiên cứu với hi vọng có thể cải thiện hơn độ chính xác, tốc độ xử lý, sự đa dạng và độ khó của các tập ảnh. Xu hướng chung của các nghiên cứu này là tìm ra các đặc trưng tốt hơn trong việc đặc tả ảnh, qua đó cải thiện được độ chính xác trong quá trình nhận dạng và gán nhãn ảnh. Một xu hướng nữa cũng được quan tâm là sử dụng khai thác triệt để tất cả các thông tin có thể có từ ảnh (metadata, ví dụ như thời gian chụp, địa điểm chụp, tham số của máy ảnh, chú giải, bình luận của người dùng…) để cải tiến giải thuật. Trong đề tài này tôi cũng đi theo hai xu hướng trên, khai thác việc sử dụng đồng thời nhiều loại đặc trưng trong mô tả ảnh và thông tin phụ trợ có được từ internet gắn liền với ảnh đó để tăng độ chính xác trong quá trình nhận dạng và gán nhãn hình ảnh. |
vi |