1. ỨNG DỤNG LUẬT KẾT HỢP ĐỂ GIẢI QUYẾT BÀI TOÁN KHỬ NHẬP NHẰNG NGHĨA TỪ TIẾNG VIỆT
Trang 3 |  PDF (Size KB)
Đinh Phú Hùng

Trong tất cả các ngôn ngữ, tồn tại những từ mà nó có thể được dịch theo nhiều nghĩa khác nhau phụ thuộc vào ngữ cảnh mà nó xuất hiện. Đặc biệt, với một từ mà từ loại của nó đã được xác định, nếu nó có nhiều hơn một nghĩa thì được gọi là từ đa nghĩa. Bài toán khử nhập nhằng nghĩa từ (WSD) chính là việc đi xác định nghĩa phù hợp nhất trong tất cả các nghĩa của từ đa nghĩa mà từ này nằm trong một ngữ cảnh xác định. 

Cho đến nay, mặc dù các phương pháp tiếp cận dựa trên học máy thống kê áp dụng giải quyết cho bài toán WSD đã cho thấy được những ưu điểm khi so sánh với các phương pháp khác. Tuy nhiên, các mô hình học máy thống kê tạo ra các phân lớp mà theo quan sát của chúng tôi là có thể khó hiểu và không dễ chỉnh sửa ngay trên mô hình bởi tri thức con người. Chính vì vậy, chúng tôi đề xuất việc sử dụng các luật kết hợp khai phá được từ những ngữ cảnh của từ nhập nhằng để tạo ra phân lớp dựa trên luật mà có thể dễ dàng hiểu và chỉnh sửa bởi tri thức con người.