Trí tuệ nhân tạo đã có thể dịch ngôn ngữ mà không cần tới từ điển

Một bước đột phá rất lớn trong machine learning và trong nghiên cứu, giảng dạy ngôn ngữ. Cứ đà này, ta sẽ có một ngôn ngữ trí tuệ nhân tạo hoàn toàn khác và hoàn toàn mới, cứ nhìn ví dụ của Facebook này mà xem. Vừa mới đây thôi, hai công trình nghiên cứu nêu lên cách thức một mạng máy tính neural network có thể dịch được ngôn ngữ mà không cần từ điển, một bước tiến cực kì quan trọng trong việc nghiên cứu và dạy ngôn ngữ.

Dữ liệu và bảo mật: Mối quan hệ ngày càng lộ rõ nhiều bất ổn

Giới khoa học mạo hiểm gửi thêm thông điệp cho người ngoài hành tinh

Cứ đà này, ta sẽ có một ngôn ngữ trí tuệ nhân tạo hoàn toàn khác và hoàn toàn mới.
Cứ đà này, ta sẽ có một ngôn ngữ trí tuệ nhân tạo hoàn toàn khác và hoàn toàn mới.

"Hãy cứ tưởng tượng bạn cho một người một đống sách tiếng Trung và một đống sách tiếng Ả rập – không có nội dung nào trùng nhau cả - và người đó phải học cách dịch tiếng Trung sang tiếng Ả rập. Có vẻ như là bất khả thi phải không?", tác giả của một trong hai nghiên cứu trên, một nhà khoa học máy tính tại Đại học vùng Basque, Tây Ban Nha, Mikel Artetxe nói. "Nhưng chúng tôi đã cho thấy rằng một cỗ máy có thể làm được như thế".

Từ trước đến giờ, việc "dạy" cho máy tính sẽ bao gồm quy trình máy tính đoán câu trả lời – nhận được câu trả lời đúng – điều chỉnh lại quá trình phân tích để lần sau tạo ra câu trả lời cho đúng; cách thức này là "được giám sát".

Tư duy đúng tạo nên khoảng cách giữa người có mức lương năm là 1 tỷ đồng và 100 triệu đồng: 5 lối tư duy giúp bạn “đánh đâu thắng đó”
Cách tiêu tiền của tỷ phú Warren Buffett
Các nước đang dùng ứng dụng gì để chống lại Covid-19?

Hai nghiên cứu mới này tập trung vào phương thức hoàn toàn khác: cho machine learning chạy mà không cần giám sát, để nó tự học đúng nghĩa. Hai hệ thống tự tạo ra một cuốn từ điển song ngữ của riêng mình mà không có AI sửa sai cho chúng. Điều này khả thi bởi lẽ ngôn ngữ thường có những điểm chung giữa các nhóm từ cũng như cách kết hợp từ.

Hai hệ thống tự tạo ra một cuốn từ điển song ngữ của riêng mình mà không có ai sửa sai cho chúng.
Hai hệ thống tự tạo ra một cuốn từ điển song ngữ của riêng mình mà không có ai sửa sai cho chúng.

Ví dụ như "bàn" "ghế" thường được đi đôi với nhau. Vậy nên máy tính tạo ra một bản đồ từ điểm lớn, những từ là những thành phố lớn, được nối với những từ liên quan bởi những con đường quốc lộ. Dần dần, nó sẽ tìm ra cách tốt nhất để vẽ nên một con đường hiệu quả đi giữa các thành phố. Thế đó, nó đã có một cuốn từ điển song ngữ.

Đến tận hôm nay tôi mới hiểu, tại sao bạn mình làm sếp còn tôi thì cứ mãi ở vị trí nhân viên
Người tính toán để 14 lần trúng xổ số độc đắc
Tại sao Tần Thủy Hoàng là vị vua duy nhất mặc áo long bào đen?

Trong hai nghiên cứu này, các nhà khoa học đều dùng những phương pháp tương tự nhau và đều có thể dịch ngôn ngữ theo từng câu một. Họ đều sử dụng hai chiến lược huấn luyện trí tuệ nhân tạo có tên dịch ngược – back translation và giảm nhiễu – denoising.

Giờ đây, máy tính có thể dịch ngôn ngữ mà không cần đến sự giúp đỡ của con người.
Giờ đây, máy tính có thể dịch ngôn ngữ mà không cần đến sự giúp đỡ của con người

Trong phương thức back translation, một câu trong ngôn ngữ A sẽ được dịch thô sang ngôn ngữ B, rồi từ B lại dịch ngược về A. Nếu như câu được dịch ngược lại không đúng với nguyên bản, AI sẽ dần sửa lại cho đúng.

Hé lộ sự thật về nơi chôn cất Tư Mã Ý: Không thể che giấu dù tìm đủ mọi kế tung hỏa mù
Lí giải tại sao chữ "x" được dùng để ký hiệu ẩn số trong toán học
Phát hiện đột phá tại 'địa ngục' sâu 3.000 km của Trái Đất: Thứ quyết định sự tồn vong chính là đây!

Denoising cũng na ná với back translation, nhưng thay vì dịch đi dịch lại giữa hai ngôn ngữ A và B, AI sẽ thêm các yếu tố khác vào trong câu (sắp xếp lại vị trí từ, loại bỏ bớt từ đi) và cố gắng dịch ngược câu ấy về nguyên bản.

Sử dụng hai phương thức dịch này, AI sẽ hiểu được sâu hơn về cấu trúc của ngôn ngữ.

"Thật là đáng ngạc nhiên khi máy tính có thể dịch ngôn ngữ mà không cần đến sự giúp đỡ của con người", Di He, nhà khoa học máy tính tại Microsoft đã có nghiên cứu truyền cảm hứng cho cả hai nghiên cứu trên, nói.

Hai nghiên cứu trên, một từ Mikel Artetxe và một từ nhà khoa học máy tính tại Facebook Guillaume Lample và các cộng sự đều đã được đăng tải trên Science. Cả hai đội ngũ đều vui mừng bày tỏ rằng họ có thể cải thiện AI của mình bằng việc áp dụng những yếu tố mới từ đội ngũ còn lại.

Tuy nhiên, hai nghiên cứu này vẫn chưa được kiểm tra và phân tích kĩ càng

Làm Mới
Bài viết cùng chuyên mục