Ngược dòng lịch sử lý thú của Dịch máy qua từng thời kỳ

Có lẽ Google Dịch chính là loại hình Dịch máy mà chúng ta quen thuộc nhất. Nhưng bạn biết không, thực chất Dịch máy đã tồn tại gần 70 năm rồi đấy! Trên thực tế, Dịch máy đã có từ khi những chiếc máy tính đầu tiên xuất hiện. Và thấm thoát thoi đưa, Dịch máy đã trải qua một chặng đường dài trong suốt 70 năm và trở thành một tài sản quý giá cho các công ty dịch thuật và khách hàng của họ. Hãy cùng tìm hiểu lịch sử của Google Dịch trong bài viết dưới đây nhé.

Nội dung bài viết

Những năm 1950-1980: Dịch máy theo Quy tắc (RBMT)

Các nhà toán học như Alan Turing, J.V. Atanasoff và Clifford Berry đã chế tạo ra những cỗ máy mở đường cho máy tính trong những năm 1930 và 1940. Mãi cho đến những năm 1950 và việc phát minh ra bóng bán dẫn thì máy tính thực sự mới ra đời. Một năm sau khi ngôn ngữ lập trình đầu tiên COBOL được phát minh, bản Dịch máy đầu tiên đã xuất hiện.

Năm 1954, một dự án hợp tác giữa IBM và Đại học Georgetown đã tạo ra một máy tính IBM 701 tự động dịch được 60 câu từ tiếng Nga sang tiếng Anh. Thí nghiệm này đã chứng minh rằng chúng ta có thể Dịch máy được. Tuy nhiên, Dịch máy cũng có những hạn chế. Trước hết, thử nghiệm này cần đầu tư nghiên cứu rất nhiều và chỉ dịch được những câu rõ ý. Công việc lập trình máy tính cũng rất tốn kém và tốn thời gian đến nỗi cuối những năm 1950, nhiều công ty và chính phủ thế giới đã quyết định ngưng tài trợ cho Dịch máy.

Những thử nghiệm đầu tiên về Dịch máy này đã sử dụng phương pháp Dịch máy dựa trên Quy tắc (RBMT). RBMT đã sử dụng một loạt các quy tắc ngôn ngữ lập trình sẵn để dịch. Tuy nhiên, Dịch máy mà chỉ dựa trên quy tắc không thực sự mang lại hiệu quả. Có một số lý do cho điều này. Đầu tiên, bạn cần dạy cho máy tính đầy đủ từ vựng của từng ngôn ngữ. Điều này mất rất nhiều thời gian! Thứ hai, bạn cần dạy nhiều loại ngữ pháp. Và thứ ba, cách tiếp cận “hời hợt” của RBMT đồng nghĩa với việc thành phẩm là bản dịch kém chất lượng.

Những năm 1980: Dịch máy theo Mẫu (EBMT)

Vào những năm 1980, các nhà nghiên cứu Nhật Bản đã tiên phong trong giai đoạn tiếp theo của Dịch máy. Dịch máy theo Mẫu (EBMT) sử dụng các cụm từ đã dịch trước đó và thay đổi chúng một chút tuỳ theo từng tình huống khác nhau. Ví dụ, giả sử bạn cần dịch câu “Tôi đã đến rạp chiếu phim”. Trong RBMT, bạn sẽ cần dịch từng từ một. Trong EBMT, bạn có thể sử dụng một câu tương tự, “Tôi đã đến công viên” và chỉ cần thay đổi “công viên” thành “rạp chiếu phim”. Điều này giúp ta dịch nhanh hơn.

Dịch máy theo Mẫu là một bước đột phá lớn. Từ ví dụ trên ta thấy rằng máy tính có thể học các mẫu có sẵn. Giờ đây, bạn không cần phải mất nhiều thời gian để lập trình các quy tắc ngữ pháp và từ vựng.

Những năm 1990-2015: Dịch máy Thống kê (SMT)

Năm 1990, IBM thực hiện Dịch máy Thống kê (SMT) đầu tiên. Dịch máy Thống kê đã sử dụng các văn bản cùng ý nghĩa trong các ngôn ngữ khác nhau để tạo ra các mô hình thống kê. Các nhà nghiên cứu đưa ra giả thuyết rằng nếu họ xem văn bản đủ kỹ, họ có thể tìm thấy kết cấu bản dịch. Sau đó, họ có thể lập trình các mẫu này và máy sẽ dịch nhanh hơn và tự nhiên hơn. SMT quả là một bước đột phá lớn.

Việc tạo ra bản Dịch máy Thống kê cũng theo Internet phát triển qua thời gian. Các công ty như Systran và Altavista Babelfish bắt đầu cung cấp dịch vụ Dịch máy miễn phí trực tuyến. Trong 15 năm, các công ty nhỏ đã cung cấp SMT như một dịch vụ giá trị gia tăng cho khách hàng. Tuy nhiên, vào năm 2006, Google đã ra mắt Google Dịch. Google Dịch là một thành công lớn. Google Dịch bắt đầu bằng việc sử dụng Dịch máy thống kê. Hầu hết mọi người đều biết bản dịch không tốt lắm, nhưng phải công nhận rằng Google Dịch rất tiện lợi. Đến năm 2012, Google Dịch cho biết họ đã dịch văn bản với độ dài tầm 1 triệu cuốn sách mỗi ngày.

Từ năm 2015 trở đi: Dịch máy bằng nơ-ron (NMT)

Sau đó, vào năm 2015, Dịch máy đã thay đổi vĩnh viễn. Vào năm 2015, Google bắt đầu sử dụng tính năng Dịch máy bằng nơ-ron cho Google Dịch. Dịch máy bằng nơ-ron (NMT) sử dụng các thuật toán nâng cao được gọi là mạng nơ-ron bên cạnh trí tuệ nhân tạo. Phần mềm Dịch máy nơ-ron có thể nhanh chóng và dễ dàng tạo ra các bản dịch cho các phần lớn văn bản mà vẫn đảm bảo tính chính xác cực cao. NMT sử dụng phương pháp “học sâu”. Sử dụng mô phỏng dựa trên cách bộ não vận hành, các nhà khoa học có thể dạy máy móc dịch giống hơn với cách dịch của con người. Điều này có nghĩa là các bản dịch NMT trôi chảy hơn và dễ đọc hơn. Dịch máy bằng nơ-ron cũng có thể học hỏi từ những sai lầm. Đây là một trong những cái hay của NMT. Bằng cách sửa lỗi NMT mắc phải, máy tính sẽ học cách dịch chính xác nội dung nào đó vào lần sau.

Mặc dù Dịch máy bằng nơ-ron có thể khá tốt, nhưng không phải lúc nào cũng chính xác. Con người vẫn giỏi hơn trong việc đánh giá phong cách và ngữ cảnh khi dịch. Làn sóng Dịch máy tiếp theo có thể sẽ sử dụng trí thông minh nhân tạo (AI) bổ sung để dịch. Các nhà nghiên cứu trên khắp thế giới đang đào tạo AI để tạo ra các giải pháp NMT tốt hơn. Điều này có nghĩa là phiên dịch viên vẫn đóng vai trò cực kỳ quan trọng trong công việc chuyển ngữ này và Dịch máy vẫn phải rất lâu sau này mới có thể theo kịp con người.

Dẫu Dịch máy có phát triển đến cỡ nào cũng không thể nào vượt qua con người – thực thể kì diệu với trí thông minh tuyệt vời và một tâm hồn dạt dào cảm xúc. Thế giới đang không ngừng phát triển và đổi mới, chúng ta cũng phải không ngừng học tập, trau dồi kiến thức và rèn luyện kĩ năng để tạo ra giá trị và cống hiến hết mình cho xã hội ngày một tốt đẹp. Hãy tham gia các lớp học của JFL để cải thiện kĩ năng dịch thuật của bản thân ở nhiều lĩnh vực nhé ! (horizonedu.vn)

Lược dịch từ Acutrans bởi Minh Thư

Kiến thức, Tin Tức

Ngược dòng lịch sử lý thú của Dịch máy qua từng thời kỳ

Những năm 1950-1980: Dịch máy theo Quy tắc (RBMT)

Những năm 1980: Dịch máy theo Mẫu (EBMT)

Những năm 1990-2015: Dịch máy Thống kê (SMT)

Từ năm 2015 trở đi: Dịch máy bằng nơ-ron (NMT)

Horizon Education

MAP