UX Writing: viết để cải thiện chất lượng dịch máy

UX WRITINGUX

Nguyễn Mai Xuân

Các sản phẩm phần mềm đa ngôn ngữ ngày càng phổ biến. Để tiết kiệm chi phí, nhiều công ty sử dụng công cụ dịch máy để dịch thuật thay vì thuê các nhà ngôn ngữ học. Tuy nhiên, dịch máy có thể khiến các câu trở nên khó hiểu, thiếu "con người" hoặc thậm chí ngớ ngẩn. Người dùng vừa đọc đã có thể thốt lên là "dịch máy à".

Dưới đây tôi sẽ hướng dẫn bạn các phương pháp cải thiến điều này.

I. Thay đổi cách viết

Những chi tiết sau đây mô tả cách viết cho tiếng Anh. Tuy nhiên bạn có thể áp dụng cho tiếng Việt.

I.1. Tránh viết sai chính tả

Công cụ dịch máy không thể dịch chính xác câu chứa từ sai chính tả. Hãy sử dụng thêm các công cụ hỗ trợ giúp bạn kiểm tra chính tả. Ví dụ Microsoft Word. Đảm bảo rằng bạn đã chỉnh sửa chính tả trước khi đưa văn bản vào công cụ dịch thuật.

I.2 Câu ngắn gọn và súc tích
  • Tránh sử dụng liên từ

  • Tránh dùng nhiều hơn một mệnh đề trong câu

  • Câu ngắn hơn 25 từ

  • Đảm bảo câu hoàn chỉnh về ngữ pháp

  • Bắt đầu câu bằng chữ in hoa

  • Có dấu chấm cuối câu

  • Phải có mệnh đề chính.

I.3 Sử dụng ngữ pháp đơn giản, đúng cấu trúc
I.4. Sử dụng câu chủ động

Thể chủ động là phong cách viết trực tiếp loại bỏ các từ mơ hồ và câu mơ hồ.

I.5 Viết các cụm từ mà bạn có thể sử dụng lại

Viết một cụm từ mà bạn có thể sử dụng lại trong toàn bộ tài liệu của mình. Công cụ dịch máy có thể nhận dạng và dịch chính xác các cụm từ lặp đi lặp lại.

I6. Loại bỏ những từ không cần thiết

Loại bỏ những từ không góp phần tạo nên nghĩa của câu.

I.7. Tránh những từ sáo rỗng/cụm từ thông tục

Công cụ Dịch máy có thể không truyền đạt đúng nghĩa của những từ sáo rỗng/cụm từ thông tục và ý nghĩa đó có thể không có ý nghĩa đối với người dùng quốc tế.

I.8. Sử dụng mạo từ xác định

Chỉ định danh từ bằng cách sử dụng “the”.

I.9. Lặp lại danh từ thay vì đại từ

Hạn chế sử dụng đại từ. Các máy dịch có thể tạo ra một đại từ có giới tính sai trong ngôn ngữ đích, làm cho nó không rõ nghĩa hoặc sai mục đích.

I.10 Sử dụng thuật ngữ nhất quán
  • Sử dụng thuật ngữ một cách nhất quán trong suốt văn bản.

  • Sử dụng từ đồng nghĩa có thể gây nhầm lẫn cho máy và dẫn đến các bản dịch khác nhau của

cùng một từ, có thể sai hoặc quá chung chung.

I.11. Chấm câu đúng cách

Các công cụ dịch máy dựa vào dấu chấm câu để có được manh mối về ý nghĩa, vì vậy sử dụng chấm câu đúng hết sức quan trọng.

I.12. Tránh ngắt dòng

Hãy cẩn thận với định dạng và cấu trúc văn bản. Không sử dụng xuống dòng (ví dụ \n) vì máy dịch sẽ coi xuống dòng là phần nội dung riêng biệt. Vì vậy, các yếu tố đi cùng nhau như một đơn vị ý nghĩa thì không được xuống dòng.

I.13 Tránh viết hoa cả câu

Máy dịch có thể xử lý kém chính xác khi gặp các câu viết hoa và có thể tạo ra kết quả kỳ lạ.

I.14 Trình bày văn bản
  • Sử dụng tiêu đề tự động trong MS Word (điều này cũng đảm bảo nó sẽ được dịch theo cách tương tự như mục lục).

  • Sử dụng dấu ngoặc kép một cách nhất quán.

  • Sử dụng các dấu đầu dòng được tạo tự động thay vì tạo chúng theo cách thủ công.

  • Sử dụng các từ đầy đủ thay vì các dấu hiệu hoặc biểu tượng đặc biệt. Máy dịch có thể không hiểu các dấu hiệu hoặc ký hiệu không được sử dụng trong ngôn ngữ đích. Ví dụ: viết liên từ 'và' thay vì '&'.

II. Huấn luyện công cụ dịch máy

Hiện tại trên thị trường có khá nhiều công cụ quản lý dịch thuật, kết hợp dịch máy. Ví dụ Lokalise, Phrase là công cụ TMS có tích hợp vào Figma. Bạn có thể quản lý ngôn ngữ trong thiết kế trên Figma, đưa lên công cụ TMS để dịch tự động hoặc tự dịch, sau đó đồng bộ lại Figma và đồng bộ vào hệ thống code của nhóm lập trình. Tôi sẽ viết bài giới thiệu về Lokalise ở một blog khác.

Vậy, làm cách nào để cải thiện công cụ dịch máy của bạn? Bạn có thể áp dụng phần mềm dịch TMS kết hợp Bộ nhớ dịch, Học máy độngQuản lý thuật ngữ. Làm điều này sẽ giúp bản dịch máy của bạt đến gần với chất lượng dịch như người dịch nhất có thể.

Hãy bắt đầu bằng việc gì dễ làm trước như sau đây.

II.1 Quản lý thuật ngữ

Hãy quyết định thuật ngữ của bạn. Sử dụng thuật ngữ một cách nhất quán trong suốt văn bản. Sử dụng từ đồng nghĩa có thể gây nhầm lẫn cho máy và dẫn đến các bản dịch khác nhau của cùng một từ, có thể sai hoặc quá chung chung.

Bảng thuật ngữ được dịch có thể xem như một bộ từ điển chuyên ngành - lĩnh vực tài liệu mà bạn đang cần dịch. Chú ý:

  • Đối với các tên riêng về sản phẩm có thể cần được thống nhất với Marketing và các bên liên quan.

  • Các từ thông dụng nên được kiểm thử ở thị trường của ngôn ngữ đó (User Testing).

  • Hạn chế dùng từ viết tắt.

  • Chú ý vấn đề từ số ít, số nhiều. Chi tiết sẽ được trình bày ở bài giới thiệu về công cụ quản lý dịch thuật Lokalise.

II.2 Xây dựng bộ nhớ dịch

Bạn có thể lấy tất cả các tài liệu chứa ngôn ngữ gốc và bản dịch của mình và đưa vào Bộ nhớ Dịch. Điều này sẽ cải thiện đáng kể chất lượng bản dịch nhưng tốn nhiều thời gian tìm và sắp xếp các tệp.

Hãy tìm các công cụ quản lý dịch thuật, ví dụ Lokalise để giúp bạn làm điều này.

II.3 Chỉnh sửa sau dịch máy

Sau khi có kết quả dịch máy, bạn có thể review và chỉnh sửa lại. Điều này giúp máy dịch có thể học từ bạn và cải tiến về sau.

III. Tham khảo:

Tham khảo

The Elements of Style

The Elements of Style là một cuốn sách nổi tiếng về văn phong và ngữ pháp tiếng Anh. Cuốn sách này được viết bởi William Strunk Jr. và E.B. White và đã trở thành một nguồn tài liệu quý giá cho những ai quan tâm đến viết lách và biểu đạt ý tưởng một cách rõ ràng và chính xác.

Sách giới thiệu các quy tắc về ngữ pháp, cấu trúc câu, lựa chọn từ ngữ và phong cách viết. Nó cung cấp những lời khuyên thực tiễn và minh họa bằng ví dụ để giúp người đọc hiểu rõ hơn và áp dụng vào viết của mình. The Elements of Style đã trở thành một trong những cuốn sách quan trọng nhất và được sử dụng phổ biến trong giảng dạy văn phong và ngữ pháp tiếng Anh.

Link: https://www.amazon.com/Elements-Style-4th-William-Strunk/dp/B0BYRNBRZ3/