Quốc tế hóa, bản địa hóa, mã hóa, tiếng Iceland và bản dịch trang web ảnh mèo tiếng Nhật

bản dịch quốc tế hóa

quốc tế hóaCó rất nhiều thông tin về quốc tế hóa, bản địa hóa và mã hóa trong các ứng dụng web. Cũng có rất nhiều hiểu lầm về những gì mỗi cái cung cấp cho một ứng dụng web. Đây là món ăn của tôi…

Khi một trình duyệt web tạo kết nối với một máy chủ web, nó sẽ chuyển một số biến và đưa ra các yêu cầu bổ sung, đây là một ví dụ:

GET / HTTP / 1.1
Máy chủ: www.dknewmedia.com
Tác nhân người dùng: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Chấp nhận: HTTP Chấp nhận = văn bản / xml, ứng dụng / xml, ứng dụng / xhtml + xml, văn bản / html; q = 0.9, văn bản / trơn; q = 0.8, hình ảnh / png, * / *; q = 0.5
Chấp nhận-Ngôn ngữ: en-us, en; q = 0.5
Chấp nhận mã hóa: gzip, deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

quốc tế hóa

Quốc tế hóa là sự kết hợp của nhiều thứ:

  1. Bản địa hóa: Khả năng xác định ngôn ngữ và vị trí mà khách truy cập đến. Điều này được thực hiện thông qua Yêu cầu HTTP trong đó khách truy cập được xác định theo ngôn ngữ. Trong trường hợp của tôi, đó là en-US. “En” là tiếng Anh và “US” là Hoa Kỳ. Đây là cài đặt trong Hệ điều hành của tôi.
  2. Múi giờ: Khả năng điều chỉnh cho các múi giờ. Điều này thường được thực hiện bằng cách đặt máy chủ của bạn thành Giờ trung bình Greenwich (GMT) và sau đó cho phép người dùng đặt độ lệch cục bộ của họ từ GMT.
  3. Mã hóa ký tự: Đây là khả năng hiển thị các bộ ký tự ngôn ngữ đúng cách. Nó khác với bản địa hóa vì bản địa hóa có thể cho tôi biết ngôn ngữ và khu vực của máy tính đang thực hiện yêu cầu từ đó, nhưng nó sẽ không cho tôi biết ngôn ngữ đọc đang yêu cầu… đó là vào người đọc!

Lưu ý trong Tiêu đề HTTP của tôi khi trình duyệt đưa ra yêu cầu, nó nói với máy chủ rằng nó đang yêu cầu ngôn ngữ của tôi (Accept-Language: en-us); tuy nhiên, nó cũng cần cho máy chủ biết Bộ ký tự nào được yêu cầu (Bộ ký tự chấp nhận: Bộ ký tự chấp nhận: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 và utf -8 là cả hai bộ ký tự cho phép.

Nội địa hóa

Trong thế giới hỗn hợp tuyệt vời này, bản địa hóa không bao giờ quyết định ngôn ngữ nữa. Mặc dù tôi đang ở Hoa Kỳ, tôi hoàn toàn có thể đọc một ngôn ngữ khác bằng cách sử dụng một bộ ký tự khác… đó là những gì sẽ xảy ra khi tôi sử dụng Google Hindi (Tôi không thực sự sử dụng Google Hindi). Yêu cầu của tôi về ngôn ngữ và bộ ký tự giống như khi tôi yêu cầu Google tiếng Anh trang, nhưng tôi thực sự được đưa vào một trang mà tôi không thể đọc vì tôi không có bộ ký tự. Tất cả đều xuất hiện ???????????… Tuy nhiên, tôi có thể tải bộ ký tự đó vào Firefox (Firefox> Preferences> Advanced> Languages):

Ngôn ngữ tải của Firefox

Nếu tôi tải ngôn ngữ đó, thì tôi có thể yêu cầu trang ở bộ ký tự gốc của nó và hiển thị nó trên máy tính của tôi mặc dù ngôn ngữ mặc định của tôi là en-US!

Vì vậy… nếu tôi là sinh viên tiếng Hindi, đang học tiếng Anh tại Purdue và được kết nối qua VPN đến máy chủ của trường, đi nghỉ ở Úc… có 3 cài đặt khác nhau cần được áp dụng để ứng dụng thực sự được Quốc tế hóa - và không ai phụ thuộc vào cái khác.

Ngôn ngữ của tôi sẽ hiển thị là en-US, nhưng múi giờ của tôi là Úc, nhưng ngôn ngữ tôi yêu cầu từ trang web có thể là tiếng Hindi. Nếu tôi lập trình ứng dụng của mình để thực hiện giả định dựa trên ngôn ngữ máy tính của tôi, tôi sẽ hoàn toàn sai - cho người đó biết tiếng Anh ở múi giờ phương Đông. Tốt nhất, tôi sẽ lập trình ứng dụng của mình để cung cấp cả hai cài đặt ngôn ngữ và múi giờ… nhưng tôi sẽ không giả định chúng dựa trên ngôn ngữ.

Iceland - ví dụ cuối cùng

Chúng tôi không biết gì về những thách thức đa ngôn ngữ và đa ngôn ngữ ở Hoa Kỳ, nơi chúng tôi tất cả các nói tiếng Anh [ngụ ý mỉa mai]. Ở một số quốc gia, chẳng hạn như Iceland, mặc dù ngôn ngữ mẹ đẻ là tiếng Iceland, nhưng những người Iceland đáng kinh ngạc lớn lên học 3 ngôn ngữ! Vì Iceland là một quốc gia ở giữa Châu Âu và Bắc Mỹ, các công ty của họ hoạt động trên nhiều lục địa, ngôn ngữ, phương ngữ của các ngôn ngữ và nhiều múi giờ từ máy tính để bàn của họ!

Nhiều trang web tiếng Iceland được xây dựng bằng tiếng Anh Mỹ, tiếng Anh Anh, tiếng Iceland, tiếng Tây Ban Nha, tiếng Tây Ban Nha, tiếng Pháp và tiếng Đức! Hãy tưởng tượng việc xây dựng sẽ khó khăn như thế nào Icelandair's ứng dụng trang web và hệ thống bán vé… wow!

KHUYẾN CÁO: Tôi rất vui khi được làm việc với những người tốt từ Icelandair và có thể nói với bạn rằng họ là một trong những chuyên gia tài năng và thân thiện nhất mà tôi rất vui khi được làm việc cùng. Đó chỉ đơn giản là một đất nước và con người tuyệt vời! Đi thăm ... đi Icelandair và chắc chắn ghé thăm Blue Lagoon!

Ngôn ngữ so với Mã hóa

Thậm chí có những bảng mã ký tự khác nhau trong một ngôn ngữ duy nhất không hoạt động tốt với nhau! Ví dụ: Một email tiếng Nhật được viết bằng Shift-JIS có thể hiển thị không thể đọc được trên máy tính của một người Nhật với bản địa hóa được đặt thành ja-JP vì máy chủ thư của họ chỉ nhận dạng EUC-JP. Lý tưởng nhất là khách hàng có thể đặt mã hóa mà họ muốn cũng như ngôn ngữ nào - chỉ cần đảm bảo rằng mã hóa và ngôn ngữ tương thích với những gì khách hàng đang yêu cầu.

Nếu tôi muốn đọc tiếng Nhật, tôi có thể phải chọn cả tiếng Nhật làm ngôn ngữ của mình VÀ Shift-JIS để mã hóa để hiển thị đúng ngôn ngữ đó. Đây là một số nhầm lẫn khác để thêm vào hỗn hợp ... một số loại mã hóa hỗ trợ một số ngôn ngữ. UNICODE / UTF8 hỗ trợ hàng chục. Điều ngược lại cũng đúng. Một số ngôn ngữ có thể được đọc bằng nhiều kiểu mã hóa. Nếu điều đó không hợp lý… Tôi xin lỗi, đó là một vấn đề rất phức tạp.

Một ngày nào đó tôi tin (hy vọng) điều này sẽ thay đổi. Tôi nghĩ rằng các nhà thiết kế ban đầu của mã bản địa hóa hy vọng rằng sự kết hợp ngôn ngữ-quốc gia sẽ là tất cả những gì cần thiết… nhưng chúng tôi đã trở nên phức tạp hơn nhiều. Hãy nhớ rằng, phần lớn điều này đã được phát triển trước khi có Internet. Với sự ra đời của GIS, có lẽ một người có thể chọn mã hóa của họ và GIS sẽ xử lý thông tin về múi giờ và ngôn ngữ.

quốc tế hóa

Quay lại hỗ trợ Quốc tế hóa. Nếu bạn muốn cung cấp một ứng dụng Quốc tế hóa, bạn cần phải:

  1. Hỗ trợ nhiều kiểu mã hóa, ngôn ngữ và có các tệp dịch để hiển thị các bản dịch đó.
  2. Cho phép khách hàng đặt ngôn ngữ của họ và thậm chí có thể là kiểu mã hóa của họ, nếu cần.
  3. Hỗ trợ múi giờ bằng cách cho phép người dùng tham chiếu múi giờ của họ so với GMT.
  4. Sử dụng mã bản địa hóa một cách thận trọng… chúng KHÔNG mô tả chính xác những gì người dùng của bạn thực sự đang yêu cầu cũng như những gì họ có thể đọc.

Dịch

Dịch máy vẫn còn sơ khai. Có một số trang web ngoài đó (và WordPress bổ sung) cung cấp bản dịch máy của trang web của bạn. Đừng bị cám dỗ để làm điều này… có hai lý do tại sao:

  1. Nếu dịch máy hoạt động, người dùng đang kiểm tra trang web của bạn sẽ có một người dịch để làm việc cùng.
  2. Dịch máy thật tệ.

Không tin tôi? Đây là bản dịch tiếng Nhật cho bạn:
Dán từ Tệp Masatsu - một chàng trai với rất nhiều hình ảnh về mèo:

Mục nhập blog tiếng Nhật

??
- 00:29:35 bởi masatsu

????????????????????????????
??????????????????????????

?????????? (?)?

????????????????????????????????????????
??????????????????????????????

???????????????????????????????????? (?)

Trích xuất

??????????????
??
??

???????????????????????????????????????

???????????????????????????????

????????????????????????????
??????????????????????????????????
?????????? Ag ??????????????

?????????????????????????????????????

Dịch máy:

?? Hann ?????
-00: 29: 35 bởi masatsu

Tên của vị thánh nắm đấm của một / con voi đã xuất hiện trong ngày hôm qua “a / hạm đội nắm tay quái thú ?? nhân viên kiểm lâm" "?? Hann ???? ” với a / diễn viên đài Yutaka Mizushima….

? (?) đó là mực nang.

Vì ngay cả diễn viên đài các của thánh nắm tay hả cậu chủ ????? of a / the cat are the Chinese quince of a Nagai Ichiro = dragon ball the staff of a / the ?? Kiểm lâm trông giống như những người biết nhận xét dí dỏm.

?????? (Những giọt mồ hôi) mà tôi đã hoàn toàn quên mất trong năm nay "bí mật về tên của siêu hạm đội", thông lệ hàng năm ?,

?????? Nếu tôi viết muộn hơn trong năm nay,

??????? điện thờ ??? (có thể làm thế nào?)? Mũi đất cullion (?? cắt không) Fukami ?? (? hoặc có thể quan sát?) an / the is it that that does

?????? Với, nó trở thành “a can /? /?”, Hay nói cách khác là “kung fu”, khi xếp hàng và thay đổi đầu của a / tên.

?????? Mặc dù nó được cho là để tăng thêm hai được cho là nó có thể trở thành loại tên.

Sự thật được cho là “tuổi” vì ký hiệu nguyên tố bạc là Ag ?, mặc dù tên của “the ???? bạc ”Takaoka? kỹ thuật viên của ??????? đang nghĩ rằng ký tự được gọi là "?" đã được sử dụng với liên kết của một bộ phim màn bạc?, nếu nó gọi nó với một thành viên bổ sung.

?????? Tuy nhiên, tôi đang nghĩ một cách ích kỷ, rằng lý thuyết của tôi không phải là không liên quan mà "?" được bao gồm trong a / ký tự Trung Quốc.

Tôi chắc chắn rằng việc đảo ngược cực trong bản dịch này sẽ cung cấp một hướng có thể đọc được trong tiếng Anh. Bạn đã hiểu mục nhập, phải không?

2 Comments

  1. 1

    ý bạn là Purdue?
    Chắc chắn rồi - một diễn viên phát thanh đầy mồ hôi đang tự hỏi cách chính xác để nói những điều nhất định….

Bạn nghĩ gì?

Trang web này sử dụng Akismet để giảm spam. Tìm hiểu cách xử lý dữ liệu nhận xét của bạn.