Các ứng dụng Unicode trong web site tiếng Việt
Unicode là một cách dùng chữ Việt theo tiêu chuẩn quốc tế cho tin học. Đặc điểm chính của nó là người ta dùng 2 bytes (16 bits) cho mỗi mẫu tự như ô, ơ, ă.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 1
MӨC LӨC
Unicode cho chӳ ViӋt ......................................................................................................... 2
Bҧng ÿӕi chiӃu encoding các bӝ chӳ hiӋn hành vӟi Unicode ............................................. 4
Thӱ nghiӋm font Unicode chӭa glyphs chӳ ViӋt................................................................ 8
Chѭѫng trình hoán chuyӇn trang web ViӋt ngӳ thành tiêu chuҭn Unicode........................ 9
Dùng Frontpage 98/ 2000 viӃt webpage Unicode ViӋt ngӳ ............................................. 10
Cách Dùng Unicode ĈӇ Gõ TiӃng ViӋt Trong MS-WORD ............................................. 16
Cách chӑn Settings trong OutLook Express (IE 5) ÿӇ ÿӑc chӳ ViӋt
gӱi bҵng VoviMail hay NCR 18
Cách chӑn Settings trong OutLook 2000 ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR 22
Cách ÿánh chӳ ViӋt trong Hotmail ................................................................................... 26
Cách ÿánh chӳ ViӋt trong Yahoo! Mail............................................................................ 28
Các ӭng dөng Unicode trong web site tiӃng ViӋt 2
Unicode cho chӳ ViӋt
Unicode là mӝt cách dùng chӳ ViӋt theo tiêu chuҭn quӕc tӃ cho tin hӑc. Ðһc
ÿiӇm chính cӫa nó là ngѭӡi ta dùng 2 bytes (16 bits) cho mӛi mүu tӵ nhѭ ô,
ѫ, ă. Cho ÿӃn nay có nhiӅu bӝ chӳ ViӋt Nam nhѭ VISCII, VPS, VNI... vv…
ÿang ÿѭӑc dùng rҩt thӏnh hành trong nhiӅu áp dөng phҫn mӅm khác nhau.
VISCII là mӝt chuҭn cӫa nhóm khoa hӑc gia Tricholor. Trong chuҭn nҫy
mӛi mүu tӵ ÿѭӧc biӇu diӉn bҵng mӝt byte (8 bits). Nhóm Tricholor dùng
các con sӕ trӕng cӫa bӝ chӳ ASCII ( cӫa Mӻ - A là viӃt tҳt cho American,
trong khi VI cho Vietnamese) ÿӇ biӇu diӉn các chӳ ViӋt Nam có dҩu. Vì con
sӕ lӟn nhҩt có thӇ biӇu diӇn bҵng 1 byte là 255, ÿó chính là tәng sӕ mүu tӵ
ViӋt Nam tӕi ÿa ta có thӇ dùng ÿѭӧc bҩt cӭ lúc nào. Rҩt tiӃc chӳ ViӋt Nam
cҫn hѫn 255 mүu tӵ nên ngѭӡi ta phҧi ÿһt thêm bӝ chӳ Hoa (thí dө nhѭ
UHoàiH 1.1) hay thay thӃ các dҩu hiӋu ít dùng, nhѭ dҩu ngoһc kép, bҵng
nhӳng mүu tӵ ViӋt Nam cҫn phҧi có. Tӭc là hӉ muӕn có ÿҫy ÿӫ bӝ chӳ ViӋt
ta phҧi hy sinh vài dҩu hiӋu ít dùng cӫa bӝ chӳ ASCII.
Bӝ chӳ VPS cӫa Hӝi Vietnamese Professionals Society cNJng dùng cùng mӝt
nguyên tҳc nhѭ VISCII. Có ÿiӅu khác là vì VPS ÿѭӧc triӇn khai ӣ Pháp, nên
các khoa hӑc gia muӕn bҳt ÿҫu bҵng mӝt bӝ chӳ dùng cho tiӃng Pháp rӗi mӣ
mang thêm ÿӇ dùng cho chӳ ViӋt. Nói tóm lҥi, hai bӝ chӳ VISCII và VPS
khác nhau chӍ ӣ chӛ quy ѭӟc dùng con sӕ nào ÿӇ biӇu diӉn mӝt mүu tӵ ViӋt
Nam.
Ӣ ViӋt Nam có kiӇu chӳ .vnTimes rҩt thӏnh hành trên các trang Web. Các
khoa hӑc gia thiӃt kӃ kiӇu chӳ nҫy cNJng dùng mӝt nguyên tҳc giӕng nhѭ
trong VISCII và VPS. Nói mӝt cách khác, ta có thӇ dӏch (convert, map) tӯ
kiӇu chӳ nҫy qua kiӇu chӳ kia rҩt dӉ dàng vì có mӕi liên hӋ tӯng mүu tӵ mӝt
(one-to-one correspondence).
KiӇu chӳ VNI hѫi khác mӝt chút vì có nhiӅu chӛ ngѭӡi ta dùng 2 bytes ÿӇ
biӇu diӇn mӝt mүu tӵ. VNI là mӝt trong nhӳng bӝ chӳ ÿҫu tiên ÿѭӧc dùng
cho chӳ ViӋt trong tin hӑc. ÐiӅu ÿáng nói là sӵ thành công vӅ thѭѫng mҥi
cӫa VNI. Mһc dҫu muӕn ÿánh máy vӟi bӝ chӳ VNI ta phҧi trҧ tiӅn, công ty
VNI tích cӵc nhҩt trong viӋc triӇn khai các áp dөng phҫn mӅm cӫa VNI ÿӇ
phөc vө khách hàng. Trong khi ÿó các tә chӭc Tricholor và Vietnamese
Professionals Society là gӗm nhӳng khoa hӑc gia thiӋn nguyӋn, tҩt cҧ ÿӅu có
viӋc làm toàn thӡi gian nên công viӋc triӇn khai phҫn mӅm cho các bӝ chӳ
phҧi bӏ giӟi hҥn.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 3
Còn VietNet chҷng qua chӍ là mӝt quy ѭӟc vӅ cách dùng các mүu tӵ có sҹn
cӫa ASCII ÿӇ ÿánh tiӃng ViӋt. Nhӳng dҩu dùng cho các nguyên âm ÿѭӧc
ÿánh thêm, thí dө nhѭ chӳ "Ðѭa ÿón" ÿѭӧc ÿánh là "DDu+a ddón". Do ÿó,
nói cho ÿúng ra VietNet không phҧi là mӝt bӝ chӳ.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 4
Bҧng ÿӕi chiӃu encoding các bӝ chӳ hiӋn hành vӟi
Unicode
VPS VISCII VNI TCVN Unicode Unicode
VIQR VPS VISCII VNI TCVN UTF-8 Hex
Hex Hex Hex Hex Symbol Hex Dec
61 00E1
a' á E1 á E1 aù ¸ B8 á C3 A1
F9 225
61 00E0
a` à E0 à E0 aø µ B5 à C3 A0
F8 224
61 1EA3
a? ä E4 ä E4 aû ¶ B6 ҧ E1 BA A3
FB 7843
61 00E3
a~ ã E3 ã E3 aõ · B7 ã C3 A3
F5 227
61 1EA1
a. å E5 Õ D5 aï ¹ B9 ҥ E1 BA A1
EF 7841
61 0103
a( æ E6 å E5 aê ¨ A8 ă C4 83
EA 259
61 1EAF
a(' ¡ A1 ¡ A1 aé ¾ BE ҳ E1 BA AF
E9 7855
61 1EB1
a(` ¢ A2 ¢ A2 aè » BB ҵ E1 BA B1
E8 7857
61 1EB3
a(? £ A3 Æ C6 aú ¼ BC ҷ E1 BA B3
FA 7859
61 1EB5
a(~ ¤ A4 Ç C7 aü ½ BD ҹ E1 BA B5
FC 7861
61 1EB7
a(. ¥ A5 £ A3 aë Æ C6 һ E1 BA B7
EB 7863
61 00E2
a^ â E2 â E2 aâ © A9 â C3 A2
E2 226
a^' Ã C3 ¤ A4 aá 61 Ê CA ҩ 1EA5 E1 BA A5
Các ӭng dөng Unicode trong web site tiӃng ViӋt 5
E1 7845
61 1EA7
a^` À C0 ¥ A5 aà Ç C7 ҫ E1 BA A7
E0 7847
61 1EA9
a^? Ä C4 ¦ A6 aå È C8 ҭ E1 BA A9
E5 7849
61 1EAB
a^~ Å C5 ç E7 aã É C9 ү E1 BA AB
E3 7851
61 1EAD
a^. Æ C6 § A7 aä Ë CB ұ E1 BA AD
E4 7853
65 00E9
e' é E9 é E9 eù Ð D0 é C3 A9
F9 233
65 00E8
e` è E8 è E8 eø Ì CC è C3 A8
F8 232
65 1EBB
e? È C8 ë EB eû Î CE ҿ E1 BA BB
FB 7867
65 1EBD
e~ ë EB ¨ A8 eõ Ï CF Ӂ E1 BA BD
F5 7869
65 1EB9
e. Ë CB © A9 eï Ñ D1 ҽ E1 BA B9
EF 7865
65 00EA
e^ ê EA ê EA eâ ª AA ê C3 AA
E2 234
65 1EBF
e^' ‰ 89 ª AA eá Õ D5 Ӄ E1 BA BF
E1 7871
65 1EC1
e^` Š 8A « AB eà Ò D2 Ӆ E1 BB 81
E0 7873
65 1EC3
e^? ‹ 8B ¬ AC eå Ó D3 Ӈ E1 BB 83
E5 7875
65 1EC5
e^~ Í CD AD eã Ô D4 Ӊ E1 BB 85
E3 7877
65 1EC7
e^. Œ 8C ® AE eä Ö D6 Ӌ E1 BB 87
E4 7879
i' í ED í ED í ED Ý DD í 00ED C3 AD
Các ӭng dөng Unicode trong web site tiӃng ViӋt 6
237
00EC
i` ì EC ì EC ì EC × D7 ì C3 AC
236
1EC9
i? Ì CC ï EF æ E6 Ø D8 Ӎ E1 BB 89
7881
0129
i~ ï EF î EE ó F3 Ü DC ƭ C4 A9
297
1ECB
i. Î CE ¸ B8 ò F2 Þ DE ӏ E1 BB 8B
7883
6F 00F3
o' ó F3 ó F3 où ã E3 ó C3 B3
F9 243
6F 00F2
o` ò F2 ò F2 oø ß DF ò C3 B2
F8 242
6F 1ECF
o? Õ D5 ö F6 oû á E1 ӓ E1 BB 8F
FB 7887
6F 00F5
o~ õ F5 õ F5 oõ â E2 õ C3 B5
F5 245
6F 1ECD
o. † 86 ÷ F7 oï ä E4 ӑ E1 BB 8D
EF 7885
6F 00F4
o^ ô F4 ô F4 oâ « AB ô C3 B4
E2 244
6F 1ED1
o^' Ó D3 ¯ AF oá è E8 ӕ E1 BB 91
E1 7889
6F 1ED3
o^` Ò D2 ° B0 oà å E5 ӗ E1 BB 93
E0 7891
6F 1ED5
o^? ° B0 ± B1 oå æ E6 ә E1 BB 95
E5 7893
6F 1ED7
o^~ ‡ 87 ² B2 oã ç E7 ӛ E1 BB 97
E3 7895
6F 1ED9
o^. ¶ B6 µ B5 oä é E9 ӝ E1 BB 99
E4 7897
o+ Ö D6 ½ BD ô F4 ¬ AC ѫ 01A1 C6 A1
Các ӭng dөng Unicode trong web site tiӃng ViӋt 7
417
F4 1EDB
o+' § A7 ¾ BE ôù í ED ӟ E1 BB 9B
F9 7899
F4 1EDD
o+` © A9 ¶ B6 ôø ê EA ӡ E1 BB 9D
F8 7901
F4 1EDF
o+? ª AA · B7 ôû ë EB ӣ E1 BB 9F
FB 7903
F4 1EE1
o+~ « AB Þ DE ôõ ì EC ӥ E1 BB A1
F5 7905
F4 1EE3
o+. ® AE þ FE ôï î EE ӧ E1 BB A3
EF 7907
u'Các ӭng dөng Unicode trong web site tiӃng ViӋt 8
Thӱ nghiӋm font Unicode chӭa glyphs chӳ ViӋt
Font- Tahoma
Font chӳ trong khung này thay
Family: ÿәi theo thӇ Font trong combo
box bên trái Ðây là font chӳ
Font- 5
trong mӝt phҫn cӫa mӝt câu.
Size:
NӃu font chӳ nào không có
Font- glyphs mүu tӵ chӳ ViӋt thì bҥn sӁ
Normal
Weight: không ÿӑc ÿѭѫc chӳ ViӋt mà chӍ
thҩy ô vuông.
Khi bҥn thay ÿәi font trong Bҥn có thӇ dùng phѭѫng tiӋn này
combo box: Font-Family, ÿӇ set Default font ѭa chuӝng
Font-Size hay Font-Weight, cho browser ÿang dùng cӫa bҥn.
văn bҧn trong khung bên phҧi
cNJng sӁ thay ÿәi và dùng theo
font bҥn chӑn. Bҥn sӁ không
ÿӑc ÿѭӧc chӳ ViӋt nӃu font
bҥn chӑn không chӭa mүu tӵ
glyphs Unicode tiӃng ViӋt.
Trang web này giúp bҥn lӵa
ra nhӳng font Unicode trong
máy cӫa bҥn, font nào có thӇ
sӱ dөng ÿӇ trình bày Unicode
chӳ ViӋt và font nào không
thӇ dùng ÿӇ trình bày
Unicode chӳ ViӋt.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 9
Chѭѫng trình hoán chuyӇn trang web ViӋt ngӳ
thành tiêu chuҭn Unicode
NӃu bҥn ÿã có mӝt mҥng ÿiӇm ÿѭӧc viӃt bҵng mӝt trong các mã tiêu chuҭn
ViӋt ngӳ sau ÿây: Viscii, VPS, VNI và .vnTime và bҥn muӕn biӃn toàn bӝ
mҥng ÿiӇm cӫa bҥn thành tiêu chuҭn Unicode thì ÿây ÿúng là chѭѫng trình
bҥn cҫn dùng.
Chѭѫng trình VNtoUnicode có thӇ chuyӇn các trang web ViӋt ngӳ trong mӝt
folder hay directory thành trang web ViӋt ngӳ Unicode. Các mã tiêu chuҭn
ViӋt ngӳ ÿѭӧc hӛ trӧ gӗm Viscii, VPS, VNI và .vnTime nhѭng bҥn có thӇ
nӟi rӝng hӛ trӧ cho các tiêu chuҭn khác bҵng cách thêm chúng vào mã lұp
trình. Chѭѫng trình này ÿѭӧc viӃt bҵng Microsoft Visual Basic 6.0, do tiӃn
sƭ Lê Ðӭc Hӗng thӵc hiӋn và tҩt cҧ các mã lұp trình và bҧng mүu chuyӉn mã
ÿӅu ÿѭӧc gói trong hӗ sѫ vntounicode.zip ÿӇ bҥn download.
Mӛi tiêu chuҭn ÿӅu có mӝt bҧng mã hoán chuyӇn (mapping table) nhѭ
VNItoUnicode.txt, VISCIItoUnicode.txt, VPStoUnicode and
VNTimetoUnicode. Bҥn có thӇ thêm bҧng mã ÿӕi chiӃu khác cho mã tiêu
chuҭn ViӋt ngӳ khác. Chѭѫng trình này chӫ yӃu làm 3 viӋc nhѭ sau:
x ChuyӇn tҩt cҧ các cһp tӵ nhѭ "aù" thành Unicode tѭѫng ӭng.
x ChuyӇn tҩt cҧ tên Font thành "Tahoma".
x ChuyӇn mүu tӵ ViӋt thành mã sӕ Unicode.
Trong hӗ sѫ zip có chӭa các trang web mүu bҵng VPS, VNI, VISCII và
.vnTime vӟi các trang web Unicode mã sӕ và UTF-8 tѭѫng ӭng. Mӝt khi
bҥn ÿã có trang bҵng mã sӕ Unicode, thì bҥn có thӇ tiӃn thêm mӝt bѭӟc
chuyӇn trang Unicode mã sӕ thành trang web UTF-8. Vì chѭѫng trình này
làm viӋc theo tӯng nhóm trang web ÿѭӧc ÿһt trong mӝt folder nên tӕc ÿӝ
hoán chuyӇn sӁ tăng lên rҩt nhiӅu.
Bҥn có thӇ sӱa ÿәi mã lұp trình cӫa chѭѫng trình này ÿӇ sӱ dөng nhӳng Font
khác nhѭ Arial, Courier New, Times New Romans, Verdana... vân vân. Bҥn
cNJng có thӇ sӱa ÿәi mã lұp trình này ÿӇ tӵ ÿӝng hóa chѭѫng trình hoán
chuyӇn theo nhu cҫu cӫa bҥn. NӃu bҥn biӃn cҧi mã lұp trình này, chúng tôi
kǤ vӑng bҥn sӁ thông báo cho chúng tôi biӃt và gӱi cho chúng tôi mӝt bҧn
biӃn cҧi cӫa bҥn ÿӇ nhӳng sӵ thay ÿәi hӳu dөng khác có thӇ ÿѭӧc ÿѭa vào
trong các bҧn chѭѫng trình tѭѫng lai.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 10
Dùng Frontpage 98/ 2000
viӃt webpage Unicode ViӋt ngӳ
NӃu bҥn ÿang dùng Windows 2000 Professional/ Server thì bҥn có thӇ gõ
chӳ ViӋt Unicode (dùng các chѭѫng trình gõ chӳ ViӋt nhѭ VPS, VietKey,
VNI vv...) trong Notepad hay WordPad 2000 ÿӇ viӃt webpage chӳ ViӋt trӵc
tiӃp bҵng HTML.
Nhѭng nӃu bҥn ÿang dùng Windows 95.x hay Windows 98.x thì Fronpage là
công cө không thӇ thiӃu ÿѭӧc ÿӇ giúp bҥn viӃt webpage Unicode ViӋt ngӳ
mӝt cách dӉ dàng tiӋn lӧi. HiӋn nay (tháng Tѭ 2001) trên thӏ trѭӡng Web
Editors thì Frontpage 98/ 2000 là mӝt trong vài wysiwyg editors hӛ trӧ
Unicode.
Các web editors khác nhѭ Cold Fusion 4.x, Dreamweaver 4, Dreamweaver
UltraDev 4, NetOject Fusion 5 vân vân ÿӅu không hӛ trӧ Unicode. Dƭ nhiên
chúng ta vүn có thӇ dùng nhӳng web editors trên ÿӇ viӃt webpage ViӋt Ngӳ
nhѭng bҩt tiӋn ӣ chӛ là không ÿӑc ÿѭӧc tiӃng ViӋt và không thҩy ÿѭӧc lӛi
chính tҧ ÿӇ sӳa lӛi câu văn...
Bҥn có thӇ dùng các chѭѫng trình gõ chӳ ViӋt mӟi nhҩt cӫa VPS, VietKey,
VNI vân vân ÿӇ gõ chӳ ViӋt Unicode. Các chѭѫng trình trên có thӇ dùng
trong hҫu hӃt các ӭng dөng cӫa bӝ Office 97, Office 2000 và mӝt sӕ ӭng
dөng khác.
Trѭӟc kia Frontpage 97 và Frontpage 98 là chѭѫng trình ÿӝc lұp cӫa
Microsoft, nhѭng kӇ tӯ Frontpage 2000, Micorsoft ÿã nhұp nó vào thành
viên cӫa bӝ Office 2000. Tҩt cҧ các bӝ Frontpage nói trên ÿӅu hӛ trӧ
Unicode nhѭng dƭ nhiên là bӝ Frontpage 2000 là có hӛ trӧ Unicode ÿҫy ÿӫ
nhҩt.
Trong phҫn này chúng tôi chӍ bàn ÿӃn phҫn dùng Unicode cӫa Frontpage
2000 trong webpage ViӋt ngӳ và các bҥn có thӇ suy diӉn tӯ bӝ này cho bӝ
Frontpage 98.
Trong Frontpage 2000 bҥn có thӇ mӣ mӝt trang mӟi bҵng cách vào: File >
New > Page
Sau khi mӝt trang mӟi ÿã ÿѭӧc mӣ ra sҹn sàng cho bҥn ÿѭa dӳ liӋu và hình
ҧnh trang trí vào thì trong phҫn góc dѭӟi bên trái cӫa Window chánh View/
Các ӭng dөng Unicode trong web site tiӃng ViӋt 11
Page bҥn sӁ thҩy có 3 tab chӑn lӵa sau ÿây: Normal, HTML, Preview. Tóm
tҳc cách dùng cӫa 3 tabs này nhѭ sau:
Normal: cho phép bҥn nhìn wysiwyg cӫa trang web bҥn ÿang làm viӋc và
cho bҥn sӱa chӳa tùy ý trang web này.
HTML: bҥn ÿӑc thҩy toàn bӝ tag nӝi HTML cӫa trang và có thӇ sӱa chӳa
trang web bҵng HTML tag nhѭ bҥn làm viӋc trên trang web khi mӣ bҵng
NotePad.
Preview: bҥn chӍ nhìn thҩy wysiwyg cӫa trang web nhѭng không sӱa ÿѭӧc.
Sau khi gõ vào tab Normal ÿӇ có thӇ biên soҥn trang web, bҥn nhҩp chuӝt
phҧi trong bҩt kǤ chӛ nào trong trang web ÿӇ cho ra popup menu rӗi chӑn
Page Properties..., mӝt window nhѭ sau hiӋn lên:
Tҩt cҧ các setting ÿӇ sӱ dөng Unicode cho mӑi trang web ÿӅu nҵm trong tab
Language nên bҥn gõ vào Language tab ÿӇ thҩy window sau:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 12
Tùy theo cách setting cӫa bҥn ÿһt trong Tools/ Web Setting, Page Properties/
Language sӁ hiӋn lên khác nhau. Hình trên là cách setting cӫa các trang
trong Vovisoft ÿӇ sӱ dөng Unicode NCR và phҫn setting trên sӁ tӵ ÿӝng viӃt
cho bҥn hàng meta tag sau (meta tag có chӳ ÿұm) trong phҫn Heading tag
cӫa trang:
Using Unicode in Frontpage 2000
NӃu bҥn chӑn Vietnamese trong combo box (Mark current document as:)
nhѭ hình sau:
thì bҥn sӁ có thêm hàng meta tag nhѭ sau:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 13
Chӳ "vi" trong content="vi" là ký hiӋu tҳt (short string) cӫa locale ID Vietnam.
NӃu bҥn muӕn tìm hiӇu thêm vӅ các ký hiӋu tҳt locale ID dùng cho ngôn
ngӳ các quӕc gia thì gõ vào ÿây. Meta tag này dùng xác ÿӏnh ngôn ngӳ ÿѭӧc
dùng trong trang web ÿӇ Frontpage ӭng dөng ÿúng phҫn mӅm kiӇm tra ÿánh
vҫn và giúp các Search Engine xác ÿӏnh ngôn ngӳ ÿѭӧc dùng trong trang
web mà nó ÿang lөc tìm.
Hàng meta tag vӅ locale theo bút giҧ là không cҫn thiӃt cho các trang sӱ
dөng Unicode cho tiӃng ViӋt nhѭ các trang web trong Vovisoft. Tuy nhiên
nӃu dùng locale Vietnam (Vietnamese Windows) theo Microsoft và dùng
codepage 1258 cho tiӃng ViӋt thì meta tag này sӁ giúp cho nhӳng ai ÿã set
trong browser sӱ dөng Vietnamese 1258 có thӇ chҥy thҷng vào các trang
dùng Vietnamese 1258 cӫa mҥng có ÿa ngôn ngӳ mà tiӃng ViӋt là mӝt trong
các ngôn ngӳ ÿѭӧc ӭng dөng. ÐiӅu ÿáng chú ý là code page 1258 không
phҧi là mã Unicode vì có mӝt sӕ mã ÿiӇm (code points) không xӃp theo tӵ vӏ
trong giҧi sӕ Unicode.
Nói tóm lҥi bҥn set Language Tab trong Page Properties cӫa Frontpage 2000
nhѭ sau nӃu dùng Unicode NCR:
Page Language
Mark current document as:
HTML encoding
Save the document as: US/Western European (codepage 1252)
Reload the current document as:
và set Language Tab trong Page Properties cӫa Frontpage 2000 nhѭ sau nӃu
dùng Unicode UTF-8:
Page Language
Mark current document as:
HTML encoding
Save the document as: Multilingual (UTF-8)
Reload the current document as:
Bҥn sӁ thҩy trong phҫn Header tag cӫa trang có phҫn meta tag sau:
Mӝt ÿiӅu ÿӝc ÿáo cӫa Frontpage 2000 là bҥn có thӇ chuyӇn ÿәi tӯ NCR
thành UTF-8 hay ngѭӧc lҥi mӝt cách dӉ dàng bҵng cách set charset=1252 thành
charset=utf-8 hay ngѭӧc lҥi rӗi "Save" trang web là bҥn có ngay mã Unicode
NCR hay UTF-8. Có lҿ cho ÿӃn giӡ cNJng chѭa có chѭѫng trình Web Editor
nào xӱ lý Unicode nhuyӉn nhѭ Frontpage 2000.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 14
NCR là mӝt phѭѫng pháp biӇu hiӋn Unicode bҵng tӵ vӏ trong giҧi sӕ ký tӵ
Unicode 16 bit còn UTF-8 là mӝt cách mã cӕt bҵng 8 bit cӫa Unicode. NӃu
bҥn chѭa rõ thӃ nào là Unicode NCR và thӃ nào là UTF-8 thì mӡi bҥn gõ vào
ÿây.
NӃu bҥn chӍ dùng Frontpage 2000 ÿӇ viӃt website ViӋt ngӳ bҵng Unicode
thôi thì bҥn có thӇ set luôn cho trang mӟi default cӫa Frontpage 2000 có
charset là 1252 hoһc UTF-8. Bҥn vào Tools/ Web settings... và trong hӝp
Window hiӋn lên, bҥn chӑn tab Language rӗi trong:
Server message language: chӑn English
Default page encoding: chӑn US/Western European
Rӗi nhҩn vào nút OK. Tӯ giӡ trӣ ÿi cӭ mӛi lҫn bҥn mӣ mӝt trang Frontpage
mӟi ÿӇ viӃt bài thì trang mӟi ÿó ÿã có sҹn hàng meta tag sau:
ÿӇ bҥn gõ Unicode chӳ ViӋt theo Decimal NCR.
NӃu bҥn muӕn dùng UTF-8 thì trong:
Default page encoding: chӑn Multilingual (UTF-8)
và khi mӣ mӝt trang mӟi bҥn sӁ có sҹn meta tag sau:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 15
Sau khi set sҹn các phҫn trên, bҥn chӍ còn mӝt ÿiӇm nên lѭu ý ÿó là luôn áp
dөng font: Tahoma, Arial, Times New Roman vv... vào tҩt cҧ text ViӋt ngӳ
vì nӃu không sӁ có browser (ÿã set sҹn nhӳng fonts default không chӭa
glyphs chӳ ViӋt) không ÿӑc ÿѭӧc Unicode ViӋt ngӳ cӫa bҥn.
Ghi chú:
Các bҧn Internet Explorer 4.x trӣ vӅ sau ÿӅu có thӇ trình bày ÿúng Unicode
theo NCR hay UTF-8 khi ÿһt ÿúng charset theo dҥng cӫa nó nhѭng Netscape
4.x thì chӍ có thӇ hiӇn thӏ Unicode ÿúng nӃu trang web ÿѭӧc mã theo UTF-8.
NӃu bҥn muӕn cҧ hai browsers trên ÿӅu có thӇ hiӇn thӏ ÿѭӧc trang web ViӋt
ngӳ cӫa bҥn thì bҥn nên dùng UTF-8 cho các trang web ViӋt ngӳ.
Mӝt ÿiӇm lҥ nӳa là theo mӝt sӕ báo cáo và theo kinh nghiӋm cӫa bút giҧ thì
Netscape 4.x có thӇ hiӇn thӏ ÿѭӧc Unicode mã theo NCR vӟi ÿiӅu kiӋn là
meta tag phҧi set theo:
Nhѭ vұy có nghƭa là Netscape 4.x ÿã xem UTF-8 nhѭ mӝt code page (giӕng nhѭ các codepages: 1251,
1252...1258 vân vân...) chӭ không phҧi là mӝt dҥng mã Unicode 8 bit nhѭng qua Netscape 6.x thì ÿiӅu này ÿã
ÿѭӧc chӍnh lҥi.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 16
Cách Dùng Unicode ĈӇ Gõ TiӃng ViӋt
Trong MS-WORD
ThiӃt KӃ MS-WORD Template:
1. Vào Tools \ Options \ File Location tab ÿӇ xem biӃt directory cӫa
Startup files.
2. Ra khӓi MS-WORD và copy vnunicode.dot vào directory cӫa startup
files. Thѭӡng thѭӡng directory này là C:\Windows\Application
Data\Microsoft\Word\Startup\
3. Mӣ MS-WORD trӣ lҥi và vào Tools \ Templates and Add-Ins và
check [check box] cӫa vnunicode.dot nӃu cҫn.
4. HiӋn giӡ nên dùng font Tahoma cho bҧo ÿҧm. Bҥn có thӇ vào Format
\ Styles ÿӇ set Tahoma làm default font. Trong tѭѫng lai có thӇ dùng
các fonts khác nhѭ Arial, Times New Roman, v…v…
5. NӃu muӕn thì vào Tools \ Auto Correct và uncheck hӃt tҩt cҧ các
check boxes ÿӇ MS-Word khӓi tӵ ÿӝng ÿәi nhӳng chӳ nhѭ i thành I
(ÿây là mӝt feature có thӇ rҩt phiӅn phӭc hѫn là ích lӧi).
Cách Ĉánh Dҩu:
Dùng các nút bҩm sau ÿây ÿӇ ÿánh dҩu trѭӟc khi bҩm nút nguyên âm.
Nút Bҩm Trѭӟc Khi Bҩm
Dҩu Thí Dө
Nút Nguyên Âm
á : Ctrl + 1, A
Sҳc Ctrl + 1
Á : Ctrl + 1, Shift + A
à : Ctrl + 2 , A
HuyӅn Ctrl + 2
À : Ctrl + 2 , Shift+A
ҧ : Ctrl + 3 , A
Hӓi Ctrl + 3
Ҧ : Ctrl + 3 , Shift+A
ã : Ctrl + 4 , A
Ngã Ctrl + 4
à : Ctrl + 4 , Shift+A
ҥ : Ctrl + 5 , A
Nһng Ctrl + 5
Ҥ : Ctrl + 5 , Shift+A
â : Ctrl + 6 , A
Âêô Ctrl + 6
 : Ctrl + 6 , Shift+A
Các ӭng dөng Unicode trong web site tiӃng ViӋt 17
ă : Ctrl + 7 , A
Ă Ctrl + 7
Ă : Ctrl + 7, Shift+A
ѭ : Ctrl + 8 , A
Ѭѭ Ctrl + 8
Ѭ : Ctrl + 8 , Shift+U
ÿ : Ctrl + 9 , D
Ð Ctrl + 9
Ð : Ctrl + 9 , Shift+D
ҩ : Alt + 1 , A
ҩӃӕ Atl + 1
Ҩ : Alt + 1 , shift+A
ҫ : Alt + 2 , A
ҫӅӗ Atl + 2
Ҫ : Alt + 2 , shift+A
ҭ : Alt + 3 , A
ҭӇә Alt + 3
Ҭ : Alt + 3 , Shift+A
ү : Alt + 4 , A
үӉӛ Alt + 4
Ү : Alt + 4 , Shift+A
ұ : Alt + 5 , A
ұӋӝ Alt + 5
Ұ : Alt + 5 , Shift+A
ҳ : Ctrl+Alt + 1 , A
ҳӟӭ Ctrl + Alt + 1
Ҳ : Ctrl+Alt + 1 , Shift+A
ҵ : Ctrl+Alt + 2 , A
ҵӡӯ Ctrl + Alt + 2
Ҷ : Ctrl+Alt + 2 , Shift+A
ҷ : Ctrl+Alt + 3 , A
ҷӣӱ Ctrl + Alt + 3
Ҷ : Ctrl+Alt + 3 , Shift+A
ҹ : Ctrl+Alt + 4 , A
ҹӥӳ Ctrl + Alt + 4
Ҹ : Ctrl+Alt + 4 ,Shift+A
һ : Ctrl+Alt + 5 , A
һӧӵ Ctrl + Alt + 5
Һ : Ctrl+Alt + 5 , Shift+A
Nói tóm lҥi:
1. ÿánh dҩu trѭӟc, nguyên âm sau.
2. dùng Ctrl cho dҩu ÿѫn, Alt cho ô hay â vӟi dҩu và Ctrl + Alt cho ѭ
hay ѫ vӟi dҩu
Các ӭng dөng Unicode trong web site tiӃng ViӋt 18
Cách chӑn Settings trong OutLook Express (IE 5)
ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR
Các bҥn sӱ dөng OutLook Express cӫa IE 5x ÿӇ nhұn email có thӇ chӑn các
settings cӫa OutLook Express nhѭ sau ÿӇ có thӇ ÿӑc ÿѭӧc chӳ ViӋt Unicode:
Trên Menu cӫa OutLook Express gõ vào Tools - Options - Read ÿӇ mӣ tab
box sau ÿây:
Hình 1
Gõ vào nút Fonts... trong phҫn Fonts cӫa (hình 1) ÿӇ mӣ dialogue sau ÿây:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 19
Hình 2
Trong phҫn [Font settings] chӑn Western European nhѭ hình trên
Trong phҫn Proportional font chӑn Tahoma nhѭ hình trên
Trong phҫn Encoding chӑn Western European (windows) nhѭ hình trên
Gõ vào nút [Set as Default] rӗi gõ vào nút OK ÿӇ ÿóng dialogue trên lҥi
Gõ vào nút International settings trong (hình 1)... ÿӇ mӣ dialogue sau ÿây:
Hình 3
Dialogue trên cho thҩy Western European (Windows) là Default encoding
cӫa OutLook Express
Các ӭng dөng Unicode trong web site tiӃng ViӋt 20
NӃu muӕn dùng OutLook Express ÿӇ gӱi email chӳ ViӋt thì có thӇ set nhѭ
sau:
Trong phҫn tab Send cӫa dialogue sau ÿây, gõ vào nút International
Settings...
Hình 4
Trong phҫn Default encoding cӫa dialogue sau ÿây chӑn Western European
(Windows)
Hình 5