このメモはインターネット・コミュニティーのために情報を提供するものである。 このメモではいかなる種類のインターネット標準も定めない。 このメモの配布に制限はない。
この文書は、ギリシャ語のテキストを内容とする電子メール [RFC822] のための符号化法の規格について解説し、実装の指針を与えるものである。 この規格は MIME [RFC1521] および ISO 8859-7 文字符号化法に基づいている。 この規格は容易に実装できるにもかかわらず、一般にはいくつかの非標準ながら “機能” してしまう——とはいえ相互運用できそうにない——代替手段を用いることのほうが普及してしまっている。 このため、一般的な実装に見られる間違いやメール・ユーザー・エージェントの設定の間違いについても注意を向ける。
ギリシャ語のテキストを電子メールで転送するには、まずそのテキストを ISO 8859-7 文字集合に変換し、さらにそれを MIME で定義されているように Base64 (大半がギリシャ語のテキストの場合はこちらが望ましい) か Quoted-Printable (おもにラテン文字のテキストの中にギリシャ語の単語がいくつか現れるような場合にはこちらがふさわしい) のいずれかの方法で符号化する。
次の表に、最も一般的なギリシャ語の符号化法を示す ([RFC1345] も参照のこと)。
0646 | 37 | M7 | 51 | MC | 23 | 69 | LG | L1 | G7 | GO | GC | 28 | 97 | 説明 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0386 | ea | a2 | 86 | cd | 71 | 86 | b6 | 大文字アルファ、鋭アクセントつき | ||||||
0388 | eb | b8 | 8d | ce | 72 | 8d | b8 | 大文字エプシロン、鋭アクセントつき | ||||||
0389 | ec | b9 | 8f | d7 | 73 | 8f | b9 | 大文字エータ、鋭アクセントつき | ||||||
038a | ed | ba | 90 | d8 | 75 | 90 | ba | 大文字イオタ、鋭アクセントつき | ||||||
038c | ee | bc | 92 | d9 | 76 | 92 | bc | 大文字オミクロン、鋭アクセントつき | ||||||
038e | ef | be | 95 | da | 77 | 95 | be | 大文字ユプシロン、鋭アクセントつき | ||||||
038f | f0 | bf | 98 | df | 78 | 98 | bf | 大文字オメガ、鋭アクセントつき | ||||||
0390 | c0 | a1 | fd | a1 | c0 | 小文字イオタ、鋭アクセント・分音符つき | ||||||||
0391 | 80 | c1 | a4 | b0 | 41 | a4 | 61 | 41 | 61 | 41 | 41 | c1 | 大文字アルファ Α | |
0392 | 81 | c2 | a5 | b5 | 42 | a5 | 62 | 42 | 62 | 42 | 42 | c2 | 大文字ベータ Β | |
0393 | 82 | c3 | a6 | a1 | 43 | a6 | 67 | 23 | 43 | 67 | 43 | 44 | c3 | 大文字ガンマ Γ |
0394 | 83 | c4 | a7 | a2 | 44 | a7 | 64 | 40 | 44 | 64 | 44 | 45 | c4 | 大文字デルタ Δ |
0395 | 84 | c5 | a8 | b6 | 45 | a8 | 65 | 45 | 65 | 45 | 46 | c5 | 大文字エプシロン Ε | |
0396 | 85 | c6 | a9 | b7 | 46 | a9 | 7a | 46 | 7a | 46 | 49 | c6 | 大文字ゼータ Ζ | |
0397 | 86 | c7 | aa | b8 | 47 | aa | 68 | 47 | 68 | 47 | 4a | c7 | 大文字エータ Η | |
0398 | 87 | c8 | ac | a3 | 48 | ac | 75 | 5c | 48 | 75 | 48 | 4b | c8 | 大文字テータ Θ |
0399 | 88 | c9 | ad | b9 | 49 | ad | 69 | 49 | 69 | 49 | 4c | c9 | 大文字イオタ Ι | |
039a | 89 | ca | b5 | ba | 51 | b5 | 6b | 4b | 6b | 4a | 4d | ca | 大文字カッパ Κ | |
039b | 8a | cb | b6 | a4 | 52 | b6 | 6c | 5e | 4c | 6c | 4b | 4e | cb | 大文字ラムダ Λ |
039c | 8b | cc | b8 | bb | 53 | b7 | 6d | 4d | 6d | 4c | 4f | cc | 大文字ミュー Μ | |
039d | 8c | cd | b7 | c1 | 54 | b8 | 6e | 4e | 6e | 4d | 50 | cd | 大文字ニュー Ν | |
039e | 8d | ce | bd | a5 | 55 | bd | 6a | 21 | 4f | 6a | 4e | 51 | ce | 大文字クシー Ξ |
039f | 8e | cf | be | c3 | 56 | be | 6f | 50 | 6f | 4f | 52 | cf | 大文字オミクロン Ο | |
03a0 | 8f | d0 | c6 | a6 | 57 | c6 | 70 | 3f | 51 | 70 | 50 | 53 | d0 | 大文字ピー Π |
03a1 | 90 | d1 | c7 | c4 | 58 | c7 | 72 | 52 | 72 | 51 | 55 | d1 | 大文字ロー Ρ | |
03a3 | 91 | d3 | cf | aa | 59 | cf | 73 | 5f | 53 | 73 | 53 | 56 | d3 | 大文字シグマ Σ |
03a4 | 92 | d4 | d0 | c6 | 62 | d0 | 74 | 54 | 74 | 54 | 58 | d4 | 大文字タウ Τ | |
03a5 | 93 | d5 | d1 | cb | 63 | d1 | 79 | 55 | 79 | 55 | 59 | d5 | 大文字ユプシロン Υ | |
03a6 | 94 | d6 | d2 | bc | 64 | d2 | 66 | 5d | 56 | 66 | 56 | 5a | d6 | 大文字フィー Φ |
03a7 | 95 | d7 | d3 | cc | 65 | d3 | 78 | 58 | 78 | 57 | 5b | d7 | 大文字キー Χ | |
03a8 | 96 | d8 | d4 | be | 66 | d4 | 63 | 3a | 59 | 63 | 58 | 5c | d8 | 大文字プシー Ψ |
03a9 | 97 | d9 | d5 | bf | 67 | d5 | 76 | 5b | 5a | 76 | 59 | 5d | d9 | 大文字オメガ Ω |
03aa | da | ab | 91 | da | 大文字イオタ、分音符つき | |||||||||
03ab | db | bd | 96 | db | 大文字ユプシロン、分音符つき | |||||||||
03ac | e1 | dc | 9b | c0 | b1 | 9b | dc | 小文字アルファ、鋭アクセントつき | ||||||
03ad | e2 | dd | 9d | db | b2 | 9d | dd | 小文字エプシロン、鋭アクセントつき | ||||||
03ae | e3 | de | 9e | dc | b3 | 9e | de | 小文字エータ、鋭アクセントつき | ||||||
03af | e5 | df | 9f | dd | b5 | 9f | df | 小文字イオタ、鋭アクセントつき | ||||||
03b0 | e0 | fc | fe | fc | e0 | 小文字ユプシロン、鋭アクセント・分音符つき | ||||||||
03b1 | 98 | e1 | d6 | e1 | 8a | d6 | 61 | 41 | 61 | 61 | e1 | 小文字アルファ α | ||
03b2 | 99 | e2 | d7 | e2 | 8b | d7 | 62 | 42 | 62 | 62 | e2 | 小文字ベータ β | ||
03b3 | 9a | e3 | d8 | e7 | 8c | d8 | 63 | 47 | 63 | 64 | e3 | 小文字ガンマ γ | ||
03b4 | 9b | e4 | dd | e4 | 8d | dd | 64 | 44 | 64 | 65 | e4 | 小文字デルタ δ | ||
03b5 | 9c | e5 | de | e5 | 8e | de | 65 | 45 | 65 | 66 | e5 | 小文字エプシロン ε | ||
03b6 | 9d | e6 | e0 | fa | 8f | e0 | 66 | 5a | 66 | 69 | e6 | 小文字ゼータ ζ | ||
03b7 | 9e | e7 | e1 | e8 | 9a | e1 | 67 | 48 | 67 | 6a | e7 | 小文字エータ η | ||
03b8 | 9f | e8 | e2 | f5 | 9b | e2 | 68 | 55 | 68 | 6b | e8 | 小文字テータ θ | ||
03b9 | a0 | e9 | e3 | e9 | 9c | e3 | 69 | 49 | 69 | 6c | e9 | 小文字イオタ ι | ||
03ba | a1 | ea | e4 | eb | 9d | e4 | 6b | 4b | 6a | 6d | ea | 小文字カッパ κ | ||
03bb | a2 | eb | e5 | ec | 9e | e5 | 6c | 4c | 6b | 6e | eb | 小文字ラムダ λ | ||
03bc | a3 | ec | e6 | ed | 9f | e6 | 6d | 4d | 6c | 6f | ec | 小文字ミュー μ | ||
03bd | a4 | ed | e7 | ee | aa | e7 | 6e | 4e | 6d | 70 | ed | 小文字ニュー ν | ||
03be | a5 | ee | e8 | ea | ab | e8 | 6f | 4a | 6e | 71 | ee | 小文字クシー ξ | ||
03bf | a6 | ef | e9 | ef | ac | e9 | 70 | 4f | 6f | 72 | ef | 小文字オミクロン ο | ||
03c0 | a7 | f0 | ea | f0 | ad | ea | 71 | 50 | 70 | 73 | f0 | 小文字ピー π | ||
03c1 | a8 | f1 | eb | f2 | ae | eb | 72 | 52 | 71 | 75 | f1 | 小文字ロー ρ | ||
03c2 | aa | f2 | ed | f7 | af | ed | 77 | 57 | 72 | 77 | f2 | 小文字語末シグマ ς | ||
03c3 | a9 | f3 | ec | f3 | ba | ec | 73 | 53 | 73 | 76 | f3 | 小文字シグマ σ | ||
03c4 | ab | f4 | ee | f4 | bb | ee | 74 | 54 | 74 | 78 | f4 | 小文字タウ τ | ||
03c5 | ac | f5 | f2 | f9 | bc | f2 | 75 | 59 | 75 | 79 | f5 | 小文字ユプシロン υ | ||
03c6 | ad | f6 | f3 | e6 | bd | f3 | 76 | 46 | 76 | 7a | f6 | 小文字フィー φ | ||
03c7 | ae | f7 | f4 | f8 | be | f4 | 78 | 58 | 77 | 7b | f7 | 小文字キー χ | ||
03c8 | af | f8 | f6 | e3 | bf | f6 | 79 | 43 | 78 | 7c | f8 | 小文字プシー ψ | ||
03c9 | e0 | f9 | fa | f6 | db | fa | 7a | 56 | 79 | 7d | f9 | 小文字オメガ ω | ||
03ca | e4 | fa | a0 | fb | b4 | a0 | fa | 小文字イオタ、分音符つき | ||||||
03cb | e8 | fb | fb | fc | b8 | fb | fb | 小文字ユプシロン、分音符つき | ||||||
03cc | e6 | fc | a2 | de | b6 | a2 | fc | 小文字オミクロン、鋭アクセントつき | ||||||
03cd | e7 | fd | a3 | e0 | b7 | a3 | fd | 小文字ユプシロン、鋭アクセントつき | ||||||
03ce | e9 | fe | fd | f1 | b9 | fd | fe | 小文字オメガ、鋭アクセントつき |
注意 値はすべて 16 進数である。
各列の見出しは以下の文字集合を表わす。
0646 | ISO 2DIS 10646 コード。 |
---|---|
37 | PC コード・ページ 737。 437G としても知られる。 実装によっては鋭アクセントつきの大文字を含まないものがあることに注意。 |
M7 | 8859-7 文字集合の、Microsoft Windows 3.1、Microsoft Windows 3.11、および Microsoft Windows 95 における実装。 |
51 | IBM コード・ページ 851。 |
MC | Greek コード・ページの Apple Macintosh コンピューター上での実装。 |
23 | IBM コード・ページ 423 (EBCDIC-CP-GR)。 |
69 | IBM コード・ページ 869。 |
LG | Latin Greek (iso-ir-19)。 |
L1 | Latin Greek 1 (iso-ir-27)。 このコード・ページには、ラテン・アルファベットにグリフの存在しないギリシャ大文字のみが収録されている。 それ以外の大文字の表示には等価なラテン文字が利用される (たとえば「ギリシャ大文字アルファ」は「ラテン大文字 A」として表示される)。 この "Latin Greek 1" の ISO 8859-7 へのマッピングにあたっては、ラテン大文字は、適切な発見的手法によりそれがギリシャ文字のグリフを表現するのに用いられていることが明らかである場合に限って等価なギリシャ大文字に転写すべきである。 |
G7 | 7 ビット Greek (iso-ir-88)。 |
GO | 旧 7 ビット Greek (iso-ir-18)。 |
GC | Greek CCITT (iso-ir-150)。 |
28 | ISO 5428:1980 文字集合 (iso-ir-55)。 |
97 | 変換先文字集合 ISO 8859-7:1987 (ELOT-928) (iso-ir-126)。 |
ギリシャ語のテキストを内容とするメール・メッセージは、少なくとも以下の MIME ヘッダーを含んでいなければならない。(1)
MIME-Version: 1.0 Content-type: text/plain; charset=ISO-8859-7 Content-transfer-encoding: BASE64 | Quoted-Printable
将来、すべての電子メール・システムが RFC 1425 および RFC 1426 で定義されているような 8 ビット透過な電子メールを完全に実装した場合には、この規格で記述したメッセージ本文の符号化フェーズはもはや必要とはされない。 その場合、必要な MIME ヘッダーは次のように変更される。
MIME-Version: 1.0 Content-type: text/plain; charset=ISO-8859-7 Content-transfer-encoding: 8BIT
RFC 1425 を使用する場合であっても、メッセージ・ヘッダーに対しては、次節で詳説するように Q 符号化法ないし B 符号化法が依然として適用されることになろう。
メール・ヘッダーにおけるギリシャ語の符号化は必須ではないが、RFC 1522 に定められているとおりにサポートすることが推奨される。 具体的に言えば、RFC-822 メールのヘッダーにおけるギリシャ語テキストの符号化には、B 符号化形式をデフォルトの方法とすべきである。 Q 符号化形式のほうは、ラテン文字ベースのヘッダー中に現れるギリシャ語の単語や文字を符号化するような例外的な場合に用いる方法とすべきである。
以下は、Base64 で符号化した短いギリシャ語の電子メールの例である。
Date: Wed, 31 Jan 96 20:15:03 EET From: Diomidis Spinellis <dds@senanet.com> Subject: Sample Greek mail To: Achilleas Voliotis <achilles@theseas.ntua.gr> MIME-Version: 1.0 Content-ID: <Wed_Feb_14_18_49_50_EET_1996_0@senanet> Content-Type: Text/plain; charset=ISO-8859-7 Content-Transfer-Encoding: Base64 yuHr5+zd8eEsCgrU7yDl6+vn7enq/CDh6/bc4uf07yDh8O/05evl3/Th6SDh8PwgMjYg4/Hc 7Ozh9OEuCg==
メール・ユーザー・エージェントやメール転送エージェントの設定を変更して末端の利用者がギリシャ語の電子メール・メッセージで通信できるようにすることは可能である [RFC1428] が、いくつかの標準に違反することになる (残念ながらこれが一般に普及している)。 そうした設定が広範囲の相互運用性を示すとは考えにくい。
よくある間違いのひとつは、ISO 8859-1 環境に置かれているメール・ユーザー・エージェントを、ギリシャ文字のグリフを含む表示用フォントとそれらのグリフを用いてギリシャ語テキストを生成するキーボード入力法とを使うように設定することによって、ギリシャ語メッセージの表示と作成とに備えることである。 その結果、本文の文字集合が ISO 8859-1 であることを示すヘッダー項目で始まりながら、それとはまったく異なる符号化法のテキストを含んだメッセージが作られてしまう。 残念なことに、この “解決策” は、類似のシステム間ではうまく “機能している” ように見えるため、広く利用されている。
間違いのもうひとつは、Microsoft Windows プラットフォーム上で生成されたギリシャ語テキストに対し、中間の変換過程を経ないまま ISO 8859-7 とタグづけすることである。 Microsoft Windows のギリシャ語版で用いられる文字集合は、ISO 8859-7 表現と同一ではないという点に留意することは重要である。 まず第一に、ギリシャ文字を表現するのに用いられるその文字集合は、ISO 8859-7 符号化法とは若干異なっている (その違いは、Windows 用 Microsoft Word の初期のバージョンの見た目を修正するために設けられたもので、そこではセクション区切りの記号が「ギリシャ大文字鋭アクセントつきアルファ」のグリフと衝突していたのである)。 また、ギリシャ語版 Windows で利用できる 8 ビット文字のいくつかは ISO 8859-7 文字集合には含まれていない。
ISO 8859-7 符号化法はギリシャ標準化機構の ELOT-928 符号化法に等しいことに留意されたい。
[ISO-8859] | Information Processing -- 8-bit Single-Byte Coded Graphic Character Sets, Part 7: Latin/Greek alphabet, ISO 8859-7, 1987. |
[RFC822] | Crocker, D., "Standard for the Format of ARPA Internet Text Messages", STD 11, RFC 822, UDEL, August 1982. |
[RFC1345] | Simonsen, K., "Character Mnemonics & Character Sets", RFC 1345, Rationel Almen Planlaegning, June 1992. |
[RFC1425] | Klensin, J., Freed N., Rose M., Stefferud E., and D. Crocker, "SMTP Service Extensions", RFC 1425, United Nations University, Innosoft International, Inc., Dover Beach Consulting, Inc., Network Management Associates, Inc., The Branch Office, February 1993. |
[RFC1426] | Klensin, J., Freed N., Rose M., Stefferud E., and D. Crocker, "SMTP Service Extension for 8bit-MIME Transport", RFC 1426, United Nations University, Innosoft International, Inc., Dover Beach Consulting, Inc., Network Management Associates, Inc., The Branch Office, February 1993. |
[RFC1428] | Vaudreuil, G., "Transition of Internet Mail from Just-Send-8 to 8bit-SMTP/MIME", RFC 1428, CNRI, February 1993. |
[RFC1521] | Borenstein N., and N. Freed, "MIME (Multipurpose Internet Mail Extensions) Part One: Mechanisms for Specifying and Describing the Format of Internet Message Bodies", RFC 1521, Bellcore, Innosoft, September 1993. |
[RFC1522] | Moore K., "MIME Part Two: Message Header Extensions for Non-ASCII Text", RFC 1522, University of Tennessee, September 1993. |
セキュリティーの問題はこのメモでは議論しない。
Diomidis Spinellis
SENA S.A.
Kyprou 27
GR-152 47 Filothei
GREECE
Phone: +30 (1) 6854535
Fax: +30 (1) 6840631
EMail: D.Spinellis@senanet.com
(1) | “Content-transfer-encoding:” の値に “BASE64 | Quoted-Printable” と指定されているが、これは BASE64 か Quoted-Printable かのいずれかを指定するという意味である。 |