D. Spinellis
SENA S.A.
May 1996
Network Working Group
Request for Comments: 1947
Category: Informational

Greek Character Encoding
for Electronic Mail Messages

(電子メール・メッセージのためのギリシャ文字符号化法)

このメモの位置づけ

このメモはインターネット・コミュニティーのために情報を提供するものである。 このメモではいかなる種類のインターネット標準も定めない。 このメモの配布に制限はない。

概観と原理

この文書は、ギリシャ語のテキストを内容とする電子メール [RFC822] のための符号化法の規格について解説し、実装の指針を与えるものである。 この規格は MIME [RFC1521] および ISO 8859-7 文字符号化法に基づいている。 この規格は容易に実装できるにもかかわらず、一般にはいくつかの非標準ながら “機能” してしまう——とはいえ相互運用できそうにない——代替手段を用いることのほうが普及してしまっている。 このため、一般的な実装に見られる間違いやメール・ユーザー・エージェントの設定の間違いについても注意を向ける。

解説

ギリシャ語のテキストを電子メールで転送するには、まずそのテキストを ISO 8859-7 文字集合に変換し、さらにそれを MIME で定義されているように Base64 (大半がギリシャ語のテキストの場合はこちらが望ましい) か Quoted-Printable (おもにラテン文字のテキストの中にギリシャ語の単語がいくつか現れるような場合にはこちらがふさわしい) のいずれかの方法で符号化する。

次の表に、最も一般的なギリシャ語の符号化法を示す ([RFC1345] も参照のこと)。

064637M7 51MC2369 LGL1G7GOGC28 97説明
0386eaa2 86cd7186 b6大文字アルファ、鋭アクセントつき
0388ebb8 8dce728d b8大文字エプシロン、鋭アクセントつき
0389ecb9 8fd7738f b9大文字エータ、鋭アクセントつき
038aedba 90d87590 ba大文字イオタ、鋭アクセントつき
038ceebc 92d97692 bc大文字オミクロン、鋭アクセントつき
038eefbe 95da7795 be大文字ユプシロン、鋭アクセントつき
038ff0bf 98df7898 bf大文字オメガ、鋭アクセントつき
0390 c0 a1fd a1 c0小文字イオタ、鋭アクセント・分音符つき
039180c1 a4b041a4 61 41614141 c1大文字アルファ Α
039281c2 a5b542a5 62 42624242 c2大文字ベータ Β
039382c3 a6a143a6 672343674344 c3大文字ガンマ Γ
039483c4 a7a244a7 644044644445 c4大文字デルタ Δ
039584c5 a8b645a8 65 45654546 c5大文字エプシロン Ε
039685c6 a9b746a9 7a 467a4649 c6大文字ゼータ Ζ
039786c7 aab847aa 68 4768474a c7大文字エータ Η
039887c8 aca348ac 755c4875484b c8大文字テータ Θ
039988c9 adb949ad 69 4969494c c9大文字イオタ Ι
039a89ca b5ba51b5 6b 4b6b4a4d ca大文字カッパ Κ
039b8acb b6a452b6 6c5e4c6c4b4e cb大文字ラムダ Λ
039c8bcc b8bb53b7 6d 4d6d4c4f cc大文字ミュー Μ
039d8ccd b7c154b8 6e 4e6e4d50 cd大文字ニュー Ν
039e8dce bda555bd 6a214f6a4e51 ce大文字クシー Ξ
039f8ecf bec356be 6f 506f4f52 cf大文字オミクロン Ο
03a08fd0 c6a657c6 703f51705053 d0大文字ピー Π
03a190d1 c7c458c7 72 52725155 d1大文字ロー Ρ
03a391d3 cfaa59cf 735f53735356 d3大文字シグマ Σ
03a492d4 d0c662d0 74 54745458 d4大文字タウ Τ
03a593d5 d1cb63d1 79 55795559 d5大文字ユプシロン Υ
03a694d6 d2bc64d2 665d5666565a d6大文字フィー Φ
03a795d7 d3cc65d3 78 5878575b d7大文字キー Χ
03a896d8 d4be66d4 633a5963585c d8大文字プシー Ψ
03a997d9 d5bf67d5 765b5a76595d d9大文字オメガ Ω
03aa da ab 91 da大文字イオタ、分音符つき
03ab db bd 96 db大文字ユプシロン、分音符つき
03ace1dc 9bc0b19b dc小文字アルファ、鋭アクセントつき
03ade2dd 9ddbb29d dd小文字エプシロン、鋭アクセントつき
03aee3de 9edcb39e de小文字エータ、鋭アクセントつき
03afe5df 9fddb59f df小文字イオタ、鋭アクセントつき
03b0 e0 fcfe fc e0小文字ユプシロン、鋭アクセント・分音符つき
03b198e1 d6e18ad6 61416161 e1小文字アルファ α
03b299e2 d7e28bd7 62426262 e2小文字ベータ β
03b39ae3 d8e78cd8 63476364 e3小文字ガンマ γ
03b49be4 dde48ddd 64446465 e4小文字デルタ δ
03b59ce5 dee58ede 65456566 e5小文字エプシロン ε
03b69de6 e0fa8fe0 665a6669 e6小文字ゼータ ζ
03b79ee7 e1e89ae1 6748676a e7小文字エータ η
03b89fe8 e2f59be2 6855686b e8小文字テータ θ
03b9a0e9 e3e99ce3 6949696c e9小文字イオタ ι
03baa1ea e4eb9de4 6b4b6a6d ea小文字カッパ κ
03bba2eb e5ec9ee5 6c4c6b6e eb小文字ラムダ λ
03bca3ec e6ed9fe6 6d4d6c6f ec小文字ミュー μ
03bda4ed e7eeaae7 6e4e6d70 ed小文字ニュー ν
03bea5ee e8eaabe8 6f4a6e71 ee小文字クシー ξ
03bfa6ef e9eface9 704f6f72 ef小文字オミクロン ο
03c0a7f0 eaf0adea 71507073 f0小文字ピー π
03c1a8f1 ebf2aeeb 72527175 f1小文字ロー ρ
03c2aaf2 edf7afed 77577277 f2小文字語末シグマ ς
03c3a9f3 ecf3baec 73537376 f3小文字シグマ σ
03c4abf4 eef4bbee 74547478 f4小文字タウ τ
03c5acf5 f2f9bcf2 75597579 f5小文字ユプシロン υ
03c6adf6 f3e6bdf3 7646767a f6小文字フィー φ
03c7aef7 f4f8bef4 7858777b f7小文字キー χ
03c8aff8 f6e3bff6 7943787c f8小文字プシー ψ
03c9e0f9 faf6dbfa 7a56797d f9小文字オメガ ω
03cae4fa a0fbb4a0 fa小文字イオタ、分音符つき
03cbe8fb fbfcb8fb fb小文字ユプシロン、分音符つき
03cce6fc a2deb6a2 fc小文字オミクロン、鋭アクセントつき
03cde7fd a3e0b7a3 fd小文字ユプシロン、鋭アクセントつき
03cee9fe fdf1b9fd fe小文字オメガ、鋭アクセントつき

注意   値はすべて 16 進数である。

各列の見出しは以下の文字集合を表わす。

0646 ISO 2DIS 10646 コード。
37 PC コード・ページ 737。 437G としても知られる。 実装によっては鋭アクセントつきの大文字を含まないものがあることに注意。
M7 8859-7 文字集合の、Microsoft Windows 3.1、Microsoft Windows 3.11、および Microsoft Windows 95 における実装。
51 IBM コード・ページ 851。
MC Greek コード・ページの Apple Macintosh コンピューター上での実装。
23 IBM コード・ページ 423 (EBCDIC-CP-GR)。
69 IBM コード・ページ 869。
LG Latin Greek (iso-ir-19)。
L1 Latin Greek 1 (iso-ir-27)。 このコード・ページには、ラテン・アルファベットにグリフの存在しないギリシャ大文字のみが収録されている。 それ以外の大文字の表示には等価なラテン文字が利用される (たとえば「ギリシャ大文字アルファ」は「ラテン大文字 A」として表示される)。 この "Latin Greek 1" の ISO 8859-7 へのマッピングにあたっては、ラテン大文字は、適切な発見的手法によりそれがギリシャ文字のグリフを表現するのに用いられていることが明らかである場合に限って等価なギリシャ大文字に転写すべきである。
G7 7 ビット Greek (iso-ir-88)。
GO 旧 7 ビット Greek (iso-ir-18)。
GC Greek CCITT (iso-ir-150)。
28 ISO 5428:1980 文字集合 (iso-ir-55)。
97 変換先文字集合 ISO 8859-7:1987 (ELOT-928) (iso-ir-126)。

MIME ヘッダー

ギリシャ語のテキストを内容とするメール・メッセージは、少なくとも以下の MIME ヘッダーを含んでいなければならない。(1)

MIME-Version: 1.0
Content-type: text/plain; charset=ISO-8859-7
Content-transfer-encoding: BASE64 | Quoted-Printable

将来、すべての電子メール・システムが RFC 1425 および RFC 1426 で定義されているような 8 ビット透過な電子メールを完全に実装した場合には、この規格で記述したメッセージ本文の符号化フェーズはもはや必要とはされない。 その場合、必要な MIME ヘッダーは次のように変更される。

MIME-Version: 1.0
Content-type: text/plain; charset=ISO-8859-7
Content-transfer-encoding: 8BIT

RFC 1425 を使用する場合であっても、メッセージ・ヘッダーに対しては、次節で詳説するように Q 符号化法ないし B 符号化法が依然として適用されることになろう。

任意事項

メール・ヘッダーにおけるギリシャ語の符号化は必須ではないが、RFC 1522 に定められているとおりにサポートすることが推奨される。 具体的に言えば、RFC-822 メールのヘッダーにおけるギリシャ語テキストの符号化には、B 符号化形式をデフォルトの方法とすべきである。 Q 符号化形式のほうは、ラテン文字ベースのヘッダー中に現れるギリシャ語の単語や文字を符号化するような例外的な場合に用いる方法とすべきである。

以下は、Base64 で符号化した短いギリシャ語の電子メールの例である。

Date:         Wed, 31 Jan 96 20:15:03 EET
From:         Diomidis Spinellis <dds@senanet.com>
Subject:      Sample Greek mail
To:           Achilleas Voliotis <achilles@theseas.ntua.gr>
MIME-Version: 1.0
Content-ID: <Wed_Feb_14_18_49_50_EET_1996_0@senanet>
Content-Type: Text/plain; charset=ISO-8859-7
Content-Transfer-Encoding: Base64

yuHr5+zd8eEsCgrU7yDl6+vn7enq/CDh6/bc4uf07yDh8O/05evl3/Th6SDh8PwgMjYg4/Hc
7Ozh9OEuCg==

議論

メール・ユーザー・エージェントやメール転送エージェントの設定を変更して末端の利用者がギリシャ語の電子メール・メッセージで通信できるようにすることは可能である [RFC1428] が、いくつかの標準に違反することになる (残念ながらこれが一般に普及している)。 そうした設定が広範囲の相互運用性を示すとは考えにくい。

よくある間違いのひとつは、ISO 8859-1 環境に置かれているメール・ユーザー・エージェントを、ギリシャ文字のグリフを含む表示用フォントとそれらのグリフを用いてギリシャ語テキストを生成するキーボード入力法とを使うように設定することによって、ギリシャ語メッセージの表示と作成とに備えることである。 その結果、本文の文字集合が ISO 8859-1 であることを示すヘッダー項目で始まりながら、それとはまったく異なる符号化法のテキストを含んだメッセージが作られてしまう。 残念なことに、この “解決策” は、類似のシステム間ではうまく “機能している” ように見えるため、広く利用されている。

間違いのもうひとつは、Microsoft Windows プラットフォーム上で生成されたギリシャ語テキストに対し、中間の変換過程を経ないまま ISO 8859-7 とタグづけすることである。 Microsoft Windows のギリシャ語版で用いられる文字集合は、ISO 8859-7 表現と同一ではないという点に留意することは重要である。 まず第一に、ギリシャ文字を表現するのに用いられるその文字集合は、ISO 8859-7 符号化法とは若干異なっている (その違いは、Windows 用 Microsoft Word の初期のバージョンの見た目を修正するために設けられたもので、そこではセクション区切りの記号が「ギリシャ大文字鋭アクセントつきアルファ」のグリフと衝突していたのである)。 また、ギリシャ語版 Windows で利用できる 8 ビット文字のいくつかは ISO 8859-7 文字集合には含まれていない。

ISO 8859-7 符号化法はギリシャ標準化機構の ELOT-928 符号化法に等しいことに留意されたい。

参照文献

[ISO-8859] Information Processing -- 8-bit Single-Byte Coded Graphic Character Sets, Part 7: Latin/Greek alphabet, ISO 8859-7, 1987.
[RFC822] Crocker, D., "Standard for the Format of ARPA Internet Text Messages", STD 11, RFC 822, UDEL, August 1982.
[RFC1345] Simonsen, K., "Character Mnemonics & Character Sets", RFC 1345, Rationel Almen Planlaegning, June 1992.
[RFC1425] Klensin, J., Freed N., Rose M., Stefferud E., and D. Crocker, "SMTP Service Extensions", RFC 1425, United Nations University, Innosoft International, Inc., Dover Beach Consulting, Inc., Network Management Associates, Inc., The Branch Office, February 1993.
[RFC1426] Klensin, J., Freed N., Rose M., Stefferud E., and D. Crocker, "SMTP Service Extension for 8bit-MIME Transport", RFC 1426, United Nations University, Innosoft International, Inc., Dover Beach Consulting, Inc., Network Management Associates, Inc., The Branch Office, February 1993.
[RFC1428] Vaudreuil, G., "Transition of Internet Mail from Just-Send-8 to 8bit-SMTP/MIME", RFC 1428, CNRI, February 1993.
[RFC1521] Borenstein N., and N. Freed, "MIME (Multipurpose Internet Mail Extensions) Part One: Mechanisms for Specifying and Describing the Format of Internet Message Bodies", RFC 1521, Bellcore, Innosoft, September 1993.
[RFC1522] Moore K., "MIME Part Two: Message Header Extensions for Non-ASCII Text", RFC 1522, University of Tennessee, September 1993.

セキュリティーに関する考慮事項

セキュリティーの問題はこのメモでは議論しない。

著者連絡先

Diomidis Spinellis
SENA S.A.
Kyprou 27
GR-152 47 Filothei
GREECE

Phone: +30 (1) 6854535
Fax: +30 (1) 6840631
EMail: D.Spinellis@senanet.com

 


【訳注】

(1)  “Content-transfer-encoding:” の値に “BASE64 | Quoted-Printable” と指定されているが、これは BASE64 か Quoted-Printable かのいずれかを指定するという意味である。

 



2007年06月02日公開
2008年04月06日更新
Translated by: Mendoxi (面独斎)
mendoxi@cam.hi-ho.ne.jp