H. Nussbacher
Israeli Inter-University
Computer Center
Y. Bourvine
Hebrew University
December 1993
Network Working Group
Request for Comments: 1555
Category: Informational

Hebrew Character Encoding
for Internet Messages

(インターネット・メッセージのためのヘブライ文字符号化法)

このメモの位置づけ

このメモはインターネット・コミュニティーのために情報を提供するものである。 このメモではいかなる種類のインターネット標準も定めない。 このメモの配布に制限はない。

要旨

この文書では、電子メール [RFC822] でヘブライ文字を転送するのに用いられる符号化法について説明する。 ここで考案した規格は MIME [RFC1521] および ISO-8859-8 を利用している。

解説

ヘブライ語のテキストはすべて、電子メールで転送する場合、まず ISO-8859-8 に変換し、さらに MIME で定義されているように Quoted-Printable (こちらが望ましい) か Base64 のいずれかを使って符号化しなければならない。

次の表に、最も一般的な 4 つのヘブライ文字符号化法を示す。

ヘブライ文字 PC
8-bit Ascii
IBM
EBCDIC
PC
7-bit Ascii
ISO 8859-8
8-bit Ascii
alef アレフ 1284196224
bet ベート 1294297225
gimel ギメル 1304398226
dalet ダレット 1314499227
he ヘー 13245100228
vav ヴァヴ 13346101229
zayin ザイン 13447102230
het ヘット 13548103231
tet テット 13649104232
yod ヨッド 13751105233
kaf sofit カフ・ソフィート 13852106234
kaf カフ 13953107235
lamed ラメッド 14054108236
mem sofit メム・ソフィート 14155109237
mem メム 14256110238
nun sofit ヌン・ソフィート 14357111239
nun ヌン 14458112240
samekh サメフ 14559113241
ayin アイン 14662114242
pe sofit ペー・ソフィート 14763115243
pe ペー 14864116244
tsadi sofit ツァディ・ソフィート 14965117245
tsadi ツァディ 15066118246
qof コフ 15167119247
resh レーシュ 15268120248
shin シン 15369121249
tav タヴ 15471122250

注意 — EBCDIC の列が 16 進数であるのを除き、値はすべて 10 進数の ASCII である。

ISO 8859-8 8-bit ASCII は IBM コードページ 862 としても知られている。

テキストのデフォルトの方向性は視覚的である。 すなわち、ヘブライ語のテキストは (右から左への方向で入力された場合であっても) 左から右への方向で符号化され、標準の MIME 機構を介して左から右への方向で伝送される。 方向性を制御する他の方法もサポートされており、そちらは RFC 1556 "Handling of Bi-directional Texts in MIME" (MIME における双方向テキストの取り扱い) によって補完される。

電子メールにおけるヘブライ語に関する議論はすべて、他の TCP/IP プロトコルにおけるヘブライ語についての議論と同様、メーリング・リスト ilan-h@vm.tau.ac.il で話し合われている。 登録するには、次のような一行のテキストのメールを listserv@vm.tau.ac.il 宛てに送ればよい。

subscribe ilan-h firstname lastname

MIME に関する考慮事項

ヘブライ語のメールには、最小限、以下の MIME ヘッダーが含まれていなければならない。(1)

MIME-Version: 1.0
Content-type: text/plain; charset=ISO-8859-8
Content-transfer-encoding: BASE64 | Quoted-Printable

利用者は、各行の先頭に ">" を入れることで引用を示すようなメールを可能にするため、テキストを 72 カラム以内に保つべきである。 利用者はまた、すべての MIME 実装が引用のあるメールを正しく扱うとは限らず、したがって引用のあるヘブライ語のメールが問題を引き起こすかもしれないということも認識しておくべきである。

将来、すべての電子メール・システムが RFC 1425 および RFC 1426 で定義されているような 8 ビット透過なメールを完全に実装したとき、この規格の一部は廃止されることになろう。 "Content-type:" フィールドは依然として必要とされるであろうし、方向性もやはり必要だろう (これは 8BIT では暗黙のことかもしれないが、今後議論することである) が、"Content-transfer-encoding" は Base64 や Quoted-Printable ではなく 8BIT を使うように変更されることになろう。

任意事項

メール・ヘッダーにおけるヘブライ文字の符号化を RFC 1522 で定められているとおりにサポートすることは、必須ではないが、推奨される。 具体的には、インターネット・メールのヘッダーにおいて、ヘブライ文字を符号化するのに用いられるデフォルトの方法は Q 符号化形式であるべきであり、B 符号化方法ではない。

警告

イスラエル内では、40 を超える数の Listserv メーリング・リストが会話の一部にヘブライ語を使い始めている。 通常、Listserv が配布リストから配信するメールには「短縮」ヘッダーが用いられており、余分な MIME ヘッダーは含まれていない。 そのため、MIME による符号化がそのまま残されてしまい、復号をおこなうユーザー・エージェントはメールを解釈することができなくなる。 利用者は各自で Listserv のメールの送付の仕方をカスタマイズすることができる。 ヘブライ語を用いるメーリング・リストの場合、利用者は Listserv に対し次のコマンドを伴うメールを送るべきである。

set listname full

ここで listname は、full すなわちヘッダーが省略されないよう要求するメーリング・リストの名称である。 これによって利用者個人のエントリーが更新され、そのリストからのメールはそれ以降、MIME ヘッダーを含む完全な RFC822 ヘッダーを伴うようになる。

加えて、Listserv はふつう、リストに対するすべての投稿が自動的に保管されるアーカイブを保守している。 それらのアーカイブは "listname LOGyymm" というファイルに格納されているが、MIME ヘッダーは含まれていないため、符号化情報はすべて失われてしまうことになる。 これは Listserv ソフトウェアの制限事項である。

以下は Quoted-Printable で符号化した短いヘブライ語の電子メールの例である。

Date:         Sun, 06 Jun 93 15:25:35 IDT
From:         Hank Nussbacher <HANK@VM.BIU.AC.IL>
Subject:      Sample Hebrew mail
To:           Hank Nussbacher <Hank@BARILVM>,
              Yehavi Bourvine <yehavi@hujivms>
MIME-Version: 1.0
Content-Type: Text/plain; charset=ISO-8859-8
Content-Transfer-Encoding: QUOTED-PRINTABLE

The end of this line contains Hebrew            .=EC=E0=F8=F9=E9 =F5=
=F8=E0=EE =ED=E5=EC=F9


Hank Nussbacher                                  =F8=EB=E1=F1=E5=
=F0 =F7=F0=E4

謝辞

Rafi Sadowsky と Nathaniel Borenstein の両氏には、その多大なる援助に対し、深く感謝する。

参考文献

[ISO-8859] Information Processing -- 8-bit Single-Byte Coded Graphic Character Sets, Part 8: Latin/Hebrew alphabet, ISO 8859-8, 1988.
[RFC822] Crocker, D., "Standard for the Format of ARPA Internet Text Messages", STD 11, RFC 822, UDEL, August 1982.
[RFC1425] Klensin, J., Freed N., Rose M., Stefferud E., and D. Crocker, "SMTP Service Extensions", RFC 1425, United Nations University, Innosoft International, Inc., Dover Beach Consulting, Inc., Network Management Associates, Inc., The Branch Office, February 1993.
[RFC1426] Klensin, J., Freed N., Rose M., Stefferud E., and D. Crocker, "SMTP Service Extension for 8bit-MIME Transport", RFC 1426, United Nations University, Innosoft International, Inc., Dover Beach Consulting, Inc., Network Management Associates, Inc., The Branch Office, February 1993.
[RFC1521] Borenstein N., and N. Freed, "MIME (Multipurpose Internet Mail Extensions) Part One: Mechanisms for Specifying and Describing the Format of Internet Message Bodies", RFC 1521, Bellcore, Innosoft, September 1993.
[RFC1522] Moore K., "MIME Part Two: Message Header Extensions for Non-ASCII Text", RFC 1522, University of Tennessee, September 1993.

セキュリティーに関する考慮事項

セキュリティーの問題はこのメモでは議論しない。

著者連絡先

Hank Nussbacher
Computer Center
Tel Aviv University
Ramat Aviv
Israel

Fax: +972 3 6409118
Phone: +972 3 6408309
EMail: hank@vm.tau.ac.il

Yehavi Bourvine
Computer Center
Hebrew University
Jerusalem
Israel

Phone: +972 2 585684
Fax: +972 2 527349
EMail: yehavi@vms.huji.ac.il

 


【訳注】

(1)  “Content-transfer-encoding:” の値に “BASE64 | Quoted-Printable” と指定されているが、これは BASE64 か Quoted-Printable かのいずれかを指定するという意味である。

 



2007年04月29日公開
2008年04月06日更新
Translated by: Mendoxi (面独斎)
mendoxi@cam.hi-ho.ne.jp