H. Nussbacher
Israeli Inter-University
Computer Center
December 1993
Network Working Group
Request for Comments: 1556
Category: Informational

Handling of Bi-directional Texts
in MIME

(MIME における双方向テキストの取り扱い)

このメモの位置づけ

このメモはインターネット・コミュニティーのために情報を提供するものであり、いかなる種類のインターネット標準も定めない。 このメモの配布に制限はない。

要旨

この文書では、MIME の双方向テキストで用いられる「方向」というキーワードに関し、その形式と構文とについて説明する。

解説

MIME 規格 (RFC 1521 および 1522) は、標準の RFC822 電子メール・システムを介して非 ASCII データを送る方法を定義している。 具体的には、Content-type フィールドに対し、アラビア語 (ISO-8859-6) やヘブライ語 (ISO-8859-8) など、ISO のあらゆる言語の指定が許されている。 問題は、これら 2 つの言語が右から左へ読まれ、しかも同一行にヘブライ語と英語とが混在するような双方向のデータがありうることである。

さいわい、ECMA (European Computer Manufacturers Association、ヨーロッパ電子計算機工業会) がすでにこの問題に取り組み、"Handling of Bi-Directional Texts" (双方向テキストの取り扱い) という技術報告を出している。 それは ECMA TR/53 と呼ばれ、ECMA-48 規格を更新するためのものであったが、その ECMA-48 は、特別な「迅速手続き」のもとに採択された ISO/IEC 6429 の土台となったものである。 その ECMA TR/53 の情報に基づき、双方向メッセージが暗黙モードで符号化されているのか明示モードで符号化されているのかを示す新たな文字集合を定義しようというわけである。 デフォルトは視覚モードで、その場合は ISO-8859 ですでに定義されている標準の文字集合以外の特別な文字集合は必要ない。

双方向性サポートのための新たな文字集合は、たとえば次のようになる。

Content-type: text/plain; charset=ISO-8859-6-e
Content-type: text/plain; charset=ISO-8859-6-i
Content-type: text/plain; charset=ISO-8859-8-e
Content-type: text/plain; charset=ISO-8859-8-i

末尾の i は暗黙 (implicit) モードを表わし、e は明示 (explicit) モードを表わす。

暗黙モード

暗黙の方向性は、文字の種類や隣接する文字との相対的な位置、さらに文字の初期の方向に従い、アルゴリズムによって方向を決定する提示方法である。 完全なアルゴリズムは非常に複雑であり、それを実装しようという向きは ECMA の技術報告を参照すべきである。

明示モード

明示的方向性は、方向決定のための制御シーケンスをテキスト中に挟み込むことにより、明示的に方向を規定する提示方法である。 この提示方法は ECMA TR/53 においても定義されているものであり、そこでは新たに 3 つの制御機能が定義され、ECMA-48 規格の既存の 22 の制御機能が更新されている。

視覚モード

視覚的方向性は、初期の表示方向のみに従って、つまり左から右へテキストを表示する提示方法である。 テキストはすべて、初期の表示方向により、同一方向に表示される。 表示アプリケーションは、内容の方向を意識せず、あたかも単一方向のテキストであるかのごとくテキストを表示する。 出力アプリケーションは、正しく表示されるような方法でテキストを準備する必要がある。 データをどのように表示すべきかを決めるための制御文字やアルゴリズムは使用されない。 これは最も単純な方法であり、かつ MIME により符号化されたテキストにデフォルトで用いられる方法である。

参考文献

[ECMA TR/53] Handling of Bi-Directional Texts, European Computer Manufacturers Association, 114 Rue du Rhone, CH-1204, Geneva, Switzerland, June 1992.
[ISO-6429] Information Technology - Control Functions for Coded Character Sets, 3rd edition, December 15, 1992.
[ISO-8859] Information Processing -- 8-bit Single-Byte Coded Graphic Character Sets, Part 6: Arabic alphabet, ISO 8859-6, 1988.
[ISO-8859] Information Processing -- 8-bit Single-Byte Coded Graphic Character Sets, Part 8: Latin/Hebrew alphabet, ISO 8859-8, 1988.
[RFC822] Crocker, D., "Standard for the Format of ARPA Internet Text Messages", STD 11, RFC 822, UDEL, August 1982.
[RFC1521] Borenstein N., and N. Freed, "MIME (Multipurpose Internet Mail Extensions) Part One: Mechanisms for Specifying and Describing the Format of Internet Message Bodies", RFC 1521, Bellcore, Innosoft, September 1993.
[RFC1522] Moore K., "MIME Part Two: Message Header Extensions for Non-ASCII Text", RFC 1522, University of Tennessee, September 1993.

セキュリティーに関する考慮事項

セキュリティーの問題はこのメモでは議論しない。

著者連絡先

Hank Nussbacher
Computer Center
Tel Aviv University
Ramat Aviv
Israel

Fax: +972 3 6409118
Phone: +972 3 6408309
EMail: hank@vm.tau.ac.il

 



2007年04月22日公開
2008年04月06日更新
Translated by: Mendoxi (面独斎)
mendoxi@cam.hi-ho.ne.jp