氏名を自動でヘボン式ローマ字変換するのは難しい

こんにちは、滝澤です。

今日も変わらず、アカウント作成業務を実施していた時のこと。

私の業務では、日本語の氏名(姓・名)からメールアドレスを生成しており、

「ヘボン式ローマ字変換」をルールとしています。

手作業でのローマ字変換は手間なのでVBAを検討・調査し、

ローマ字変換までは可能となりましたが、

日本語の氏名(姓・名)からの「ヘボン式ローマ字変換」は目視チェックが必須となってしまいました。

今日は、

「氏名を自動でヘボン式ローマ字変換するのは難しい」について投稿したいと思います。

なぜ、氏名の自動ヘボン式ローマ字変換は難しいのか、

原因はヘボン式ローマ字変換のルールにある「長音」の扱いにあります。

長音ルール   :母音の重なりを1文字で表記する。

           (例: とおる→TORU 、 おおにし→ONISHI )

たとえば「広岡(ひろおか)」さんをヘボン式ローマ字変換する場合、

そのまま、ルールに沿うと、「hirooka」ではなく「hiroka」となってしまいます。

これは、「hirooka」の「oo」が含まれるためです。

しかしながら、日本語としては「広」「岡」と漢字が分かれるため、「hiro+oka」の「hirooka」と作成するのが望ましくあります。

その他の例:

ひろおか いのうえ おおにし とおる こうじ
Hirooka Inoue ×Oonishi ×Tooru ×Kouji
×Hiroka ×Inoe Onishi ○Toru
○Koji

その他の氏名でも上記のように、日本語の区切りを判別して長音を1文字とするか判断する必要があります。

上記以外の方式として、「氏名のパターン」を組み込むこともを検討しましたが、どちらも実現が難しく断念しました。

 ・「氏名のパターン」を組み込む : パターンが膨大で漏れが発生する

 ・「日本語の区切りを判別」する : パターンが膨大で漏れが発生する

結論としては、

最低でも氏名を入力するどこか1つのシステムで目視チェックが必要になるという、ありきたりなものになってしまいました。

「「氏名を自動でヘボン式ローマ字変換するのは難しい」」

それではこの辺で失礼します。

コメントを残す

名称 *
メールアドレス *
ウェブサイト