こんにちは、滝澤です。
今日も変わらず、アカウント作成業務を実施していた時のこと。
私の業務では、日本語の氏名(姓・名)からメールアドレスを生成しており、
「ヘボン式ローマ字変換」をルールとしています。
手作業でのローマ字変換は手間なのでVBAを検討・調査し、
ローマ字変換までは可能となりましたが、
日本語の氏名(姓・名)からの「ヘボン式ローマ字変換」は目視チェックが必須となってしまいました。
今日は、
「氏名を自動でヘボン式ローマ字変換するのは難しい」について投稿したいと思います。
なぜ、氏名の自動ヘボン式ローマ字変換は難しいのか、
原因はヘボン式ローマ字変換のルールにある「長音」の扱いにあります。
長音ルール :母音の重なりを1文字で表記する。
(例: とおる→TORU 、 おおにし→ONISHI )
たとえば「広岡(ひろおか)」さんをヘボン式ローマ字変換する場合、
そのまま、ルールに沿うと、「hirooka」ではなく「hiroka」となってしまいます。
これは、「hirooka」の「oo」が含まれるためです。
しかしながら、日本語としては「広」「岡」と漢字が分かれるため、「hiro」+「oka」の「hirooka」と作成するのが望ましくあります。
その他の例:
ひろおか | いのうえ | おおにし | とおる | こうじ |
○Hirooka | ○Inoue | ×Oonishi | ×Tooru | ×Kouji |
×Hiroka | ×Inoe | ○Onishi | ○Toru |
○Koji
|
その他の氏名でも上記のように、日本語の区切りを判別して長音を1文字とするか判断する必要があります。
上記以外の方式として、「氏名のパターン」を組み込むこともを検討しましたが、どちらも実現が難しく断念しました。
・「氏名のパターン」を組み込む : パターンが膨大で漏れが発生する
・「日本語の区切りを判別」する : パターンが膨大で漏れが発生する
結論としては、
最低でも氏名を入力するどこか1つのシステムで目視チェックが必要になるという、ありきたりなものになってしまいました。
それではこの辺で失礼します。