September 26, 2006

Lingua::JA::Hepburn::Passport でヘボン式ローマ字変換

ひらがな/カタカナからヘボン式ローマ字に変換するモジュール をリリースしました。

同じようなことをするモジュールは Lingua::JA::Romaji, Linguua::JA::Romanize::Kana, Text::Kakasi といろいろあるんですが、日本の外務省パスポートのルール にあるヘボン式に則ったものは1個もなかったので車輪の再発明。

  use utf8;
  use Lingua::JA::Hepburn::Passport;

  my $hepburn = Lingua::JA::Hepburne::Passport->new;
  $hepburn->romanize("みやがわ");     # MIYAGAWA
  $hepburn->romanize("おおの");       # ONO
  $hepburn->romanize("かとう");       # KATO
  $hepburn->romanize("ゆうこ");       # YUKO
  $hepburn->romanize("なんば");       # NAMBA
  $hepburn->romanize("はっちょう");   # HATCHO

  # Indicate long vowels by "h"
  my $hepburn = Lingua::JA::Hepburne::Passport->new( long_vowels_h => 1 );
  $hepburn->romanize("おおの");       # OHNO
  $hepburn->romanize("かとう");       # KATOH

みたいにつかいます。long_vowels_h をつけるとオオ・オウの長音に H をつけるようになる。

Posted by miyagawa at September 26, 2006 10:48 PM | Permalink | Comments (2) | TrackBack(0)
Comments

一応KAKASI開発側としても正則なヘボン式に
対応していないことは把握していまして
(なぜかフランス人に指摘されました)、
今のCVS HEADでは直っているはずです。早く
新しいリリースを出そうと思いつつ、まったくもって
進んでいません。すいません。

Posted by: knok on September 27, 2006 04:59 PM

my $hepburn = Lingua::JA::Hepburne::Passport->new;

↑ s/Hepburne/Hepburn/;
コピペして動かしてみて気づきました...

Posted by: taku on October 22, 2007 12:41 PM
Trackbacks
TrackBack URL for this entry: http://blog.bulknews.net/mt3/mt-tb.cgi/2018
Post a comment