Create  Edit  Diff  FrontPage  Index  Search  Changes  Login

Anthy辞書

個人用辞書を作る (anthy-dic-tool)

準備

$HOME/.anthy 以下 (じゃなくてもいいけど) に、個人用辞書の元ファイルを適当な名前で作る (一応、600 なアクセス権も設定しておいたり)。

$ anthy-dic-tool --dump > $HOME/.anthy/private-dic.src
$ chmod 600 $HOME/.anthy/private-dic.src

最初は個人用辞書は空なので、当然空のファイルができるんじゃないかと思いきや、シンプルな説明が書かれたファイルが出力されます。

こんなの↓

anthy/src-util/dic-tool-usage.txt - view - 1.2 http://cvs.m17n.org/viewcvs/anthy/anthy/src-util/dic-tool-usage.txt?view=markup

※ この説明文は、単語を登録した後に anthy-dic-tool --dump しても、常にファイルの先頭についてきます。

そんで、このファイルを好きなエディタで開き、登録したい単語を追加します。

単語の追加

名詞 (一般名詞)、副詞、人名、地名、形容詞の 5 種類を登録できます。

  • 1 行目は共通です。まず変換前の文字列を、つづいて 1 から ? [FIXME] の数字で頻度を、最後に変換後の文字列を指定します。
  • 2 行目では、上記 5 種 名詞、副詞、人名、地名、形容詞 の中から該当する品詞を指定します。
  • 3 行目以降 (人名、地名、形容詞にはありません) では、それぞれの条件に合致するかどうかを y (合致する) または n (合致しない) で指定します。~
  • 最後に空行を追加します (必須)。

名詞 (一般名詞) のフォーマット

よみ 頻度 単語
品詞 = 名詞
な接続 = y/n
さ接続 = y/n
する接続 = y/n
語幹のみで文節 = y/n
格助詞接続 = y/n
  • "格助詞" というのは、俗にいう "てにをは" のことです。

副詞のフォーマット

よみ 頻度 単語
品詞 = 副詞
と接続 = y/n
たる接続 = y/n
する接続 = y/n
語幹のみで文節 = y/n

人名のフォーマット

よみ 頻度 単語
品詞 = 人名

地名のフォーマット

よみ 頻度 単語
品詞 = 地名

形容詞のフォーマット

よみ 頻度 単語
品詞 = 形容詞

登録

個人用辞書の元ファイルに単語を追加したら、それを実際に登録します。

$ cat $HOME/.anthy/private-dic.src | anthy-dic-tool --load

これで OK。 登録先ファイルは $HOME/.anthy/last-record2_default です。

またあとで登録したい単語ができたら、再度元ファイルを編集して cat $HOME/.anthy/private-dic.src | anthy-dic-tool --load します。

補遺

以上に書いてあることは、このファイルに書いてます(^^;

anthy/doc/DICUTIL - view - 1.6 ttp://cvs.m17n.org/cgi-bin/viewcvs/anthy/doc/DICUTIL?rev=1.6&cvsroot=anthy&content-type=text/vnd.viewcvs-markup

読めばわかるように、 cat <<EOF | anthy-dic-tool --append とかでもいけます。

なお、--personality=name というオプションは、まだ anthy.el や jmode が対応していないとのことです。 http://pc.2ch.net/test/read.cgi/linux/1033193724/215

おかしなところなどビシバシ直してください。

Last modified:2010/06/27 02:30:02
Keyword(s):
References: