忍者ブログ
HOME > > [PR] > 雑記 > IME=お馬鹿 払拭できるか  

 当ブログは移転しました。まもなく移動します。

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

マイクロソフトは10月20日、「Office IME 2007」の修正プログラムを公開し、
かな漢字変換の精度や学習機能を向上させた。
IMEのページで無料でダウンロードできる。適用すると今までの学習情報は削除される。

私はATOKを使っていますので到底関係のない話ではあるが、
そもそもなぜATOKを入れたのか。
IME使いの方も多くいるかと思いますのでこの場で話させて頂く。
はっきり理由を言うと「変換精度が極度に悪い」
日本の仮名漢字変換の元祖とも言える文章「貴社の記者が汽車で帰社した」は
辞書にあるようなのか一発で変換することが出来る。
しかし、ランダムな長文になってくるとひどいほどの誤変換が起きてくる。
後で比較の方はやってみたいところだが、
正直ATOKに乗り換えて「よかった」と思う場面が極端に多い。
特に私のようなブログで長文を書くような人にとっては、もってこいである。
ニュース記者などでは、ATOKは欠かせない存在だろう。
締めの時間に間に合うか間に合わないかが、
全て日本語入力ソフトにかかっているのだから。

実際、変換精度が低いというのはATOKを使ってみて分かったことであり、
IMEを使ってイライラしている人が物は試しにと軽い気持ちでATOKを使ってみると、
手放せなくなったという例がほとんどである。
文字の打ち間違い、文法上の誤りなど、根本的なミスがない限り、
ATOKはどのような文章でも90%以上の確率で正しい漢字に変換する。

ここで、ATOKと(今回の更新の対象となった)Office IME2007の比較をしてみよう。
※基本的にどちらも同じ環境、スペックとする。
※IME2008、Office2007(パッチ未適用)を随時切り替えて行う。
※完全正答とし、他の部分の未変換、誤変換なども含む。
※以下の文章の変換内容が辞書にない状態を一回目とする。
※以下の文章を入力してスペースキーを押し、一回目の結果を記録する。
※学習効果を確かめるために、一度正しい結果にしてエンターキーを押し、
もう一度同じ文章を入力して変換した物を二回目とする。
※どちらとも予測変換を有効とする。

以下に実験結果を掲載したのでご覧頂きたい。
なお、赤文字が正答です。
文章 ATOK一回目 ATOK二回目 IME一回目 IME二回目 勝負
てきせいをつかむには、てきせいなはんだんがひつようだ。 適正をつかむには、適正な判断が必要だ。 適性をつかむには、適正な判断が必要だ。 適性をつかむには、適正な判断が必要だ。 なし IME
かんじかんじかんじであらわす。 漢字漢字漢字で表す。 幹事感じ漢字で表す。 感じ幹事漢字で表す。 感じ感じ漢字で表す。
(以降学習せず)
ATOK
しゅうしゅうしたでーたのしゅうしゅうがつかない。 収集したデータの収拾付かない。 収集したデータの収拾つかない。 収集したデータの収集がつかない。 収集したデータの収拾がつかない。 ATOK
しんきかくをかくりつさせるかくりつはひくい。 新規格を確立させる確率は低い。 なし 新企画確立させる確率は低い。 新規格を確立させる確率は低い。 ATOK
もくひょうのだいいちだんいちだんをとることだ。 目標の第一弾一弾を捕ることだ。 目標の第一弾一段を取ることだ。 目標の第一弾一段とることだ。 目標の第一弾一段取ることだ。 IME
文章にもよると思うが、
どちらかというと事務系の文章を変換するのにはATOKが有利である。
専門用語の辞書が多いので、その分専門的な文章を書いた際の誤変換は少なくなる。
また、思い通りの変換が出来るという点でもATOKは有利である。
まさに「日本語のプロセッサ(頭脳)」を持っているかのごとく、賢い変換をする。
それがATOKである・・・

宣伝のようになってしまったが、早速実験結果の分析をしていこう。
どれも同音異義語を使った日常ではまず使わない
厳しめの文章を舞台にしてみたが、どちらのソフトも頑張ってくれた。
どちらのソフトも学習能力は高いものの、再起動後まで
結果を保持するかどうかは確認していないのでその辺は他の気づいた方にお任せしたい。
一つ気になるのは「幹事が感じを漢字で表す。」
この漢字の組み合わせも多く使う物ではないので無理矢理と言ってはなんだが、
IMEの変換結果がまた面白い。
最初は「感じ」が主語で本来形容詞は主語にはならないのでこの時点で文法違反。
英語でも主語+動詞+名詞(基本文)・・・などとなっているように、
どれも主語から始まるのが大抵である。
また、IMEで変換中に一部の文章では何度変換してエンターを押して学習させても、
学習しない(=辞書に反映されない)部分があり、
このような現象はまずATOKではあり得ない。

このように、文法の決まりを汲み取った上で構築されていなければ、
誤変換が起こる元となってしまうのである。

これらの実験によって、今後私の辞書に妙な変換結果がでてくるかもしれないが、
それはこの時の実験の偏りと言うことで少し気も楽になる。

日本語入力ソフトを今回は3つの観点から評価したいと思う。
なお、以下の評価は上の結果を客観的に評価した物であり、一切私的な考えは入れていない。
日本語入力ソフト 実質的な変換能力 学習能力 文節判別能力 総合
ATOK 9/10 10/10 7/10 26/30
IME 6/10 6/10 9/10 21/30

結論として、未だにIMEはATOKから日本語入力ソフトの座を奪うことは出来ていない。
使用者は多いのかもしれないが。
IME=実質無料というソフトだが、無料だけに変換精度が低いというのは話にならない。
無料だからこそ、努力できる物があり、実のなる物があると思う。
IMEユーザーでもあるが、ATOKユーザーでもある。
もしIMEの変換精度が我々を驚かせるほどに向上した日には、
他の人がIMEに乗り換えるという「IME旋風」が起こることもあり得るだろう。

追記:Office 2007に付属しているIMEではない
つまり「Vista付属のIME」の一回目の変換結果を追記します。
・適正をつかむには、適正な判断が必要だ。(OfficeIMEの一回目よりひどい)
・感じが感じを漢字で表す。(OfficeIMEの二回目以降に相当)
・収集したデータの収拾がつかない。(一発変換)
・新企画を確立させる確率は低い。(OfficeIMEの一回目に相当)
・目標の第一弾は一段をとることだ。(Office IMEの一回目に相当)
この結果を見るとどうも、二つのIMEでは
変換精度や方法が微妙に異なることが分かります。
いっそのこと、統一してしまえばいいのに。
そもそも、OfficeにIME入れる必要あるか?(本音)
postこの記事にコメントする(コメント欄のみ必須)
お名前
コメント
パスワード   Vodafone絵文字 i-mode絵文字 Ezweb絵文字
この記事へのトラックバック
この記事にトラックバックする:
[458]  [456]  [454]  [453]  [451]  [450]  [410]  [409]  [387]  [365]  [361
ぷろふ
名前:
yama
一言:
関東在住。PC歴10年超。自作も得意。最新技術はぬかりなく追いかけます。ブログ王 人気ブログ
問合せはこちら
こめんと
[08/28 名前未設定]
[08/22 通りすがり]
[07/24 名前未設定]
振り返る日常 Produced by yama
日めくりカレンダーBLUE Designed by がりんぺいろ
忍者ブログ [PR]
PR