WCHECK - Google、Yahoo日本語分割チェッカー の説明

WCHECKは、GoogleおよびYahooが日本語をどのように認識しているか、単語の区切りを調べるツールです。
貴方の重要キーワードをWCHECKでチェックすると、 新しい発見があるかも知れません。

※ 負荷を抑えるため、短時間の連続利用制限と1日の回数制限が設けてあります。

単語の区切りとは?

検索エンジンはウェブページ内のテキストを単語に区切って処理しますが、 その区切り方は必ずしも適切なものとは限りません。

例えば、「シティホテル」というキーワードの場合、Googleはこれを 「シティ」「ホテル」という2つの単語と正しく認識します。 「東京のシティホテル」というサイトは、 「シティ」を含まない 「東京」+「ホテル」という検索キーワードでも検索にヒットします。 これは、期待通りの結果です。

一方、「シティーホテル」というキーワードの場合、Googleはこれを 「シティーホテル」という1つの単語だと認識します。 「シティーホテル」のみを使用したサイトは、 「ホテル」というキーワードでは、検索にかかりません! 「東京のシティーホテル」というサイトは、 「東京」+「ホテル」という検索キーワードで検索にヒットしません。 これは、期待に反する結果だと思います。

このような「シティホテル」「シティーホテル」の検索エンジン上での違いをあらかじめ知っていれば、 検索数などもふまえてどちらを使うか検討することもできますし、 ウェブページ内で「シティホテル」と「シティーホテル」の両方を使用したり 「ホテル」を単独で使用したりなど、様々な対策が可能になります。

単語区切りの問題は、各検索エンジンで独立して発生します。 各検索エンジンで採用している単語区切り分割の方法(形態素解析といいます)が異なるためです。 単語の区切りの問題はカタカナでよく起こりますが、漢字やひらがななどでも同様に起こります。 自サイトの重要キーワードがどのように区切られるか、あらかじめ調べておくことをお勧め致します。 Google、Yahooが単語の区切りを正しく認識していない場合は、使用するキーワードを変えたり、 自分で単語間にスペースを入れてGoogle、Yahooに正しく認識させるなどの対策が必要です。

注) Googleにおいて「シティーホテル」が1単語と認識される現象は現在は改善されたようです。 いずれの検索エンジンもより正しい単語区切りを行うように日々進化しておりますので、 いずれこのような現象は無くなっていくと思われます。 しかしカタカナの商品名など、 新しいキーワードの場合は将来もこの問題が継続して発生すると思われますので、1度チェックしてみてください。

どうぞご利用ください

もし不具合などがあった場合は修正しますのでお気軽にお問い合わせください