3章で考えた検索範囲決定法に従って, 表3でとりあげた3つのサイトに対して 試行実験を行った.ここでは,次のような評価条件を採用した.
検索結果数が1件以上あり,かつ,なるべく100件を越えないこと. 例えば,検索結果が,30000,3000,300,30,3となるような5種類の 検索範囲があれば,検索結果数が30になる場合と3になる場合が 望ましい検索条件とする. 同様に,30000,3000,300,0,0となる場合がある時には, 検索結果数が300となる場合を望ましい検索条件とする.
まず,住所を日本中からランダムに100箇所抽出し, 深さを変えながら,各サイトに対して検索を行い, 検索結果数を調べ,評価条件に合致する住所の深さを調べた.
一方,職業別電話帳のデータを用いて情報分布データベースを作成し, 表2のサンプルを その情報分布と比較し,各サイト毎にリソース係数の平均を算出し, 3章で考えた検索範囲決定法に従い, 検索結果数の予測を行って,100箇所について検索範囲を決定した.
これらを基に, 従来法に相当する深さ固定の検索範囲決定法を用いた場合, 提案手法を用いた場合のそれぞれについて, 評価条件を満たす検索結果が得られた 割合を調べたのが表3である. 例えば,深さ1固定,つまり常に住所は都道府県名までのみの住所を 検索条件とした場合,サイトAでは 3%,サイトBでは57%,サイトCでは39%であった.
なお,サイトCはそもそも100件を越えると検索結果数過大で 検索実行を拒否するような挙動を示し,また,検索結果数も常にあまり 多くは得られないため,サイトCについてのみ評価条件中の 上限値を100件ではなく,20件に設定した.
表3から, 提案手法を用いて情報分布を考慮して検索範囲を決定した方が 有効であると言える.
サイトA | サイトB | サイトC | |
深さ1固定 | 3 % | 57 % | 39 % |
深さ1.5固定 | 4 % | 55 % | 2 % |
深さ2固定 | 62 % | 57 % | 55 % |
深さ3固定 | 29 % | 7 % | 7 % |
深さ4固定 | 29 % | 1 % | 1 % |
提案手法 | 64 % | 63 % | 76 % |