AuthorityBased Keyword Search in Databases 2008619 kosuke 1
Authority-Based Keyword Search in Databases 2008/6/19 kosuke 1
Authority Transfer Data Graph に従う が与えられるとObject. Rankは authority transfer data graphを得る authority transfer data graph : authority transfer rate : Out. Degはノードuから e. Gfの出ている本数 12
Inverse Object. Rank specificity(キーワードに対して特有か) 例 「sort」というキーワードに対して specificity低 specificity高 17
Index作成アルゴリズム • システムのObject. Rank Execution moduleでは、 DAをうけとり、Object. Rank Indexを作成する • Object. Rank Indexの作成アルゴリズム – 一般的な アルゴリズム (任意のauthority transfer data graph DAの場合) – DAG アルゴリズム (DAがdirected acyclic graph(DAG)、”almost” DAGである場合) 処理時間が短い 27
Keyword-Specific Ranking デフォルトのObject. Rankとグローバルランキングアルゴリズムを比較 DBLPで「OLAP」と「XML]というそれぞれのキーワードで比較 DBLP キーワード スコア Object. Rank Global ranking OLAP 7 1 XML 5 3 COMSOCで「CDMA」と「UWB」というそれぞれのキーワードで比較 COMSOC キーワード スコア Object. Rank Global ranking CDMS 4 1 UWB 5 0 35
キーワードの重みの調整効果 と DBLP キーワード スコア nomalizing exponent使用 使用しない XML AND Index 6 2 XML AND Query 6. 5 1. 5 COMSOC キーワード Diversity combining スコア nomalizing exponent使用 3. 5 使用しない 1. 5 38
Textbook’s Bibliographyにおいて 教科書(RamakrishnanとGehrke 2003)の章タイトルに対応する11個の質問を評価 A-S: authoritative-specific 良質 質問との関連大 specificity A-NS: authoritative-nonspecific 良質 質問との関連小 not specificity 以下の表は質問結果のA-S数とA-NSの数を示す 40
Object. Rank Excution module General Object. Rank Algorithm thresholdの値によるObject. Rank indexの格納スペース(下図) • thresholdが小さいと Indexサイズは大きい • thresholdによって処 理時間は変わらない 44
アルゴリズムの違いによるインデクッス作成時間 DBLP 1000で 2つのアルゴリズムで比較 • General Object. Rank( • almost-DAG • algebraic version • Page. Rank version Genaral アルゴリズムより almost-DAGの方がはやい 47
- Slides: 49