1 2 3 1 1 2 3 1

  • Slides: 18
Download presentation
局所性鋭敏型ハッシュを 用いたコードクローン検出の ためのパラメータ決定手法 ○徳井翔梧 1 吉田則裕 2 崔恩瀞 3 井上克郎1 1大阪大学 2名古屋大学 3奈良先端科学技術大学院大学 1 Software Engineering

局所性鋭敏型ハッシュを 用いたコードクローン検出の ためのパラメータ決定手法 ○徳井翔梧 1 吉田則裕 2 崔恩瀞 3 井上克郎1 1大阪大学 2名古屋大学 3奈良先端科学技術大学院大学 1 Software Engineering Laboratory, Department of Computer Science, Graduate School of Information Science and Technology, Osaka University

類似探索アルゴリズム[3] • ハッシュテーブル 特徴ベクトル集合 … … クエリの 近傍ベクトル STEP 4 -2 … クエリの 特徴ベクトル

類似探索アルゴリズム[3] • ハッシュテーブル 特徴ベクトル集合 … … クエリの 近傍ベクトル STEP 4 -2 … クエリの 特徴ベクトル STEP 4 -1 STEP 4 -3 [3]Andoni et al, Practical and Optimal LSH for Angular Distance, In NIPS'15. http: //www. mit. edu/~andoni/LSH/ Department of Computer Science, Graduate School of Information Science and Technology, Osaka University クローンペア 類似度 ブロック 特徴 ベクトル ブロックA 0. 95 ブロックB 8

 • 全てのクローンペア LSHを用いて 求めたペア 検出漏れのペア 9 Department of Computer Science, Graduate School of

• 全てのクローンペア LSHを用いて 求めたペア 検出漏れのペア 9 Department of Computer Science, Graduate School of Information Science and Technology, Osaka University

研究概要 • 再現率 類似探索時間 近傍点を増加させる 上がる 長くなる 近傍点を減少させる 下がる 短くなる 10 Department of Computer

研究概要 • 再現率 類似探索時間 近傍点を増加させる 上がる 長くなる 近傍点を減少させる 下がる 短くなる 10 Department of Computer Science, Graduate School of Information Science and Technology, Osaka University

FALCONNのハッシュ関数 特徴ベクトル STEP A STEP B 例: 11 Department of Computer Science, Graduate School

FALCONNのハッシュ関数 特徴ベクトル STEP A STEP B 例: 11 Department of Computer Science, Graduate School of Information Science and Technology, Osaka University

 • 12 Department of Computer Science, Graduate School of Information Science and Technology,

• 12 Department of Computer Science, Graduate School of Information Science and Technology, Osaka University

STEP Ⅰ 探索時間[s] 50 1 0. 9 0. 8 0. 7 0. 6 0.

STEP Ⅰ 探索時間[s] 50 1 0. 9 0. 8 0. 7 0. 6 0. 5 0. 4 0. 3 0. 2 45 40 35 64 12 8 25 6 51 2 10 24 16 32 8 4 2 30 衝突確率 • LCD 探索時間[s] 衝突確率 13 Department of Computer Science, Graduate School of Information Science and Technology, Osaka University

STEP Ⅱ 1 0. 9 0. 8 0. 7 0. 6 0. 5 1

STEP Ⅱ 1 0. 9 0. 8 0. 7 0. 6 0. 5 1 0. 8 L=1 0 10 20 30 ハッシュテーブルの数(L) 探索時間[s] L=30 0. 6 0. 4 L=5 衝突確率 100 80 60 40 20 0 再現率 探索時間[s] • 0. 2 0 1 0. 8 0. 6 0. 4 0. 2 0 -0. 2 -0. 4 -0. 6 -0. 8 -1 コサイン類似度 再現率 14 Department of Computer Science, Graduate School of Information Science and Technology, Osaka University

評価実験 • 15 Department of Computer Science, Graduate School of Information Science and Technology,

評価実験 • 15 Department of Computer Science, Graduate School of Information Science and Technology, Osaka University

実験結果 Postgre. SQL 10. 1 横井らのパラメータ 本手法 類似探索時間 [s] 65. 64 14. 78 再現率

実験結果 Postgre. SQL 10. 1 横井らのパラメータ 本手法 類似探索時間 [s] 65. 64 14. 78 再現率 0. 931 0. 992 Linux Kernel 4. 14 横井らのパラメータ 本手法 類似探索時間 [s] 1098. 1 334. 73 再現率 0. 896 0. 999 [2]横井 一輝, 崔 恩瀞, 吉田 則裕, 井上 克郎: "情報検索技術に基づくブロッククローン検 出", 情報処理学会研究報告, Vol. 2017 -SE-196, No. 19, pp. 1 -8, 2017/7/20 Department of Computer Science, Graduate School of Information Science and Technology, Osaka University 17

まとめと今後の課題 • 18 Department of Computer Science, Graduate School of Information Science and Technology,

まとめと今後の課題 • 18 Department of Computer Science, Graduate School of Information Science and Technology, Osaka University