Provenance 20190920 maeda 1 Provenance Whereprovenance Howprovenanve Whyprovenance

  • Slides: 9
Download presentation
中間発表 Provenanceについての現状 2019/09/20 maeda 1

中間発表 Provenanceについての現状 2019/09/20 maeda 1

Provenanceとは データの起源がどこにあるかを示すもの • Where-provenance データの出典がどこであるか • How-provenanve どのような操作をしたデータであるか • Why-provenance なぜそのようなデータが存在するか Peter Buneman, Wang-chiew

Provenanceとは データの起源がどこにあるかを示すもの • Where-provenance データの出典がどこであるか • How-provenanve どのような操作をしたデータであるか • Why-provenance なぜそのようなデータが存在するか Peter Buneman, Wang-chiew Tan. 2018. Data Provenance: What next? . ACM SIGMOD Record, Volume 47, Issue 3, September 2018 pages 5 -16, 4

Where-provenance データの出典を表す来歴、具体的には 以下のような情報 • 誰がいつその情報を入力したか • 情報の追加、削除などによる versioning • 参照した情報がどこの値であるか 中間結果を利用するような場合には 特に重要 Profile Friend

Where-provenance データの出典を表す来歴、具体的には 以下のような情報 • 誰がいつその情報を入力したか • 情報の追加、削除などによる versioning • 参照した情報がどこの値であるか 中間結果を利用するような場合には 特に重要 Profile Friend name 1 name 2 name age occupation Ann Bob Ann 32 researcher Carl Bob 40 analyst Frank Dan Carl 38 analyst select f. name 1, f. name 2 from Friend f, Profile p 1, Profile p 2 where f. name 1 = p 1. name and f. name 2 = p 2. name and p 1. occupation = p 2. occupation name 1 name 2 Carl Bob 5

How-provenance どのような操作をしたデータである か、具体的には以下のような情報 • • このタプルは、R 1からのタプルt 1 をR 2からのタプルt 2に結合する ことによって形成された このテーブルはクエリQの実行に よって生成された

How-provenance どのような操作をしたデータである か、具体的には以下のような情報 • • このタプルは、R 1からのタプルt 1 をR 2からのタプルt 2に結合する ことによって形成された このテーブルはクエリQの実行に よって生成された 結果の再現性を保つために必要 Profile Friend name 1 name 2 name age occupation Ann Bob Ann 32 researcher Carl Bob 40 analyst Frank Dan Carl 38 analyst select f. name 1, f. name 2 from Friend f, Profile p 1, Profile p 2 where f. name 1 = p 1. name and f. name 2 = p 2. name and p 1. occupation = p 2. occupation name 1 name 2 Carl Bob 6

Provenanceの最新研究 • Hy. Per 、Lego. Base 、Mem. SQLなどのクエリエンジンがSQLクエリを命令 型の中間(または直接実行可能な)形式にコンパイルするデータ ベースシステム • Why, Where-Provenanceを導出できるようなアプローチを組み込 み済

Provenanceの最新研究 • Hy. Per 、Lego. Base 、Mem. SQLなどのクエリエンジンがSQLクエリを命令 型の中間(または直接実行可能な)形式にコンパイルするデータ ベースシステム • Why, Where-Provenanceを導出できるようなアプローチを組み込 み済 • 関連研究が非常に多い 2016. Mem. SQL MPL. https: //docs. memsql. com/concepts/v 6. 0/ code-generation. (2016). T. Neumann. 2011. Efficiently Compiling Efficient Query Plans for Modern Hardware. In Proc. VLDB. Seattle, USA. 8

Provenanceの最新研究 • VegaliteなどのProvenanceの表現力とセマンティクスを活用して、視 覚化アプリケーションを宣言的に表現および設計したフレームワーク • How-Provenanceがメインであるが、データの扱いに関する Provenanceではなく操作の履歴がメイン • Provenanceの粒度についてはあまり考慮されていない、細かい 粒度を用いる場合はオーバヘッドとパフォーマンスのトレードオフ に Arvind Satyanarayan, Dominik

Provenanceの最新研究 • VegaliteなどのProvenanceの表現力とセマンティクスを活用して、視 覚化アプリケーションを宣言的に表現および設計したフレームワーク • How-Provenanceがメインであるが、データの扱いに関する Provenanceではなく操作の履歴がメイン • Provenanceの粒度についてはあまり考慮されていない、細かい 粒度を用いる場合はオーバヘッドとパフォーマンスのトレードオフ に Arvind Satyanarayan, Dominik Moritz, Kanit Wongsuphasawat, and Jefferey. Heer. 2017. Vega-lite: A grammar of interactive graphics. Transactions on Visualization and Computer Graphics 23, 1 (2017), 341– 350. 9