An adaptive query execution system for data integration

Zachary G Ives,Daniel S Weld,Daniela Florescu,Marc Friedman,Alon Levy

doi:10.1145/304182.304209

Abstract

Query processing in data integration occurs over network-bound, autonomous data sources. This requires extensions to traditional optimization and execution techniques for three reasons: there is an absence of quality statistics about the data, data transfer rates are unpredictable and bursty, and slow or unavailable data sources can often be replaced by overlapping or mirrored sources. This paper presents the Tukwila data integration system, designed to support adaptivity at its core using a two-pronged approach. Interleaved planning and execution with partial optimization allows Tukwila to quickly recover from decisions based on inaccurate estimates. During execution, Tukwila uses adaptive query operators such as the double pipelined hash join, which produces answers quickly, and the dynamic collector, which robustly and efficiently computes unions across overlapping data sources. We demonstrate that the Tukwila architecture extends previous innovations in adaptive execution (such as query scrambling, mid-execution re-optimization, and choose nodes), and we present experimental evidence that our techniques result in behavior desirable for a data integration system.

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

An adaptive query execution system for data integration

Abstract

Talk to us

Similar Papers

Lead the way for us

Publication Date: Jun 1, 1999
Citations: 311	License type: mit

Similar Papers

An adaptive query execution system for data integration
Zachary G Ives ... Daniel S Weld
ACM SIGMOD Record | VOL. 28
Zachary G Ives, et. al.Zachary G Ives ... Daniel S Weld
01 Jun 1999
ACM SIGMOD Record | VOL. 28

Automatic Generation of Query Order Execution Plan for Hybrid Mediator with Medical Sources
Cherrat Loubna ... Essaaidi Mohammed
-
Cherrat Loubna, et. al.Cherrat Loubna ... Essaaidi Mohammed
01 Oct 2011
01 Oct 2011

A minimally-intrusive approach for query-driven data integration systems
Andreas M Wahl
-
Andreas M WahlAndreas M Wahl
01 May 2016
01 May 2016

Data Integration under Integrity Constraints
Andrea Calì ... Diego Calvanese
-
Andrea Calì, et. al.Andrea Calì ... Diego Calvanese
01 Jan 2013
01 Jan 2013

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

An adaptive query execution system for data integration

Abstract

Talk to us

Similar Papers