An Adaptive Query Execution System for Data Integration

Ives, Zachary G; Florescu, Daniela; Friedman, Marc; Levy, Alon; Weld, Daniel S

An Adaptive Query Execution System for Data Integration

dc.contributor.author	Ives, Zachary G
dc.contributor.author	Florescu, Daniela
dc.contributor.author	Friedman, Marc
dc.contributor.author	Levy, Alon
dc.contributor.author	Weld, Daniel S
dc.date	2023-05-17T00:44:36.000
dc.date.accessioned	2023-05-22T13:12:03Z
dc.date.available	2023-05-22T13:12:03Z
dc.date.issued	1999-06-01
dc.date.submitted	2007-06-11T12:17:07-07:00
dc.description.abstract	Query processing in data integration occurs over network bound, autonomous data sources. This requires extensions to traditional optimization and execution techniques for three reasons: there is an absence of quality statistics about the data, data transfer rates are unpredictable and bursty, and slow or unavailable data sources can often be replaced by overlapping or mirrored sources. This paper presents the Tukwila data integration system, designed to support adaptivity at its core using a two-pronged approach. Interleaved planning and execution with partial optimization allows Tukwila to quickly recover from decisions based on inaccurate estimates. During execution, Tukwila uses adaptive query operators such as the double pipelined hash join, which produces answers quickly, and the dynamic collector, which robustly and efficiently computes unions across overlapping data sources. We demonstrate that the Tukwila architecture extends previous innovations in adaptive execution (such as query scrambling, mid-execution re-optimization, and choose nodes), and we present experimental evidence that our techniques result in behavior desirable for a data integration system.
dc.description.comments	Postprint version. Copyright ACM, 1999. This is the author's version of the work. It is posted here by permission of ACM for your personal use. Not for redistribution. The definitive version was published in SIGMOD 1999, Volume 28, Issue 2, June 1999, pages 299-310. Publisher URL: http://portal.acm.org/citation.cfm?id=304209&coll=portal&dl=ACM&CFID=21037932&CFTOKEN=45900175 NOTE: At the time of publication, the author Zachary G. Ives was affiliated with the University of Washington. Currently June 2007, he is a faculty member of the Department of Computer and Information Sciences at the University of Pennsylvania.
dc.identifier.uri	https://repository.upenn.edu/handle/20.500.14332/8771
dc.legacy.articleid	1028
dc.legacy.fulltexturl	https://repository.upenn.edu/cgi/viewcontent.cgi?article=1028&context=db_research&unstamped=1
dc.source.issue	25
dc.source.journal	Database Research Group (CIS)
dc.source.peerreviewed	true
dc.source.status	published
dc.title	An Adaptive Query Execution System for Data Integration
dc.type	Presentation
digcom.contributor.author	isAuthorOfPublication\|email:zives@cis.upenn.edu\|institution:University of Pennsylvania\|Ives, Zachary G
digcom.contributor.author	Florescu, Daniela
digcom.contributor.author	Friedman, Marc
digcom.contributor.author	Levy, Alon
digcom.contributor.author	Weld, Daniel S
digcom.identifier	db_research/25
digcom.identifier.contextkey	313451
digcom.identifier.submissionpath	db_research/25
digcom.type	conference
dspace.entity.type	Publication
relation.isAuthorOfPublication	2ed74aa5-1c6d-4c69-8716-f2134575f50c
relation.isAuthorOfPublication.latestForDiscovery	2ed74aa5-1c6d-4c69-8716-f2134575f50c
upenn.schoolDepartmentCenter	Database Research Group (CIS)

Files

Original bundle

Now showing 1 - 1 of 1

Name:: adaptive_exec.pdf
Size:: 185.32 KB
Format:: Adobe Portable Document Format

Download

Collection

Presentations

An Adaptive Query Execution System for Data Integration

Files

Original bundle

Collection

Usage statistics

Penn's Heritage