Semi Join vs Bloom Join
Semi join ja Bloom join ovat kaksi liitosmenetelmää, joita käytetään hajautettujen tietokantojen kyselyn käsittelyssä. Käsiteltäessä kyselyitä hajautetuissa tietokannoissa, tietoja on siirrettävä eri paikkakunnilla sijaitsevien tietokantojen välillä. Tämä voi olla kallis toimenpide riippuen siirrettävän tiedon määrästä. Siksi, kun kyselyjä käsitellään hajautetussa tietokantaympäristössä, on tärkeää optimoida kyselyt sivustojen välillä siirrettävän tiedon minimoimiseksi. Semi join ja bloom join ovat kaksi menetelmää, joilla voidaan vähentää tiedonsiirron määrää ja suorittaa tehokasta kyselyjen käsittelyä.
Mikä on Semi Join?
Semi join on menetelmä, jota käytetään tehokkaaseen kyselyjen käsittelyyn hajautetuissa tietokantaympäristöissä. Harkitse tilannetta, jossa työmaalla 1 sijaitseva työntekijätietokanta (jossa on tietoja, kuten työntekijän nimi, osaston numero, jossa hän työskentelee jne.) ja osastotietokanta (jossa on tietoja, kuten osaston numero, osaston nimi, sijainti jne.) 2. Jos esimerkiksi haluamme saada työntekijän nimen ja osaston nimen, jossa hän työskentelee (vain "New Yorkissa" sijaitsevissa osastoissa), suorittamalla kyselyn kyselyn prosessorilla, joka sijaitsee paikassa 3, on useita tapoja tietoja voitaisiin siirtää kolmen paikan välillä tämän tehtävän saavuttamiseksi. Tietoa siirrettäessä on kuitenkin tärkeää huomata, että koko tietokantaa ei tarvitse siirtää sivustojen välillä. Vain osa liittämiseen tarvittavista määritteistä (tai monikoista) on siirrettävä sivustojen välillä, jotta kysely voidaan suorittaa tehokkaasti. Puoliliitos on menetelmä, jolla voidaan vähentää sivustojen välillä siirrettävän tiedon määrää. Puoliliitoksessa vain liitossarake siirretään paikasta toiseen ja sitten tätä siirrettyä saraketta käytetään pienentämään lähetettyjen suhteiden kokoa muiden paikkojen välillä. Yllä olevassa esimerkissä voit vain siirtää osastonumeron ja osaston nimen monitoimipaikasta 2 paikkaan 1 ja suorittaa liittämisen paikassa 1 ja siirtää lopullisen suhteen takaisin paikkaan 3.
Mikä on Bloom Join?
Kuten aiemmin mainittiin, bloom join on toinen menetelmä, jota käytetään välttämään tarpeettoman tiedon siirtäminen sivustojen välillä suoritettaessa kyselyitä hajautetuissa tietokantaympäristöissä. Bloom joinissa itse liitossarakkeen siirtämisen sijaan liitospylväästä siirretään kompakti esitys paikkojen välillä. Bloom join käyttää bloom-suodatinta, joka käyttää bittivektoria jäsenkyselyjen suorittamiseen. Ensin rakennetaan liitospilarin avulla bloom-suodatin, joka siirretään kohteiden välillä ja sitten suoritetaan liitostoimenpiteet.
Mitä eroa on Semi Joinilla ja Bloom Joinilla?
Vaikka sekä semi join- että bloom join -menetelmiä käytetään minimoimaan sivustojen välillä siirrettävän tiedon määrä suoritettaessa kyselyitä hajautetussa tietokantaympäristössä, bloom join vähentää siirrettävän datan määrää (monikoiden määrää) verrattuna puoliksi liittyä käyttämällä bloom-suodattimia, jotka käyttävät bittivektoria määrittämään joukon jäsenyydet. Siksi bloom-liitoksen käyttäminen on tehokkaampaa kuin puoliliitoksen käyttäminen.