A Google adatközpontjai főként az Egyesült Államokban található pl. Santa Clara, California és Herndon, Virginia (bár ezt mintha a legutóbbi értesülések szerint felszámolták volna) valamint az amerikai kontinensen kívül olyan helyeken mint pl. Dublin, Írország, stb. Elméletileg a Google minden adatközpont rekordját tudná frissíteni közvetlen, bár ha jobban belegondolunk ez eredménytelen lenne. Tény, hogy minden egyes adatközpont saját IP címmel rendelkezik és az útvonaluk ezen IP címeken keresztül elért, amelyet a DNS kezel.
A DNS a következődképpen dolgozik: az Interneten az adattovábbítások mindig IP címek között történnek. A kapcsolat biztosítása egy IP cím és egy domain között az ún. name server, tehát névszerver feladata. Amikor egy felhasználó beüt a böngészőjébe egy domain nevet (weboldal címet) akkor a névszerver keresi meg azt a megfelelő IP címet amire aztán kapcsolódni kell ahhoz, hogy az adattovábbítás létrejöjjön. Ezt egyébként az emberek miatt találták ki mégpedig azért, hogy a weboldalaknak nevei lehessenek, ugyanis az emberi agy az IP címek digit -jeire nem igazán képes ráállni, azokat megjegyezni. A beállított IP címeket a névszerverek megjegyzik, ennek köszönhető, hogy nem kell mindenegyes alkalommal ezekkel a beállításokkal foglalkozni. Egy domain rekordjai (beállításai) képezi a felelős névszervernél azt, hogy mennyi ideig is legyen meg ez a kapcsolat a domain és az IP cím között. Egyébként ez nem más mint a Time To Live (TTL) azaz egy domain életideje. Amikor a TTL lejár akkor a névfeloldási információkat a kliensek újra megszerzik. Átlagos beállítások esetén a TTL egy vagy akár több nap is lehet. Az IP csomagok fejlécében megtalálható TTL érték a maximális ugrásszámot határozza meg, tehát meghatározza azt az időt ameddig a csomag még továbbküldésre kerülhet. A célállomás felé történő továbbítás során, hogy a csomópontok TTL értéke mindig 1 -el csökken és amikor az eléri a 0 értéket akkor a csomag egyszerűen eldobásra kerül. Ennek köszönhető az, hogy az útválasztási hibák nem okoznak végtelen ciklusokat az Internet "vérkeringésében". A www.google.com domain esetén pl. a névszerver csupán csak 5 percre tudja elmenteni a domain név beállításait, s amikor az 5 perc letelt újra befrissít mindent. Bármikor amikor a Google névszervere újra csatlakozik csupán 1 darab adatközpont IP címét küldi el. Ennek köszönhetően a Google mindig más és más adatközpontokhoz irányított a DNS rekordok által. Adjuk ki nyugodtan a ping parancsot a google bármelyik domain nevére és látni fogjuk, hogy pl. az IP cím amit a ping parancs hatására kaptunk mondjuk 18:56 -kor az már teljesen más lesz 19:01 -kor. Na jó nem teljesen más az első négy szám természetesen mindig egyezni fog mert az a tartomány útvonala de az utolsó négy mindig változni fog. Ez ilyenkor azt jelenti, hogy mindig újabb és újabb adatközpontból kapjuk az adatokat a kereséseinkre.
Hogy miként is áll kapcsolatban a Google a DNS és a Google Tánc az viszonylag könnyen belátható. A Google Tánc alatt az adatközpontok sosem kapják meg az új indexállományt. Az új Google indexállomány továbbított egyik adatközpontról a másikra. Ezért van az, hogy az emberek más más találatokat kapnak a keresőgéptől attól függően, hogy épp melyik adatközpont szolgálta ki a keresést, illetve ha pár perc elteltével megint megpróbálja ugyanazt a keresést elképzelhető, hogy már más rangsorolásban fogja kapni a találatot ugyanarra a kulcsszóra. Ez hát a Google Dance azaz a Google Tánc. A Google Inc. a DNS feltőltését 2003 szeptemberéig saját maga látta el. Ezután ezt a feladatot a keresőgép óriástól átvette és az Akamai Technologies, Inc. és azóta a névszerver feladatait ez a cég látja el. Semmiféleképpen se aggódjuk eme jelenség miatt. Ez természetes velejárója a gigantikus adatbázisoknak.

0 megjegyzés:
Megjegyzés küldése