TED - pierwsza rozproszona baza danych

Wyobraź sobie bazę danych znajdującą się na kilku serwerach stojących powiedzmy w Londynie, Warszawie, Moskwie, Tokio i San Francisco. Nie synchronizowane bazy danych znajdujące się na różnych serwerach, nie kopie tej samej bazy.

Rozproszona geograficznie baza danych - to ma sens
Rozproszona geograficznie baza danych - to ma sens123RF/PICSEL

- Przez ostatnie 15 lat próbowano rozwiązać problem rozproszonych baz danych. Nasze rozwiązanie jest wyjątkowe - to naprawdę baza danych, której dane znajdują się w różnych lokalizacjach - powiedział wiceprezes TransLattice, Louise Funke.

Celem przyświecającym założonej w 2007 roku firmie, było stworzenie bazy danych, która mogłaby być dostępna cały czas, niezależnie od tego w jakim stanie znajdują się jej fragmenty. Bazy danych, która nie miałaby centralnego serwera i mogłaby sama odbudowywać stracone fragmenty danych. Taka hydra, której niestraszne są trzęsienia ziemi, powodzie oraz awarie elektrowni prądu. Ale jak to ma działać w praktyce?

Dane są dzielone w zależności od trzech czynników. Pierwszym jest polityka danej instytucji, która może sobie nie życzyć tego, by pewne dane znalazły się w węźle znajdującym się w konkretnym kraju. Drugim czynnikiem jest historia dostępu do danych - zostaną one przerzucone tam gdzie najczęściej się z nich korzysta. Trzecim czynnikiem jest losowość - dane nigdy nie będą znajdowały się tylko na jednym węźle. Dane znajdują się więc zawsze na kilku węzłach, ale nigdy nie na wszystkich. Aktualnie baza danych TED może składać się z 12 węzłów, ale TransLattice pracuje nad tym, by w przyszłości zwiększyć ich liczbę.

Największym problemem, przed którym stanęli inżynierowie kalifornijskiej firmy, było opracowanie algorytmów, które zapewniłyby dostęp do danych z każdego węzła, nie zajmując jednocześnie całej przepływności łącz tylko i wyłącznie na zapewnienie komunikacji i przesyłanie danych pomiędzy węzłami. Wewnętrzna komunikacja pomiędzy węzłami bazy danych nie mogła zabić funkcjonalności.

- Nasz system jest wyjątkowy - monitorujemy komunikację pomiędzy węzłami by mieć dane na temat łącz i ich wykorzystania, więc kiedy system decyduje o przeniesieniu danych, przenoszone są one tam, gdzie się z nich korzysta. Potrafimy rozmieścić je tak, by osiągnąć maksymalną efektywność - dodał Funke.

Firma zapewnia, że nowy węzeł można uruchomić w ciągu 20 minut a, po podpięciu do sieci, pozostałe rozpoznają go i w ciągu kilku następnych minut, TED zacznie zapełniać go danymi.

Pierwsi użytkownicy już dziś korzystają z baz danych TED. Użytkownicy z rodzaju tych, o których publicznie mało się mówi. Funke zdradza tylko, że mają "wielu klientów z sektora publicznego, związanych z obroną i wywiadem." Ale nie tylko wywiad byłby zainteresowany tego typu bazami danych. Duże instytucje finansowe czy międzynarodowe korporacje również mogą skorzystać z tego rozwiązania. Wygląda więc na to, że trzy lata pisania algorytmów zwrócą się TransLattice z nawiązką.

gizmodo.pl
Masz sugestie, uwagi albo widzisz błąd?
Dołącz do nas