Toggle menu
Toggle personal menu
Not logged in
Your IP address will be publicly visible if you make any edits.

Bigtable

From ZeroWiki
Revision as of 12:01, 5 August 2011 by imported>rabierre

[[pagelist(^Bigtable/*)]]

구글의 분산 데이터베이스 Bigtable 분석하고 설계하기

등록

신규 TS는 chubby에 자신의 정보를 등록한다

  • 기능명세
    1. chubby에 자신의 정보를 등록한다
    2. 자신의 ip
    3. 또뭐?
  • 비기능명세
    1. TS 시작시에 등록한다. 등록에 성공하지 못하면 다시 시도한다.
    2. 재시도할 때 마다 시간간격 늘림
    3. 일정횟수 이상시 멈춤(chubby의 부하 고려)

만기

TS는 스스로를 파기하지 않는다.

  • 기능명세
    1. 없음
  • 비기능명세
    1. 없음
== 태블릿 할당 ==
    • 기능명세
    • 신규 TS에 태블릿 할당하기 : 가장 load가 많은 TS의 태블릿을 신규 TS에게 할당한다
    • 마스터 역할
      1. 신규TS(target) 탐지시
      2. load가 가장 많은 TS(source)를 찾는다.
      3. source에게 target의 ip와 전달할 태블릿개수 넘김.
    • TS 역할
      1. source는 target에게 정해진 갯수만큼의 태블릿을 리스트로 이름전달
      2. target에게서 제대로 전달받았는지 확인 (ISSUE. target이 제대로 전달받았는지 어떻게 알지?)
      3. 자신의 태블릿 리스트에서 전달한 태블릿들을 삭제
      4. 마스터에게 전달 성공 메세지 보냄
    • 로드 밸런싱 : 가장 load가 적은 TS에게 가장 load가 많은 TS의 태블릿을 할당.
      • 마스터 역할
      1. 가장load가 큰 TS(source)와 가장load가 적은 TS(target)와의 차이가 일정수준 이상일때
      2. source 에게 target의 ip와 전달할 태블릿의 개수를 전달
    • TS 역할
      1. 소스 TS
      2. source는 target에게 정해진 갯수만큼의 태블릿을 리스트로 이름전달 ( 연속된 태블릿을 전달한다)
      3. 자신의 태블릿 리스트에서 전달한 태블릿들을 삭제
      4. target에게서 제대로 전달받았는지 확인 (ISSUE. target이 제대로 전달받았는지 어떻게 알지?)
      5. 마스터에게 전달 성공 메세지 보냄
      6. 타겟TS
      7. 전달받은 태블릿 리스트로 태블릿들을 읽어온다
      8. 소스 TS에게 성공 메세지 보냄
  1. ISSUE. 로드 밸런싱 트리거는?
  2. TS혼자서 커버할 수 있는 정도의 태블릿양도 클러스터 기준의 밸런싱이 필요한가?
  3. 태블릿의 개수로 트리거 설정?
  4. cpu와 메모리 사용량도 트리거에 포함될 수 있다.
    1. cpu와 메모리 사용량이 많으면 태블릿을 split한다?
  5. ISSUE. 메타데이터 태블릿 갱신이슈
  6. 갱신 누가? -> 마스터가?
  7. 갱신 언제? -> 마스터 업데이트 후에?
  8. 마스터 업데이트
  9. 로드 밸런싱 중간에 target이 다운된다면?
  10. 로드 밸런싱 중간에 source가 다운된다면?

ISSUE 4. 소스TS는 전달할 태블릿을 어떻게 정할 것인가. ISSUE 5. 태블릿의 이동 후 메타테이블의 갱신은?

  • 비기능명세


클라이언트의 요청응답

  • 기능명세
    • read
    • 클라이언트 역할
    1. B+트리에서 원하는 row를 가지고 있는 TS를 탐색
    • TS역할
    1. 클라이언트의 ROW의 읽기 요청이 들어온다 (ISSUE 6. 클라이언트는 어떤 형식으로 TS에게 ROW를 요청할 것인가)
    2. TS는 자신이 가진 태블릿들에서 요청받은 ROW를 검색
    3. 검색결과들을 merge한다.
    4. String의 리스트로 클라이언트에게 돌려준다
    • write
    • 클라이언트 역할
      1. (태블릿은 같은 ROW를 담고 있으므로 클라이언트는 트리탐색을 통해 TS를 할당받는다)
클라이언트에게 요청받은 row는 먼저 커밋로그에 기록 후 memtable에 쓴다. 
  • 비기능명세


커밋로그

클라이언트의 write요청 시 memtable에 쓰기 전에 커밋로그에 먼저작성. 커밋로그는 GFS에 있으며 TS당 한개.

  • 기능명세
  • 비기능명세


Compaction

Minor Compaction

  • memtable이 일정 수준보다 커지면 SSTABLE로 변환. GFS에 쓴다.

Major Compaction

  • SSTABLE들을 합병하여 최근 기록만을 남긴다.

ISSUE 8. Minor/Major Compaction 시기?

  • 기능명세
  • 비기능명세


Split

  • 태블릿의 크기가 일정 수준 이상 커지면 두개로 나눈다.

ISSUE 9. 태블릿을 나누는 크기는? ISSUE 10. 태블릿을 나눌 때 나눈 태블릿의 이름은? ISSUE 11. 태블릿은 SSTABLE로 이루어져 있다. 태블릿은 어떻게 SSATBLE을 가지고 있나?

  • 기능명세
  • 비기능명세


복구

커밋로그에서 로그를 읽어와 memtable 복구하기

  • 기능명세
  • 비기능명세

태블릿 서버(이하 TS)

Master Server

메타태블릿 갱신