중복제거는 서로 다른 데이터들 간에 중복되는 부분을 검출해내고 백업 데이터 저장 시
중복된 부분을 제거한 후 저장하는 기술로 스토리지 활용의 효율성을 높입니다.
쉽게 말해 중복된 데이터를 찾아 제거하는 것을 의미합니다.
중복된 데이터를 제거하면서 저장되는 데이터의 크기가 줄어들어 스토리지 비용 절감
및 백업 속도 향상의 효과를 기대할 수 있습니다.
중복제거 방식에는 크게 2가지 방식이 있습니다.
1. 대상(Target) 중복 제거는 대상 스토리지에서 진행되는 중복제거를 말합니다.
소스에 부하 없이 진행되기때문에 운용이나 복구 속도에 지장을 주지 않습니다.
2. 소스 중복 제거는 백업 클라이언트에서 진행되는 중복제거를 말합니다.
클라이언트에서 작업을 한 후 백업 서버로 보내 작업을 처리합니다.
타켓으로 전송되는 데이터양을 감소 시키고 전반적인 백업 속도를 향상시킬 수
있습니다.
또한 중복제거가 진행되는 시기에 따른 방법이 2가지로 나눠집니다.
1. 저장소에 기록하기 전에 중복제거하는 방법으로는 인라인 중복제거가 있습니다.
중복제거 된 데이터가 저장되기 때문에 데이터 저장소를 효율적으로 사용 할 수 있습니다.
백업 시 중복되는 데이터를 제거하기 때문에 네트워크 및 디스크의 부하를 낮출 수 있다는 장점이 있습니다.
하지만 중복제거가 백업 즉시 진행되기 때문에 데이터 복구 시 데이터 복원 작업으로 인한 시간이 소요될 수 있습니다.
2. 저장소의 임시 영역에 기록한 후 중복제거하는 방법으로는 후처리 중복제거가 있습니다.
중복제거를 예약된 시간에 진행할 수 있고, 복구 시 임시 영역에 복구가 필요한 데이터가 있는 경우 단시간에 복구를 진행할 수 있다는 장점이 있습니다.
다만 임시 영역을 사용하기 때문에 충분한 여유 공간이 필요하며, 복제 작업 시 중복제거가 완료될 때까지 복제가 지연됩니다.
그렇다면 중복제거는 왜 하는 것 일까요?
기업이 관리해야 하는 데이터가 급증하는 요즘 방대한 데이터를 최소한의 비용으로
유지 및 관리하기 위해서 중복제거는 백업에서 빼놓을 수 없는 중요한 기술입니다.
데이터 중복제거 기술로 빠른 데이터 백업과 복구가 가능해져 데이터 보호 업무 효율이
향상되었고 백업 데이터의 평균 보관 주기도 늘어나게 되었습니다.
이상으로 중복제거에 대해 알아보았습니다.