Репликация автономного развертывания HBase 0.2

Насколько мне известно, текущая стабильная версия HBase 0.2 не поддерживает репликацию, хотя она встроена в следующая версия.

Как бы вы порекомендовали реплицировать автономное (нераспределенное) развертывание HBase (0.2)?

Я хочу, чтобы вторичный экземпляр использовался в качестве рабочей резервной копии, т.е. только для чтения. Я могу позволить себе асинхронное резервное копирование с «согласованностью в конечном итоге» и небольшим количеством потерь (данные некритичны).

До сих пор моей единственной мыслью было вручную обновить вторичный экземпляр асинхронно после записи в первичный экземпляр.


person Joel    schedule 11.01.2011    source источник


Ответы (1)


HBase изначально допускает сбой/отказоустойчивость узла (при условии, что вы работаете в HDFS), поэтому на самом деле нет необходимости поддерживать реплику, как в случае с РСУБД.

Что плохого в том, чтобы просто использовать репликацию HDFS?

РЕДАКТИРОВАТЬ: В этом случае вы должны переключиться с автономного на распределенный и иметь только 2 узла с коэффициентом репликации 2.

person Chris Shain    schedule 11.01.2011
comment
Спасибо. Означает ли коэффициент репликации два, что данные дублируются на обеих машинах? - person Joel; 11.01.2011
comment
Оно делает. Как бы то ни было, я думаю, что Hadoop требует 3 машины в кластере, чтобы пережить отказ 1. - person Chris Shain; 11.01.2011