Распределенная система хранения CEPH

CEPH — распределенная система хранения, которая обеспечивает как файловый, так и блочный интерфейсы доступа.

CEPH позволяет организовать отказоустойчивое и масштабируемое хранилище очень большого размера. Отказоустойчивость обеспечивается механизмами репликации — копии данных одновременно хранятся на нескольких узлах хранения и данные не теряются даже при выходе из строя одного или нескольких узлов. Масштабируемость достигается за счёт возможности добавления новых узлов и механизмов автоматической перебалансировки кластера.

По сути, CEPH можно рассматривать как набор узлов, по которым распределяются данные, причём все данные обычно хранятся в трёх и более копиях на разных узлах.  Если из строя выходит какой-то узел, то CEPH «видит» поломку и «понимает», что теперь некоторые данные теперь хранятся в количестве копий, недостаточном для обеспечения надежности, после чего CEPH автоматически создаёт нужное количество копий данных на «живых» узлах. Если же в кластер добавляются новые узлы или возвращаюся в строй ранее сломанные, то CEPH перераспределяет данные на новые узлы и оптимизирует утилизацию оборудования.

В своей работе мы используем CEPH для организации надёжного хранения большого количества данных.

Тематические технологии:

Колоночная СУБД Scylla
Колоночная СУБД Cassandra
PostgreSQL — объектно-реляционная СУБД
Поисковая система ElasticSearch
СУБД Redis
Kubernetes
Хранилище Memcached
Реляционная СУБД MySQL

Cтатьи по теме:

Реляционные базы данных и NoSQL-хранилища
13.03.2019  |  Статьи  —  СУБД  /  хранение данных  /  SQL  /  NoSQL  /  серверное ПО
Базы данных служат для хранения и обработки данных. Бывают реляционные (SQL) и нереляционные (NoSQL) системы управления базами данных.
Ускоряем работу сайта: используем Redis для кеширования и хранения данных
Redis — сетевое журналируемое хранилище данных типа «ключ — значение», которое обрабатывает данные в оперативной памяти и обладает механизмами снимков и журналирования для обеспечения постоянного хранения. Хранилище поддерживает работу с пятью типами данных: со строками, списками, хешами, обычными и сортируемыми множествами.
Быстрый поиск на сайте, используя ElasticSearch или Sphinx
Sphinx и ElasticSearch — это поисковые «движки», которые обеспечивают более быстрый поиск и фильтрацию по сравнению с реляционными базами данных, а также обеспечивают возможность использования многих полезных функций поиска, например, учитывают морфологию языка, осуществляют фасеточный поиск, работают со стоп-словами, обеспечивают выборочную индексацию и позволяют производить настройку формулы определения релевантности документов.
Ускоряем работу сайта при помощи кеширования на базе Memcached
Memcached — это хранилище «ключ => значение», использование которого очень эффективно для ускорения работы сайта или веб-приложения.
MongoDB — документо-ориентированная база данных (NoSQL)
MongoDB — это NoSQL хранилище данных, крайне удобное для хранения информации, которая не может быть нормально структурирована в рамках реляционных баз данных.
MySQL — система управления базами данных
MySQL — это реляционная система управления базами данных с открытым исходным кодом. В настоящее время эта СУБД одна из наиболее популярных в веб-приложениях — подавляющее большинство CMS использует именно MySQL (часто только её, без альтернатив), а почти все веб-фреймворки поддерживают MySQL уже на уровне базовой конфигурации (без дополнительных модулей).
MariaDB — система управления реляционными базами данных
MariaDB — ответвление реляционной СУБД MySQL, разрабатываемое сообществом под лицензией GPL. MariaDB полностью совместима с приложениями, использующими MySQL, а переход на эту СУБД оправдан тем, что MySQL уже не так активно развивается.