6 декабря 2022

Сообщаем о выходе новой версии гиперконвергентной системы Кибер Инфраструктура 5.0

В новой версии продукт получил функциональные улучшения, а именно поддержку:


Гостевых операционных систем: Альт, РЕД ОС, РОСА, Astra Linux, Windows Server 2022 и других;

Облачных QCOW образов с cloud-init, что позволяет развернуть решение в популярных облачных сервисах, таких как Yandex Cloud и VK Cloud;

Межрегиональной репликации (CRR) в S3.

Версия 5.0.1

Дата выхода: 1 ноября 2022

Обзор
В этом выпуске Кибер Инфраструктура предоставляет поддержку большего количества гостевых ОС, в том числе отечественных, а также исправления ошибок и улучшения. Улучшения охватывают важные исправления для основного хранилища, хранилища резервных копий и объектного хранилища. Добавлены облачные QCOW образы с поддержкой cloud-init, образ V2V-appliance для миграции ВМ из Vmware и других гипервизоров, образы VMDK для VMware и VHDX для Hyper-V. Добавлен шаблон виртуальных машин OVA.

Новые образы QCOW и приложение для Yandex Cloud со скриптами инициализации cloud-init позволяют перенести локальное хранилище в надежное облако.

Список протестированного оборудования расширен до 523 моделей серверов и содержит информацию о популярности использования отдельных компонентов серверов (сетевых устройств, контроллеров, дисков, процессоров и т.д.) для планирования совместимых и эффективных конфигураций кластеров.

Улучшена производительность системы и оптимизировано управление ресурсами. Увеличено количество шлюзов по-умолчанию для интерфейса хранилища S3.

Что нового

Облачные вычисления и хранение

Добавлены облачные QCOW образы с поддержкой cloud-init.
Добавлен образ V2V-appliance для миграции ВМ из Vmware и других гипервизоров.
Добавлены образы VMDK для VMware и VHDX для Hyper-V.
Добавлен шаблон виртуальных машин OVA.
Новые образы QCOW, а также приложение для Yandex Cloud со скриптами инициализации cloud-init, позволяют перенести локальное хранилище в надежное облако.

Сервер управления

Добавлены параметры для управления процессом резервирования базы данных панели управления:
MANAGEMENT_NODE_BACKUP_FAILURE_DOMAIN,
MANAGEMENT_NODE_BACKUP_REDUNDANCY_TYPE,
MANAGEMENT_NODE_BACKUP_REDUNDANCY_NORM,
MANAGEMENT_NODE_BACKUP_REDUNDANCY_MIN.
Улучшена производительность системы и оптимизировано управление ресурсами.

Безопасность

Возможность интеграции с внешними поставщиками идентификационных данных. Системные администраторы могут конфигурировать процесс авторизации пользователей в панели администратора и самообслуживания через внешних поставщиков идентификационных данных, поддерживающих OpenID Connect протокол (например, Active Directory Federation Serviсes). Федеративные пользователи автоматически переносятся на группы локального домена на основе атрибутов их идентификационного провайдера. Перечень доступных для федеративных пользователей действий определяется назначенной для доменной группы ролью.

Мониторинг и оповещения

Обновлен процесс мониторинга. Добавлены метрики и оповещения для процесса обновления, что помогает системным администраторам удаленно отслеживать статус обновления и обновлять мультикластер до последней версии к запланированному времени.
Дополнительные оповещения для мониторинга кластера. В панели администратора доступно больше оповещений по мониторингу кластера через встроенный в Прометеус и Менеджер Оповещений инструментарий мониторинга. Новые оповещения охватывают объектное хранилище, основное хранилище и сетевую инфраструктуру.
Кроме того, Менеджер Оповещений можно сконфигурировать для отправки уведомлений через внешние системы, такие как PagerDuty.

Объектное хранилище

Поддержка межрегиональной репликации (cross-region replication – CRR) S3. Пользователи S3 могут управлять S3-совместимым CRR API от Amazon для асинхронного копирования объектов между корзинами из разных кластеров публичных облачных провайдеров.
Увеличено количество шлюзов по умолчанию на один публичный интерфейс. Это количество регулируется параметром OSTOR_DEFAULT_NGW_PER_IFACE в конфигурационном файле бэкенда.

Пользовательский интерфейс

Поддержка групп пользователей. Возможность добавить пользователя в доменную группу для упрощенных управления разрешениями и назначения проектов.

Служба вычислений

Добавлена поддержка таких гостевых систем как Windows Server 2022, AlmaLinux и Rocky Linux.
Добавлена поддержка отечественных гостевых систем: Astra Linux Common Edition 2.12, Astra Linux Common Edition 2.11, Astra Linux Special Edition 1.6, Astra Linux Special Edition 1.5, РЕД ОС 7, Альт Сервер 10, Альт Сервер 9, Альт Рабочая станция 10, Альт Рабочая станция 9, РОСА Хром, РОСА Кобальт, РОСА Fresh 12, РОСА Fresh 11.
VPN как сервис для пользователей панели самообслуживания.
Основанная на доступности ресурса QoS политика для дисков виртуальных машин.
Поддержка кластеров Kubernetes версии 1.22.
Улучшения для размещений:
Размещения для типов ВМ в панели администратора.
Фильтрация Типов ВМ по размещениям.

Совместимость с оборудованием

Список протестированного оборудования расширен до 523 моделей серверов и содержит информацию о популярности использования отдельных компонентов серверов (сетевых устройств, контроллеров, дисков, процессоров и т.д.) для планирования совместимых и эффективных конфигураций кластеров.

Важные заметки

Георепликация S3 несовместима с межрегиональной репликацией. Пользователи S3 не могут использовать межрегиональную репликацию в том случае если в панели администратора уже включена функция геопрепликации между кластерами.

Исправленные проблемы

[AI-426] Оптимизирован размер логов S3
[AI-84] Исправлена стохастическая проблема с добавлением новых узлов в кластер S3
[AI-336] Исправлен скрипт восстановления панели из резервной копии
[AI-240] Исправлена проблема с установкой системы при наличии только двух дисков (в экспертном режиме)
[AI-217] Отсутствует возможность управления лицензиями кластера через vinfra
[AI-122] Не работает отправка отчета о сбое при возникновении проблемы
[AI-345] Отчет о сбое может помешать отправке CEP отчета в некоторых случаях
[AI-139] Некоторые записи в журнале проверок не переведены на русский
[AI-102] Ошибки 'Слишком много открытых файлов' и '1024 worker_connections недостаточно для соединения' в nginx на больших нагрузках в некоторых сценариях использования
[AI-60] Не работает отправка email уведомлений
[AIP-50067] Исправлено ложное оповещение «Используется файл подкачки»
[AIP-51196] Исправлено ложное оповещение «Место на диске заканчивается», появляющееся для диска с ролью "кэш" после массового назначения роли "хранилище" для диска.
[AIP-51171] Список типов ВМ пустой в момент создания ВМ, если существуют более 100 типов ВМ.
[AIP-50943] Авторизация через сторонних поставщиков идентификационных данных (third-party IdP) завершается ошибкой, если в хранилище ключей поставщика идентификационных данных находится множественный ключ.
[AIP-50815] Нет возможности создать сервис высокой доступности, если обновление загружено, но не установлено.
[AIP-50472] Изменения для более удобного создания доменного юзера через vinfra.
[AIP-50314] Для настройки оповещений по SMTP данные пользователя не обязательны.
[AIP-50248] Нет возможности использовать шестнадцатиричные PCI адреса с буквами в конфигурационном файле виртуального видеоускорителя (vGPU.)
[AIP-50141] Исправлена причина появления ошибки "Конфликтующее имя поставщика ресурсов".
[AIP-49906] Исправлена работа с лимитами для размещений.
[AIP-49458] Вход ноды в режим обслуживания может завершиться ошибкой, хотя на других нодах есть достаточное количество ресурсов для эвакуации сервисов.
[AIP-47111, AIP-48869] Исправлен неправильный размер архива в некоторых случаях.
[AIP-49719, AIP-49700, AIP-49499, AIP-51249, AIP-51639, AIP-51232, AIP-51125, AIP-50968, AIP-50915, AIP-50725, AIP-50627, AIP-50251] Улучшения стабильности и производительности.
[AIP-50690] Для статистики использования S3 объектов возвращается json файл с невалидными данными.
[AIP-50626] Разные сервисы хранилища могут не перезапуститься из-за взаимной блокировки в обработчике сигналов.
[AIP-50277, AIP-50725, AIP-50726, AIP-50968] Исправления стабильности для хранилища резервных копий и объектного хранилища.
[AIP-48487] После смены уровня хранения данных в настройках резервных копий основного хранилища существующие блоки данных не перемещаются на новый уровень.
[AIP-48302] В панели админстратора не удается переместить вторичное хранилище резервных копий в основное в конфигурации с георепликацией.
[AIP-48008] Зависание процесса перекодировки приводит к невозмжности создания резервной копии.
[AIP-47980] Для старых файлов закодированных стиранием (erasure-coded) в отчетах указан неожиданно большой физический размер.
[AIP-47884] Ошибка о превышении лимитов не дает создать резервную копию данных.
[AIP-47538] В результате применения команды 'vstorage-abgw-register' ломаются реплики данных в 'certs' и 'conf.d' каталогах.
[AIP-47111] Вывод ‘du’ комманды содержал некорректный физический размер резеврной копии.
[AIP-44468] Нельзя игнорировать оповещение.

Известные проблемы, планируемые к исправлению

[AIP-43249] На кластере, где был выключен сервис резервного копирования основного хранилища на долгое время, отсутствует георепликации основного хранилища.
[AIP-44422] Панель администратора становится неактивной если S3 сервис недоступен.
[AIP-44604] Сервис бэкенда не запускается, если сетевой интерфейс узла с виртуальным ip-адресом панели управления переназначен на другую сеть.
[AIP-47918] Нельзя удалить файлы резервных копий из облачного хранилища в том случае, если лимит хранения равен 0.
[AIP-46936] Сервис докера неожиданно останавливается после падения процесса 'vstorage-mount'.
[AIP-43314] Нельзя запустить обновление узла управления из-за непонятной ошибки "Обновление до разных версий продукта".
[AIP-36155] Диск не распознается как твердотельный накопитель (SSD) в случае управления специфичным контроллером дисков.
[AIP-47633] Разные значения доступной для использования оперативной памяти показываются в списке узлов и подробной информации об узле.
[AIP-38492] Образ для Microsoft Azure не позволяет использовать спецсимволы в пароле.

Как получить версию программы

Вы можете обновить Кибер Инфраструктуру с версии 4.7 до версии 5.0.1 в разделе НАСТРОЙКИ> ОБНОВЛЕНИЕ панели администратора. Для завершения обновления требуется перезагрузка. Обновленные узлы будут перезагружены автоматически по одному. Во время перезагрузки служба хранилища и панель администратора могут быть недоступны в конфигурациях кластера без избыточности служб или данных.

Не весь новый функционал может быть доступен после обновления. Для полного обновления необходимо после обновления через панель управления переустановить последовательно все узлы кластера с помощью любого из предложенных образов или обратиться в техподдержку.
Рассказать друзьям: