6. Устранение неисправностей
Ошибка генерации оффлайн запроса на предоставление лицензии:
Проблема: при выполнении команды ./setup/activate-lic-server.sh --generate-offline
появляется ошибка:
ERR Missing file path for offline activation request file! Specify path using ‘--offline-request’ option.
Решение: убедитесь, что в файле ./setup/settings.env
указаны ключ лицензии в переменной LIC_KEY
и адрес сервера лицензий в переменной LIC_SERVER_URL
.
Ошибка установки пакетов Docker, Kubernetes и Helm
Проблема: при выполнении команды скрипта on_premise/setup/install-packages.sh
появляется ошибка:
E: Sub-process /usr/bin/dpkg returned an error code (1)
Решение 1: ошибка может быть вызвана поврежденной базой данных dpkg. В этом случае выполните перенастройку пакетного менеджера dpkg с помощью команды:
$ sudo dpkg --configure -a
Решение 2: если ошибки появляются во время установки пакетов ПО, можно принудительно установить пакет, используя аргумент -f
:
$ sudo apt install -f
OR
$ sudo apt install --fix-broken
Аргументы -f
и --fix-broken
равноценно используются для исправления зависимостей, нарушенных в результате прерванной загрузки пакета.
Решение 3: Если предыдущие два решения не помогли устранить проблему, попробуйте удалить или стереть проблемный пакет ПО, выполнив команду:
$ sudo apt remove --purge package_name
Решение 4: вы также можете вручную удалить все файлы, связанные с проблемным пакетом, выполнив команду, указанную ниже. Файлы находятся в директории /var/lib/dpkg/info
.
$ sudo ls -l /var/lib/dpkg/info | grep -i package_name
После просмотра списка файлов перенесите их в папку /tmp
:
$ sudo mv /var/lib/dpkg/info/package-name.* /tmp
Также удалить файлы вручную можно с помощью команды:
$ sudo rm -r /var/lib/dpkg/info/package-name.*
Ошибка с nvidia-device-plugin при проверке элементов кластера
Проблема: при выполнении команды kubectl get all --all-namespaces
появляется ошибка:
Error: failed to start container "nvidia-device-plugin-ctr": Error response from daemon: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy'
nvidia-container-cli: initialization error: nvml error: driver/library version mismatch: unknown
Решение:
- Для получения информации о вашей видеокарте и доступных драйверах выполните следующую команду:
ubuntu-drivers devices
- В выводе консоли указано, что в системе установлена видеокарта «GeForce GTX 1050 Ti», а рекомендуемый драйвер — «nvidia-driver-515».
== /sys/devices/pci0000:00/0000:00:10.0 ==
modalias : pci:v000010DEd00001C82sv00001458sd00003764bc03sc00i00
vendor : NVIDIA Corporation
model : GP107 [GeForce GTX 1050 Ti]
manual_install: True
driver : nvidia-driver-510-server - distro non-free
driver : nvidia-driver-450-server - distro non-free
driver : nvidia-driver-390 - distro non-free
driver : nvidia-driver-520 - distro non-free
driver : nvidia-driver-418-server - distro non-free
driver : nvidia-driver-515-server - distro non-free
driver : nvidia-driver-515 - distro non-free recommended
driver : nvidia-driver-510 - distro non-free
driver : nvidia-driver-470-server - distro non-free
driver : nvidia-driver-470 - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
- Для установки рекомендуемого (recommended) драйвера выполните команду:
sudo apt install nvidia-driver-515
- После установки драйвера вы можете просмотреть состояние видеокарты с помощью инструмента мониторинга
nvidia-smi
:
- Посмотреть версию драйвера можно с помощью команды:
cat /proc/driver/nvidia/version
Ошибка при развертывании платформы в кластере
Проблема: при выполнении команды ./setup/deploy.sh
появляется ошибка:
Решение: запросите лог db-dep
с помощью команды:
kubectl logs -f <full name of pod>
Если отображается ошибка о неверных имени базы данных или авторизационных данных, повторно разверните кластер (См. п. 2.1).
Ошибка при загрузке образов во внешний registry
Проблема: При загрузке образов возникает ошибка:
The push refers to repository [<DOCKER_REGISTRY_SERVER>/<IMAGE>]
Get "<DOCKER_REGISTRY_SERVER>/v2/": x509: certificate signed by unknown authority
Решение: Добавьте или измените файл /etc/docker/daemon.json
и добавьте ваш DOCKER_REGISTRY_SERVER в список
insecure-registries:
{
"insecure-registries" : [ "<DOCKER_REGISTRY_SERVER>" ]
}
Перезапустите docker-service
, выполнив следующую команду:
$ sudo systemctl restart docker
Проблема с кэшированием всей памяти системы, на которой установлена OMNI Platform
Проблема: Во время установки, работы и масштабирования OMNI Platform может возникнуть ситуация, когда вся оставшаяся память рабочей системы закэширована.
Решение: В данном случае буфером/кэшем управляет ОС, а не платформа. Кэшированная память не используется другими приложениями, но при необходимости ОС выделит ее, уменьшив размер буфера.
Недостаточный процент детектируемых лиц
Проблема: Процент лиц, детектируемых платформой, может быть недостаточным для реализации конкретного сценария использования. Решение: В данном случае требуется настроить параметры используемого детектора (увеличить порог детекции и минимальный и максимальный размеры детектируемого лица).
Для этого остановите платформу, откройте файл on_premise/deploy/values.yaml
и добавьте в блок env
следующую строку:
FACE_SDK_PARAMETERS: "{\\"score_threshold\\": 0.7, \\"min_size\\": 150, \\"``max_size\\": 10000}"
, где:
score_threshold - порог детекции, от 0 до 1. Чем выше значение порога, тем больше лиц способен распознать детектор;
min_size , max_size - минимальный и максимальный размер лица для детекции в пикселях.