Перейти к основному содержимому
Версия: 1.12.0

6. Устранение неисправностей

Ошибка генерации оффлайн запроса на предоставление лицензии:

Проблема: при выполнении команды ./setup/activate-lic-server.sh --generate-offline появляется ошибка:

ERR Missing file path for offline activation request file! Specify path using--offline-request’ option.

Решение: убедитесь, что в файле ./setup/settings.env указаны ключ лицензии в переменной LIC_KEY и адрес сервера лицензий в переменной LIC_SERVER_URL.

Ошибка установки пакетов Docker, Kubernetes и Helm

Проблема: при выполнении команды скрипта on_premise/setup/install-packages.sh появляется ошибка:

E: Sub-process /usr/bin/dpkg returned an error code (1)

Решение 1: ошибка может быть вызвана поврежденной базой данных dpkg. В этом случае выполните перенастройку пакетного менеджера dpkg с помощью команды:

$ sudo dpkg --configure -a

Решение 2: если ошибки появляются во время установки пакетов ПО, можно принудительно установить пакет, используя аргумент -f:

$ sudo apt install -f
OR
$ sudo apt install --fix-broken

Аргументы -f и --fix-broken равноценно используются для исправления зависимостей, нарушенных в результате прерванной загрузки пакета.

Решение 3: Если предыдущие два решения не помогли устранить проблему, попробуйте удалить или стереть проблемный пакет ПО, выполнив команду:

$ sudo apt remove --purge package_name

Решение 4: вы также можете вручную удалить все файлы, связанные с проблемным пакетом, выполнив команду, указанную ниже. Файлы находятся в директории /var/lib/dpkg/info.

$ sudo ls -l /var/lib/dpkg/info | grep -i package_name

После просмотра списка файлов перенесите их в папку /tmp:

$ sudo mv /var/lib/dpkg/info/package-name.* /tmp

Также удалить файлы вручную можно с помощью команды:

$ sudo rm -r /var/lib/dpkg/info/package-name.*

Ошибка с nvidia-device-plugin при проверке элементов кластера

Проблема: при выполнении команды kubectl get all --all-namespaces появляется ошибка:

Error: failed to start container "nvidia-device-plugin-ctr": Error response from daemon: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy'
nvidia-container-cli: initialization error: nvml error: driver/library version mismatch: unknown

img.png

Решение:

  1. Для получения информации о вашей видеокарте и доступных драйверах выполните следующую команду:
 ubuntu-drivers devices
  1. В выводе консоли указано, что в системе установлена видеокарта «GeForce GTX 1050 Ti», а рекомендуемый драйвер — «nvidia-driver-515».
 == /sys/devices/pci0000:00/0000:00:10.0 ==
modalias : pci:v000010DEd00001C82sv00001458sd00003764bc03sc00i00
vendor : NVIDIA Corporation
model : GP107 [GeForce GTX 1050 Ti]
manual_install: True
driver : nvidia-driver-510-server - distro non-free
driver : nvidia-driver-450-server - distro non-free
driver : nvidia-driver-390 - distro non-free
driver : nvidia-driver-520 - distro non-free
driver : nvidia-driver-418-server - distro non-free
driver : nvidia-driver-515-server - distro non-free
driver : nvidia-driver-515 - distro non-free recommended
driver : nvidia-driver-510 - distro non-free
driver : nvidia-driver-470-server - distro non-free
driver : nvidia-driver-470 - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
  1. Для установки рекомендуемого (recommended) драйвера выполните команду:
 sudo apt install nvidia-driver-515
  1. После установки драйвера вы можете просмотреть состояние видеокарты с помощью инструмента мониторинга nvidia-smi:

img.png

  1. Посмотреть версию драйвера можно с помощью команды:
 cat /proc/driver/nvidia/version

img.png

Ошибка при развертывании платформы в кластере

Проблема: при выполнении команды ./setup/deploy.sh появляется ошибка:

img.png

Решение: запросите лог db-dep с помощью команды:

 kubectl logs -f <full name of pod>

img.png

Если отображается ошибка о неверных имени базы данных или авторизационных данных, повторно разверните кластер (См. п. 2.1).

Ошибка при загрузке образов во внешний registry

Проблема: При загрузке образов возникает ошибка:

The push refers to repository [<DOCKER_REGISTRY_SERVER>/<IMAGE>]
Get "<DOCKER_REGISTRY_SERVER>/v2/": x509: certificate signed by unknown authority

img.png Решение: Добавьте или измените файл /etc/docker/daemon.json и добавьте ваш DOCKER_REGISTRY_SERVER в список insecure-registries:

{
"insecure-registries" : [ "<DOCKER_REGISTRY_SERVER>" ]
}

Перезапустите docker-service, выполнив следующую команду:

$ sudo systemctl restart docker

Проблема с кэшированием всей памяти системы, на которой установлена OMNI Platform

Проблема: Во время установки, работы и масштабирования OMNI Platform может возникнуть ситуация, когда вся оставшаяся память рабочей системы закэширована.

Решение: В данном случае буфером/кэшем управляет ОС, а не платформа. Кэшированная память не используется другими приложениями, но при необходимости ОС выделит ее, уменьшив размер буфера.

Недостаточный процент детектируемых лиц

Проблема: Процент лиц, детектируемых платформой, может быть недостаточным для реализации конкретного сценария использования. Решение: В данном случае требуется настроить параметры используемого детектора (увеличить порог детекции и минимальный и максимальный размеры детектируемого лица).

Для этого остановите платформу, откройте файл on_premise/deploy/values.yaml и добавьте в блок env следующую строку:

FACE_SDK_PARAMETERS: "{\\"score_threshold\\": 0.7, \\"min_size\\": 150, \\"``max_size\\": 10000}" , где:

  • score_threshold - порог детекции, от 0 до 1. Чем выше значение порога, тем больше лиц способен распознать детектор;

  • min_size , max_size - минимальный и максимальный размер лица для детекции в пикселях.