Перейти к основному содержимому
Версия: 1.14.2

8. Устранение неисправностей

Ошибка генерации оффлайн запроса на предоставление лицензии:

Проблема: при выполнении команды ./cli.sh license-server generate-offline появляется ошибка:

ERR Missing file path for offline activation request file! Specify path using--offline-request’ option.

Решение: убедитесь, что в файлах platform.secrets.json и license-server.settings.cfg указаны значения для переменных license-secret, license_key и license_server_address.

Ошибка с nvidia-device-plugin при проверке элементов кластера

Проблема: при выполнении команды kubectl get all --all-namespaces появляется ошибка:

Error: failed to start container "nvidia-device-plugin-ctr": Error response from daemon: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy'
nvidia-container-cli: initialization error: nvml error: driver/library version mismatch: unknown

img.png

Решение:

  1. Для получения информации о вашей видеокарте и доступных драйверах выполните следующую команду:
 ubuntu-drivers devices
  1. В выводе консоли указано, что в системе установлена видеокарта «GeForce GTX 1050 Ti», а рекомендуемый драйвер — «nvidia-driver-515».
 == /sys/devices/pci0000:00/0000:00:10.0 ==
modalias : pci:v000010DEd00001C82sv00001458sd00003764bc03sc00i00
vendor : NVIDIA Corporation
model : GP107 [GeForce GTX 1050 Ti]
manual_install: True
driver : nvidia-driver-510-server - distro non-free
driver : nvidia-driver-450-server - distro non-free
driver : nvidia-driver-390 - distro non-free
driver : nvidia-driver-520 - distro non-free
driver : nvidia-driver-418-server - distro non-free
driver : nvidia-driver-515-server - distro non-free
driver : nvidia-driver-515 - distro non-free recommended
driver : nvidia-driver-510 - distro non-free
driver : nvidia-driver-470-server - distro non-free
driver : nvidia-driver-470 - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
  1. Для установки рекомендуемого (recommended) драйвера выполните команду:
 sudo apt install nvidia-driver-515
  1. После установки драйвера вы можете просмотреть состояние видеокарты с помощью инструмента мониторинга nvidia-smi:

img.png

  1. Посмотреть версию драйвера можно с помощью команды:
 cat /proc/driver/nvidia/version

img.png

Ошибка при развертывании платформы в кластере

Проблема: при выполнении команды ./cli.sh platform install появляется ошибка:

img.png

Решение: запросите лог platform-postgres-dep с помощью команды:

 kubectl logs -f <full name of pod>

img.png

Если отображается ошибка о неверных имени базы данных или авторизационных данных, проверьте корректность введенных авторизационных данных в файле ./cfg/platform.secrets.json.

Ошибка при загрузке образов во внешний registry

Проблема: При загрузке образов возникает ошибка:

The push refers to repository [<DOCKER_REGISTRY_SERVER>/<IMAGE>]
Get "<DOCKER_REGISTRY_SERVER>/v2/": x509: certificate signed by unknown authority

img.png Решение: Добавьте или измените файл /etc/docker/daemon.json и добавьте ваш DOCKER_REGISTRY_SERVER в список insecure-registries:

{
"insecure-registries" : [ "<DOCKER_REGISTRY_SERVER>" ]
}

Перезапустите docker-service, выполнив следующую команду:

$ sudo systemctl restart docker

Ошибки при запуске тестов и пути их решения

В процессе запуска скрипта для проверки работоспособности система возвращает следующий результат:

Error: <error type>
Error message: <error message>

Error type обозначает тип возникшей ошибки, а error message сообщает уточняющую информацию об ошибке.

Команды для отладки сервисов описаны в пункте 3.2, список сервисов и их зона ответственности - в пункте 2.4.3.

Далее перечислены комбинации ошибок и сообщений с возможными шагами по их устранению.

ConnectionError:

  • <urlopen error Wrong url format: asdasd> - введен неверный формат URL, необходимо ввести корректный адрес.

  • <urlopen error [Errno -2] Name or service not known> \ <urlopen error [Errno 111] Connection refused> - введен URL недоступного сервиса. Проверьте корректность введённого адреса, а также убедитесь, что платформа развернута корректно и доступна извне. Если вы обращаетесь по домену, проверьте, что файл /etc/hosts имеет именно тот домен, который указывает на ip адрес развернутой платформы.

  • HTTP Error 405: Not Allowed - убедитесь, что введенный URL ведёт именно на Платформу, а не на сторонний сервис.

  • HTTP Error 502: Bad Gateway / HTTP Error 503: Service Temporarily Unavailable - убедитесь, что сервис backend-dep развернут.

PlatformError:

  • connection to server at "localhost" (::1), port 5432 failed: Connection refused Is the server running on that host and accepting TCP/IP connections? - убедитесь, что база данных доступна и работает правильно.

  • Authorization error - убедитесь, что вы ввели правильные пароль и почту пользователя.

  • Wrong answer from server. JSON can not decoded - убедитесь, что введенный URL ведёт именно на платформу, а не на сторонний сервис.

  • License has not been leased yet - убедитесь, что сервер лицензий работает, и у платформы есть к нему доступ. Дополнительно проверьте, что лицензия активирована корректно.

  • Low quality photo - проверьте, что сервис, отвечающий за вычисление качества фотографий, доступен и работает корректно.

  • Profile not searched - убедитесь, что сервис, отвечающий за поиск по базе персон, доступен и работает корректно.

При появлении любых других типов ошибок или сообщений, которые не получается отладить и устранить на месте, а также невозможности устранения вышеописанных ошибок, обращаться на почту support-platform@3divi.com.

Проблемы с подключением к серверу OMNI Platform

Проблемы с подключением к серверу OMNI Platform могут быть связаны с использованием файервола в вашей ОС.

Решение: Если файервол используется в стандартной настройке, просто откройте все порты файервола. При кастомизированной настройке потребуется открыть порты 8080, 80 443 8090.

Не запускается балансировщик нагрузки nginx во время установки и настройки Kubernetes-кластера

  1. Пропишите в iptables правило следующей командой
sudo iptables -A INPUT -p tcp -m tcp --dport 6443 -j ACCEPT
  1. Повторите команды из п. 2.1.4

Ошибка "Trial license has expired!"

Для исправления ошибки рекомендуем выполнить все действия из пункта 7.5.