8. Устранение неисправностей
Ошибка генерации оффлайн запроса на предоставление лицензии:
Проблема: при выполнении команды ./cli.sh license-server generate-offline
появляется ошибка:
ERR Missing file path for offline activation request file! Specify path using ‘--offline-request’ option.
Решение: убедитесь, что в файлах platform.secrets.json и license-server.settings.cfg указаны значения для переменных license-secret
, license_key
и license_server_address
.
Ошибка с nvidia-device-plugin при проверке элементов кластера
Проблема: при выполнении команды kubectl get all --all-namespaces
появляется ошибка:
Error: failed to start container "nvidia-device-plugin-ctr": Error response from daemon: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy'
nvidia-container-cli: initialization error: nvml error: driver/library version mismatch: unknown
Решение:
- Для получения информации о вашей видеокарте и доступных драйверах выполните следующую команду:
ubuntu-drivers devices
- В выводе консоли указано, что в системе установлена видеокарта «GeForce GTX 1050 Ti», а рекомендуемый драйвер — «nvidia-driver-515».
== /sys/devices/pci0000:00/0000:00:10.0 ==
modalias : pci:v000010DEd00001C82sv00001458sd00003764bc03sc00i00
vendor : NVIDIA Corporation
model : GP107 [GeForce GTX 1050 Ti]
manual_install: True
driver : nvidia-driver-510-server - distro non-free
driver : nvidia-driver-450-server - distro non-free
driver : nvidia-driver-390 - distro non-free
driver : nvidia-driver-520 - distro non-free
driver : nvidia-driver-418-server - distro non-free
driver : nvidia-driver-515-server - distro non-free
driver : nvidia-driver-515 - distro non-free recommended
driver : nvidia-driver-510 - distro non-free
driver : nvidia-driver-470-server - distro non-free
driver : nvidia-driver-470 - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
- Для установки рекомендуемого (recommended) драйвера выполните команду:
sudo apt install nvidia-driver-515
- После установки драйвера вы можете просмотреть состояние видеокарты с помощью инструмента мониторинга
nvidia-smi
:
- Посмотреть версию драйвера можно с помощью команды:
cat /proc/driver/nvidia/version
Ошибка при развертывании платформы в кластере
Проблема: при выполнении команды ./cli.sh platform install появляется ошибка:
Решение: запросите лог platform-postgres-dep с помощью команды:
kubectl logs -f <full name of pod>
Если отображается ошибка о неверных имени базы данных или авторизационных данных, проверьте корректность введенных авторизационных данных в файле ./cfg/platform.secrets.json.
Ошибка при загрузке образов во внешний registry
Проблема: При загрузке образов возникает ошибка:
The push refers to repository [<DOCKER_REGISTRY_SERVER>/<IMAGE>]
Get "<DOCKER_REGISTRY_SERVER>/v2/": x509: certificate signed by unknown authority
Решение: Добавьте или измените файл /etc/docker/daemon.json
и добавьте ваш DOCKER_REGISTRY_SERVER в список
insecure-registries:
{
"insecure-registries" : [ "<DOCKER_REGISTRY_SERVER>" ]
}
Перезапустите docker-service
, выполнив следующую команду:
$ sudo systemctl restart docker
Ошибки при запуске тестов и пути их решения
В процессе запуска скрипта для проверки работоспособности система возвращает следующий результат:
Error: <error type>
Error message: <error message>
Error type
обозначает тип возникшей ошибки, а error message
сообщает уточняющую информацию об ошибке.
Команды для отладки сервисов описаны в пункте 3.2, список сервисов и их зона ответственности - в пункте 2.4.3.
Далее перечислены комбинации ошибок и сообщений с возможными шагами по их устранению.
ConnectionError:
<urlopen error Wrong url format: asdasd>
- введен неверный формат URL, необходимо ввести корректный адрес.<urlopen error [Errno -2] Name or service not known>
\<urlopen error [Errno 111] Connection refused>
- введен URL недоступного сервиса. Проверьте корректность введённого адреса, а также убедитесь, что платформа развернута корректно и доступна извне. Если вы обращаетесь по домену, проверьте, что файл /etc/hosts имеет именно тот домен, который указывает на ip адрес развернутой платформы.HTTP Error 405: Not Allowed
- убедитесь, что введенный URL ведёт именно на Платформу, а не на сторонний сервис.HTTP Error 502: Bad Gateway / HTTP Error 503: Service Temporarily Unavailable
- убедитесь, что сервис backend-dep развернут.
PlatformError:
connection to server at "localhost" (::1), port 5432 failed: Connection refused Is the server running on that host and accepting TCP/IP connections?
- убедитесь, что база данных доступна и работает правильно.Authorization error
- убедитесь, что вы ввели правильные пароль и почту пользователя.Wrong answer from server. JSON can not decoded
- убедитесь, что введенный URL ведёт именно на платформу, а не на сторонний сервис.License has not been leased yet
- убедитесь, что сервер лицензий работает, и у платформы есть к нему доступ. Дополнительно проверьте, что лицензия активирована корректно.Low quality photo
- проверьте, что сервис, отвечающий за вычисление качества фотографий, доступен и работает корректно.Profile not searched
- убедитесь, что сервис, отвечающий за поиск по базе персон, доступен и работает корректно.
При появлении любых других типов ошибок или сообщений, которые не получается отладить и устранить на месте, а также невозможности устранения вышеописанных ошибок, обращаться на почту support-platform@3divi.com
.
Проблемы с подключением к серверу OMNI Platform
Проблемы с подключением к серверу OMNI Platform могут быть связаны с использованием файервола в вашей ОС.
Решение: Если файервол используется в стандартной настройке, просто откройте все порты файервола. При кастомизированной настройке потребуется открыть порты 8080, 80 443 8090.
Не запускается балансировщик нагрузки nginx во время установки и настройки Kubernetes-кластера
- Пропишите в iptables правило следующей командой
sudo iptables -A INPUT -p tcp -m tcp --dport 6443 -j ACCEPT
- Повторите команды из п. 2.1.4
Ошибка "Trial license has expired!"
Для исправления ошибки рекомендуем выполнить все действия из пункта 7.5.