Начало работы
Processing Block API (API процессинг-блоков) является масштабируемым интерфейсом, замещающим существующее Legacy API для более легкой интеграции возможностей Face SDK в ваше приложение.
Основные возможности
- Объединение многочисленных компонентов в единую интеграцию
- Простота и легкость изучения
- Быстрое внедрение
- Долгосрочная поддержка и обновления
Требования
- Операционная система Windows x86 64-bit или Linux x86 64-bit.
- Установлен пакет Face SDK windows_x86_64 или linux_x86_64 (см. Начало работы).
Context-контейнер
Ключевой концепцией API процессинг-блоков является использование контейнеров Context.
Context — это гетерогенный контейнер, состоящий из набора иерархически организованных данных, представленных как пары ключ-значение. Ближайший аналог Context — объект JSON. Каждый объект Context может содержать: скалярный объект (integer, real, boolean, string), указатель на область памяти, массив объектов Context, ассоциативный контейнер пар <string, Context> с неограниченной вложенностью.
Как создать и использовать Context-контейнер
Создайте Context-контейнер:
- C++
- Python
- Flutter
- C#
auto array_elem0 = service->createContext();
array_elem0 = service.createContext({})
Context array_elem0 = service.createContext({});
Context array_elem0 = service.CreateContext(new());
Общий набор операций с Context:
создание ассоциативного контейнера по ключу
["key"]
на пустом контейнере Context:- C++
- Python
- Flutter
- C#
array_elem0["name"] = "Julius Zeleny"; // передать string
array_elem0["phone"] = 11111111111l; // передать integer (long)
array_elem0["social_score"] = 0.999; // передать double
array_elem0["verified"] = true; // передать boolarray_elem0["name"] = "Julius Zeleny" # передать string
array_elem0["phone"] = 11111111111 # передать integer
array_elem0["social_score"] = 0.999 # передать double
array_elem0["verified"] = True # передать boolarray_elem0["name"] = "Julius Zeleny"; // передать string
array_elem0["phone"] = 11111111111; // передать integer
array_elem0["social_score"] = 0.999; // передать double
array_elem0["verified"] = true; // передать boolarray_elem0["name"] = "Julius Zeleny"; // передать string
array_elem0["phone"] = 11111111111L; // передать integer
array_elem0["social_score"] = 0.999; // передать double
array_elem0["verified"] = true; // передать boolгеттеры:
- C++
- Python
- Flutter
- C#
ASSERT_EQ( array_elem0["name"].getString(), "Julius Zeleny" );
ASSERT_EQ( array_elem0["phone"].getLong(), 11111111111l );
ASSERT_EQ( array_elem0["social_score"].getDouble(), 0.999 );
ASSERT_EQ( array_elem0["verified"].getBool(), true );assert array_elem0["name"].get_value(), "Julius Zeleny"
assert array_elem0["phone"].get_value() == 11111111111
assert array_elem0["social_score"].get_value() == 0.999
assert array_elem0["verified"].get_value() == Trueassert (array_elem0["name"].get_value() == "Julius Zeleny");
assert (array_elem0["phone"].get_value() == 11111111111);
assert (array_elem0["social_score"].get_value() == 0.999);
assert (array_elem0["verified"].get_value() == true);Debug.Assert(array_elem0["name"].GetString() == "Julius Zeleny");
Debug.Assert(array_elem0["phone"].GetLong() == 11111111111L);
Debug.Assert(array_elem0["social_score"].GetDouble() == 0.999);
Debug.Assert(array_elem0["verified"].GetBool() == true);создание массива вызовом метода
push_back
на пустом контейнере Context:- C++
- Python
- Flutter
- C#
auto array == service->createContext();
array.push_back(array_elem0);array = service.create_context([])
array.push_back(array_elem0)Context array = service.createContext([]);
array.pushBack(array_elem0);Context array == service->CreateContext(new());
array.PushBack(array_elem0);итерации по массиву:
- C++
- Python
- Flutter
- C#
// получить значение по индексу
ASSERT_EQ( array[0]["phone"].getLong(), 11111111111l );
// выполнить итерацию с индексом
size_t array_sz = array.size();
for(size_t i = 0; i < array_sz; ++i)
array[i]["phone"];
// или с итераторами
for(auto iter = array.begin(); iter != array.end(); ++iter)
(*iter)["phone"]; // возвращается вложенный Context
// или с foreach
for(auto val : array)
val["phone"];# получить значение по индексу
assert array[0]["phone"].get_value() == 11111111111
# выполнить итерацию с индексом
for i in range(len(array)):
array[i]["phone"]
# или с итераторами
for elem in array:
elem["phone"]// получить значение по индексу
assert (array[0]["phone"].get_value() == 11111111111);
// выполнить итерацию с индексом
for (int i = 0; i < array.len(); i++)
array[i]["phone"];// получить значение по индексу
Debug.Assert(array[0]["phone"].GetLong() == 11111111111L);
// выполнить итерацию с индексом
for (long i = 0; i < array.Length(); i++)
array[i]["phone"];операции со вложенными ассоциативными контейнерами:
- C++
- Python
- Flutter
- C#
auto full = service->createContext();
full["friends"] = std::move(array); // использование семантики перемещения без копирования
// доступ к вложенному объекту
ASSERT_EQ( full["friends"][0]["social_score"].getDouble(), 0.999 );
// перебор значений ассоциативного контейнера
for(auto iter = full.begin(); iter != full.end(); ++iter) {
iter.key(); // получить значение ключа из итератора
(*iter)[0]["social_score"].getDouble(); // получить значение
}
// с foreach
for(auto val : full)
val[0]["social_score"].getDouble();full = service.create_context({})
full["friends"] = array.to_dict()
# доступ к вложенному объекту
assert full["friends"][0]["social_score"].get_value() == 0.999
# перебор значений ассоциативного контейнера
for key in full.keys():
full[key][0]["social_score"].get_value()Context full = service.createContext({});
full["friends"] = array.toMap();
// доступ к вложенному объекту
assert (full["friends"][0]["social_score"].get_value() == 0.999);
// перебор значений ассоциативного контейнера
for (var key in full.getKeys())
full[key][0]["social_score"].get_value();Context full = service.createContext(new());
full["friends"] = array;
// доступ к вложенному объекту
Debug.Assert(full["friends"][0]["social_score"].GetDouble() == 0.999);
// перебор значений ассоциативного контейнера
foreach (String key in full.GetKeys())
full[key][0]["social_score"].GetDouble();другие удобные методы Context:
- C++
- Python
- Flutter
- C#
void clear();
bool contains(const std::string& key); // для ассоциативного контейнера
Context operator[](size_t index); // для последовательного массива, элемент с указанием доступа и проверкой границ
Context operator[](const std::string& key); // для ассоциативного контейнера, доступ или вставка данных
Context at(const std::string& key); // для ассоциативного контейнера, с проверкой границ
size_t size(); // возвращается число элементов контейнера
bool isNone(); // проверка на пустоту
bool isArray(); // проверка на последовательный массив
bool isObject(); // проверка на ассоциативный контейнер
bool isLong(), isDouble(), isString(), isBool(); // проверка на содержание скалярного типа данныхdef to_dict(self) -> dict # преобразует context в словарь
def is_none(self) -> bool # проверка на пустоту
def is_array(self) -> bool # проверка на последовательный массив
def is_object(self) -> bool # проверка на ассоциативный контейнер
def is_long, is_double, is_string, is_bool -> bool # проверка на содержание скалярного типа данныхContext operator[](int index) // для последовательного массива, элемент с указанием доступа и проверкой границ
Context operator[](String key) // для ассоциативного контейнера, доступ или вставка данных
int len() // возвращается число элементов контейнера
bool is_none() // проверка на пустоту
bool is_array() // проверка на последовательный массив
bool is_object() // проверка на ассоциативный контейнер
bool is_long(), is_double(), is_string(), is_bool() // проверка на содержание скалярного типа данныхbool Contains(string key); // для ассоциативного контейнера
Context this[int index]; // для последовательного массива, элемент с указанием доступа и проверкой границ
Context this[string key]; // для ассоциативного контейнера, доступ или вставка данных
Context GetByKey(string key); // для ассоциативного контейнера, с проверкой границ
Context GetByIndex(int index); // для ассоциативного контейнера, с проверкой границ
ulong Length(); // возвращается число элементов контейнера
bool IsNone(); // проверка на пустоту
bool IsArray(); // проверка на последовательный массив
bool IsObject(); // проверка на ассоциативный контейнер
bool IsLong(), IsDouble(), IsString(), IsBool(); // проверка на содержание скалярного типа данных
Бинарный формат изображений
Большинство процессинг-блоков выполняют операции с Context-контейнерами, содержащими изображения в бинарном формате:
{
"image" : {
"format": "NDARRAY",
"blob": "data pointer",
"dtype": "uint8_t",
"shape": [height, width, channels]
}
}
Ключ "blob"
содержит умный указатель на данные. Указатель устанавливается функцией void Context::setDataPtr(void* ptr, int copy_sz)
,
где copy_sz
— размер памяти в байтах, который будет скопирован, и затем автоматически освобождается, когда заканчивается время жизни объекта Context.
Копирование не будет выполнено, если в качестве аргумента copy_sz
будет передан 0
. В этом случае объект Context не контролирует время жизни объекта, на который он указывает.
Вы также можете аллоцировать "сырую" память, например, чтобы скопировать данные позже, передавая nullptr и размер в качестве аргументов setDataPtr
.
Ключ "dtype"
может содержать одно из следующих значений: "uint8_t"
, "int8_t"
, "uint16_t"
, "int16_t"
, "int32_t"
, "float"
, "double"
.
Каждому значению соответствует определенный тип OpenCV: CV_8U
, CV_8S
, CV_16U
, CV_16S
, CV_32S
, CV_32F
, CV_64F
.
Создание Context-контейнера c RGB-изображением
- C++
- Python
- Flutter
- C#
- Создайте контейнер Context для изображения используя метод
createContext()
:
auto imgCtx = service->createContext();
- Прочитайте RGB-изображение из файла:
// read the image from file
std::string input_image_path = "{path_to_image}";
cv::Mat image = cv::imread(input_image_path, cv::IMREAD_COLOR);
cv::Mat input_image;
cv::cvtColor(image, input_image, cv::COLOR_BGR2RGB);
4.a Поместите изображение в контейнер
// using pbio::context_utils::putImage(Context& ctx, unsigned char* data, size_t height, size_t width, pbio::IRawImage::Format format, bool copy)
pbio::context_utils::putImage(imgCtx, input_image.data, input_image.rows, input_image.cols, pbio::IRawImage::FORMAT_RGB, true);
4.b ИЛИ скопируйте изображение из pbio::RawImage
, pbio::CVRawImage
, pbio::InternalImageBuffer
в бинарный формат и положите его в контейнер Context:
// constructing pbio::RawImage
pbio::RawImage input_rawimg(input_image.cols, input_image.rows, pbio::RawImage::Format::FORMAT_RGB, input_image.data);
// using void putImage(Context& ctx, const RawImage& raw_image)
pbio::context_utils::putImage(imgCtx, input_rawimg);
- Прочитайте RGB-изображение из файла:
input_image_path = "{path_to_image}"
image = cv2.imread(input_image_path, cv2.IMREAD_COLOR)
input_image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
- Создайте словарь в бинарном формате изображения:
imgDict = {
"blob": input_image.tobytes(),
"dtype": "uint8_t",
"format": "NDARRAY",
"shape": [dim for dim in input_image.shape]
}
- Создайте контейнер Context для изображения используя метод
createContext()
:
imgCtx = service.create_context(imgDict)
- Прочитайте RGB-изображение из файла:
File file = File("{imagePath}");
final Uint8List bytes = await file.readAsBytes();
final ImageDescriptor descriptor = await ImageDescriptor.encoded(await ImmutableBuffer.fromUint8List(bytes));
- Создайте словарь в бинарном формате изображения:
Map<String, dynamic> imageContext = {
"blob": bytes,
"dtype": "uint8_t",
"format": "NDARRAY",
"shape": [descriptor.height, descriptor.width, 3]
};
- Создайте контейнер Context для изображения используя метод
createContext()
:
imgCtx = service.createContext(imageContext);
string inputImagePath = "<path_to_image>"
Mat image = Cv2.ImRead(inputImagePath);
Mat inputImage = new();
Cv2.CvtColor(image, inputImage, ColorConversionCodes.BGR2RGB);
- Создайте словарь в бинарном формате изображения:
Dictionary<int, string> CvTypeToStr = new()
{
{ MatType.CV_8U, "uint8_t" }, { MatType.CV_8S, "int8_t" },
{ MatType.CV_16U, "uint16_t" }, { MatType.CV_16S, "int16_t" },
{ MatType.CV_32S, "int32_t" }, { MatType.CV_32F, "float" }, { MatType.CV_64F, "double" }
};
Dictionary<object, object> imgDict = new();
var inputImage = img.IsContinuous() ? img : img.Clone();
long size = inputImage.Total() * inputImage.ElemSize();
List<object> sizes = [];
byte[] buffer = new byte[size];
using (Mat temp = new(inputImage.Rows, inputImage.Cols, inputImage.Type(), buffer))
{
inputImage.CopyTo(temp);
}
for (int i = 0; i < inputImage.Dims; ++i)
{
sizes.Add(inputImage.Size(i));
}
sizes.Add(inputImage.Channels());
imgDict["blob"] = buffer;
imgDict["format"] = "NDARRAY";
imgDict["shape"] = sizes;
imgDict["dtype"] = CvTypeToStr[inputImage.Depth()];
- Создайте контейнер Context для изображения используя метод
CreateContext()
:
imgCtx = service.CreateContext(imgDict)
Процессинг-блоки
Типы процессинг-блоков
- FACE_DETECTOR
- HUMAN_BODY_DETECTOR
- HUMAN_POSE_ESTIMATOR
- OBJECT_DETECTOR
- FACE_FITTER
- EMOTION_ESTIMATOR
- AGE_ESTIMATOR
- GENDER_ESTIMATOR
- MASK_ESTIMATOR
- LIVENESS_ESTIMATOR
- QUALITY_ASSESSMENT_ESTIMATOR
- FACE_TEMPLATE_EXTRACTOR
- TEMPLATE_INDEX
- MATCHER_MODULE
- VERIFICATION_MODULE
Примеры использования Processing Block API демонстрируются в:
- Сэмпле processing_block_demo на C++
- Примерах examples/python/processing_blocks/ на Python
- Сэмпле processing_block_demo на Flutter
Настраиваемые параметры процессинг-блоков
unit_type: string
— главный параметр процессинг-блока, определяет тип создаваемого модуля.modification: string
— опциональный параметр, определяет модификацию процессинг-блока. Если не указан, то будет использоваться значение по умолчанию.version: int64
— опциональный параметр, определяет версию модификации процессинг-блока. Если не указан, то будет использоваться значение по умолчанию.model_path: string
— опциональный параметр, определяет путь до модели процессинг-блока. Если не указан, то будет использоваться значение по умолчанию.use_cuda: bool
— опциональный параметр, отвечает за запук процессинг-блока на GPU. Значение по умолчанию —false
.use_legacy: bool
— опциональный параметр, нужен для использования более старой билиотеки onnxruntime. Значение по умолчанию —false
.ONNXRuntime
— ключ для параметров конфигурации onnxruntime:library_path: string
— путь до библиотек onnxruntime, по умолчанию путь до директории с libfacerec.so.intra_op_num_threads: int64
– число потоков для распараллеливания модуля, по умолчанию равно 1.
Создание процессинг-блока
Создайте Context-контейнер, укажите нужные вам параметры и передайте его в метод
FacerecService.createProcessingBlock()
.- C++
- Python
- Flutter
- C#
// обязательно, укажите имя процессинг-блока
auto configCtx = service->createContext();
configCtx["unit_type"] = "{name_of_processing_block}";
// если не указать, то будет использоваться значение по умолчанию
configCtx["modification"] = "{modification}";
// если не указать, то будет использоваться первая версия модификации
configCtx["version"] = {version};
// модели по умолчанию расположены в директории дистрибутива Face SDK: share/processing_block/{modification}/({version}/ или {version}.enc)
// вы можете задать ваш собственный путь до модели
configCtx["model_path"] = "{path_to_model_file}";
// библиотека onnxruntime по умолчанию расположена в директории дистрибутива Face SDK: "lib" для платформы Linux или "bin" для платформы Windows
// вы можете задать ваш собственный путь до библиотеки onnxruntime
// если путь до библиотеки не указан, то будет использоваться стандартный порядок поиска, используемый в данной ОС
configCtx["ONNXRuntime"]["library_path"] = "../lib"; // для Linux
configCtx["ONNXRuntime"]["library_path"] = "../bin"; // для Windows
// опционально, значение "true" для ускорения процессинг-блоков на GPU (только для блоков с поддержкой CUDA)
configCtx["use_cuda"] = false;
pbio::ProcessingBlock processing_block = service->createProcessingBlock(configCtx);configDict = {};
# обязательно, укажите имя процессинг-блока
configDict["unit_type"] = "{name_of_processing_block}"
# если не указать, то будет использоваться значение по умолчанию
configDict["modification"] = "{modification}"
# если не указать, то будет использоваться первая версия модификации
configDict["version"] = {version}
# модели по умолчанию расположены в директории дистрибутива Face SDK: share/processing_block/{modification}/({version}/ или {version}.enc)
# вы можете задать ваш собственный путь до модели
configDict["model_path"] = "{path_to_model_file}"
# библиотека onnxruntime по умолчанию расположена в директории дистрибутива Face SDK: "lib" для платформы Linux или "bin" для платформы Windows
# вы можете задать ваш собственный путь до библиотеки onnxruntime
# если путь до библиотеки не указан, то будет использоваться стандартный порядок поиска, используемый в данной ОС
configDict["ONNXRuntime"]["library_path"] = "../lib" # для Linux
configDict["ONNXRuntime"]["library_path"] = "../bin" # для Windows
# опционально, значение "true" для ускорения процессинг-блоков на GPU (только для блоков с поддержкой CUDA)
configDict["use_cuda"] = False
processing_block = service.create_processing_block(configDict);Map<String, dynamic> configMap = {};
// обязательно, укажите имя процессинг-блока
configMap["unit_type"] = "{name_of_processing_block}";
// если не указать, то будет использоваться значение по умолчанию
configMap["modification"] = "{modification}";
// если не указать, то будет использоваться первая версия модификации
configMap["version"] = {version};
// модели по умолчанию расположены в директории дистрибутива Face SDK: share/processing_block/{modification}/({version}/ или {version}.enc)
// вы можете задать ваш собственный путь до модели
configMap["model_path"] = "{path_to_model_file}";
processing_block = service.createProcessingBlock(configMap);Dictionary<object, object> configDict = new Dictionary<object, object>();
// обязательно, укажите имя процессинг-блока
configDict["unit_type"] = "<name_of_processing_block>";
// если не указать, то будет использоваться значение по умолчанию
configDict["modification"] = "<modification>";
// если не указать, то будет использоваться первая версия модификации
configDict["version"] = <version>;
// модели по умолчанию расположены в директории дистрибутива Face SDK: share/processing_block/<modification>/(<version>/ или <version>.enc)
// вы можете задать ваш собственный путь до модели
configDict["model_path"] = "<path_to_model_file>";
// библиотека onnxruntime по умолчанию расположена в директории дистрибутива Face SDK: "lib" для платформы Linux или "bin" для платформы Windows
// вы можете задать ваш собственный путь до библиотеки onnxruntime
// если путь до библиотеки не указан, то будет использоваться стандартный порядок поиска, используемый в данной ОС
configDict["ONNXRuntime"]["library_path"] = "../lib"; # для Linux
configDict["ONNXRuntime"]["library_path"] = "../bin"; # для Windows
// опционально, значение "true" для ускорения процессинг-блоков на GPU (только для блоков с поддержкой CUDA)
configDict["use_cuda"] = False;
ProcessingBlock processingBlock = service.CreateProcessingBlock(configDict);Подготовьте входной Context-контейнер с изображением и передайте в процессинг-блок.
- C++
- Python
- Flutter
- C#
std::string input_image_path = "{path_to_image}";
cv::Mat image = cv::imread(input_image_path, cv::IMREAD_COLOR);
cv::Mat input_image;
cv::cvtColor(image, input_image, cv::COLOR_BGR2RGB);
// формирование контейнера Context с бинарным изображением
auto imgCtx = service->createContext();
pbio::context_utils::putImage(imgCtx, input_image.data, input_image.rows, input_image.cols, pbio::IRawImage::FORMAT_RGB, true);
// формирование входного контейнера Context
auto ioData = service->createContext();
ioData["image"] = imgCtx;
// Вызов процессинг-блока
processing_block(ioData);input_image_path = "{path_to_image}"
image = cv2.imread(input_image_path, cv2.IMREAD_COLOR)
input_image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
# Формирование контейнера Context с бинарным изображением
imgDict = {
"blob": input_image.tobytes(),
"dtype": "uint8_t",
"format": "NDARRAY",
"shape": [dim for dim in input_image.shape]
}
imgCtx = service.create_context(imgDict)
# Формирование входного контейнера Context
ioData = service.create_context({})
ioData["image"] = imgCtx;
# Вызов процессинг-блока
processing_block(ioData);File file = File(imagePath);
final Uint8List bytes = await file.readAsBytes();
final ImageDescriptor descriptor = await ImageDescriptor.encoded(await ImmutableBuffer.fromUint8List(bytes));
Map<String, dynamic> imageContext = {
"blob": bytes,
"dtype": "uint8_t",
"format": "NDARRAY",
"shape": [descriptor.height, descriptor.width, 3]
};
// Формирование входного контейнера Context
ioData = service.createContext({
"objects": [],
"image": {
"blob": {массив байт с изображением в RGB формате},
"dtype": "uint8_t",
"format": "NDARRAY",
"shape": [{высота изображения в пикселях}, {ширина изображения в пикселях}, 3]
}
});
// Вызов процессинг-блока
ioData result = processing_block.process(ioData);string inputImagePath = "<path_to_image>"
Mat image = Cv2.ImRead(inputImagePath);
Mat inputImage = new();
Cv2.CvtColor(image, inputImage, ColorConversionCodes.BGR2RGB);
// формирование контейнера Context с бинарным изображением
Dictionary<int, string> CvTypeToStr = new()
{
{ MatType.CV_8U, "uint8_t" }, { MatType.CV_8S, "int8_t" },
{ MatType.CV_16U, "uint16_t" }, { MatType.CV_16S, "int16_t" },
{ MatType.CV_32S, "int32_t" }, { MatType.CV_32F, "float" }, { MatType.CV_64F, "double" }
};
Dictionary<object, object> imgDict = new();
var inputImage = img.IsContinuous() ? img : img.Clone();
long size = inputImage.Total() * inputImage.ElemSize();
List<object> sizes = [];
byte[] buffer = new byte[size];
using (Mat temp = new(inputImage.Rows, inputImage.Cols, inputImage.Type(), buffer))
{
inputImage.CopyTo(temp);
}
for (int i = 0; i < inputImage.Dims; ++i)
{
sizes.Add(inputImage.Size(i));
}
sizes.Add(inputImage.Channels());
imgDict["blob"] = buffer;
imgDict["format"] = "NDARRAY";
imgDict["shape"] = sizes;
imgDict["dtype"] = CvTypeToStr[inputImage.Depth()];
// формирование входного контейнера Context
Context ioData = service.CreateContext
(
new Dictionary<object, object>
{
{ "image", imageContext }
}
);
processingBlock.Invoke(ioData);
Ускорение на GPU
Процессинг-блоки могут быть использованы с ускорением на GPU. Для этого необходимо определить ключ "use_cuda"
со значением true
для Context-контейнера процессинг-блока.
Для запуска процессинг-блоков на CUDA версии 10.1 необходимо дополнительно определить ключ "use_legacy"
со значением true
для Context-контейнера процессинг-блока.
(См. Настраиваемые параметры процессинг-блоков).
Поддерживаемые версии CUDA см. на странице Системные требования для использования GPU