3i Speaker ID SDK 3.x

 

Назначение

Библиотека 3i Speaker ID предназначена для разработки программного обеспечения, в котором необходимо решать задачу автоматической текстонезависимой идентификации личности диктора по голосу, передающемуся, как по телевизионным каналам, так и по каналам телефонной связи.

3i Speaker ID SDK используется в качестве программного обеспечения, предоставляя разработчику соответствующий функционал API.

 

Технология

Технология идентификации основана на применении глубоких нейронных сетей, при помощи которых по речевому сигналу генерируется вектор голосовых признаков. Для получения вектора диктора достаточно 5-ти секунд речи. Полученный вектор представляет собой модель голоса, состоит из действительных чисел, размерность вектора 112 элементов.

Для решения задач идентификации в библиотеке предусмотрена функция сравнения двух векторов при помощи косинусной меры близости. Для принятия решений рекомендуется использовать пороговое значение косинусной близости, при котором достигается минимальная суммарная ошибка.

В библиотеку встроен детектор речи, позволяющий эффективно «отсеивать» неречевые составляющие входного сигнала.

 

Модификации

Существует две модификации продукта, ориентированных на различные источники входных данных. Модификации различаются индексом:

 

Технические характеристики

Требования к входным аудио данным 3i Speaker ID SDK:

 Требования к качеству сигнала:

 

Выходные данные: число с плавающей точкой confidence, отражающее достоверность того, что идентифицируемый диктор является «целевым». Значение достоверности имеет диапазон [-1;1].

EER=3.39% 

Равновероятная ошибка между ошибками первого и второго рода достигается при пороговом значении на достоверность равном 0.72


 

Реализация

SDK реализован в виде динамической библиотеки (DLL), написанной на языке С++. Допускается использование в нескольких параллельных потоках.

 

Системные требования

 

Документация

Вы можете ознакомиться с подробной документацией на продукт по ссылке

Cкачать документацию