- Стабилизация аудиодорожек ориентируясь на паузы (Бюджет: 5000 руб)

Дата публикации: 25.01.2023 16:39:35
Бюджет: 5000 руб
Имеются следующие составляющие: аудиодорожка, с русской речью, которая воспроизведена в виде звука роботом; аудиодорожка, с английской или иной речью, которая воспроизведена в виде звука роботом, причем текст был переведен с русского на английский гугл переводчиком. Проблема т.к. текст воспроизводится разными дикторами с разной скоростью и интонацией, происходит некоторый рассинхрон, на какие-то доли секунды, но т.к. текста на 10 минут говорения, то рассинхрон довольно емкий получается. Даже если ускорять/замедлять дорожки и вывести их на единую скорость, это все равно не помогает, т.к. начало говорения должно быть после пауз одинаковым, а это не так. Пути решения проблемы можно конечно взять и ручками подправить, это не так долго, но будет человеческий фактор, которого хочется избежать, поэтому есть предложение по созданию скрипта, который позволит стабилизировать звук, ориентируясь на паузы, в русском пауза будет 1,5 секунды, в английком 0,8 секунды, и так каждый сегмент анализируется и выравнивается АВТОМАТИЧЕСКИ. Необходимо решить вопрос с автоматизированной подгонкой аудиоряда под эталон, т.е. под данный русскоязычный вариант, подогнать данный англоязычный, исходя из пауз. Порядок работы скрипта: программа получает ряд файлов, эталон и другие аудио файлы, схожие по структуре, файлов может быть сколько угодно много, т.е. 1 эталон и 30 подгоняемых под эталон; программа сразу стабилизирует общую длину файлов под эталон, т.е. если эталон равен 10 минутам ровно, а подгоняемый или подгоняемые файлы 11 минут, то подгоняемые файлы сразу сжимаются до 10 минут; после того, как общая длинна аудиодорожки одинаковая, то программа смотрит как урезать паузы у подгоняемых файлов, согласно эталону, важно, чтобы когда голос начинается после паузы у эталона, тогда голос начинается и у подгоняемого файла; иногда получается так, что начало голоса одинаковое, но окончание разное, и тут есть 2 пути, либо крадется следующая пауза, либо замедляется/ускоряется звук в рамках сегмента, в случае замедления/ускорения под эталон, происходит побочный эффект в виде плавающей скорости речи, но скорее всего она будет малозаметной. В случае необходимости, возможно на эталоне делать паузы любой длины, как и у самих файлов, которые будут подгоняться под эталон. Проблемные вопросы: в случае, если структура файла неверная, т.е. в эталоне 10 пауз, а в передаваемом файле их 20, то надо предупредить пользователя, что какая-то проблема, что-то не так, возможны иные системы защиты от дурака; в случае, если файл эталона и подгоняемый файл, один из залитых под редактирование, сильно разнится по времени, скажем, разница в 50% от эталона, это тоже признак, что что-то не так; возможны иные непредвиденные проблемы, которые в момент написания ТЗ оказались неочевидными. Ссылка на подопытные файлы ниже: drive.google.com/drive/folders/1Fpio618w5BcpVhwQQ2ADVv1wASfzLv-1?usp=sharing
Источник: www.fl.ru
Число просмотров: 2

Еще проекты:

Написать курсовую работу. Предмет: Сети и телекоммуникации/Инфокоммуникационные системы и сети

Тип: Курсовая работа Предмет: Сети и телекоммуникации / Инфокоммуникационные системы и сети Тема:  Структурная схема сети учебного корпуса. Объем: 16 страниц.  Выполнение построения сети осуществить в программе Cisco Packet Tracer. Примеры, образцы прикладываю.

UX архитектор (Бюджет: 10000 руб)

- Анализ пользовательских требований на основе коммуникаций с пользователями, заказчиком и проектной командой;  - Формирование портретов пользователей и проектирование пользовательского взаимодействия;  - Разработка концепции и графических прототипов интерфейсов;  - Создание интерактивных прототипов;  - Разработка дизайн-макетов интерфейсов;  - Проведение регулярной экспертной оценки результатов разработки; - Совершенствование существующих интерфейсов;  - Организация, проведение и оценка ...

Рекламный текст для телеграмм (спортивная обувь, кроссовки)

Рекламный текст для телеграмм (спортивная обувь, кроссовки). Текст должен быть не большой, содержательный, пробуждать желание перейти по ссылке.

Нарисовать баннеры (Бюджет: 5000 руб)

Здравствуйте! Нужно отрисовать баннеры для яндекс директа. Для сайта glass-faer.ru Противопожарные окна, противопожарные двери, противопожарные перегородки, противопожарные зенитные фонари, противопожарные витражи Размеры http://joxi.ru/YmERVMeHLZxwR2

Создать модель корпуса для принтера HP 2055 по референсу для 3d печати

Нужно сделать 3d модель для последующей печати на 3d принтере корпуса для принтера HP2055 по референсу. Фото референса, детальное описание в ЛС. приветствуются школьники и студенты.