- Стабилизация аудиодорожек ориентируясь на паузы (Бюджет: 5000 руб)
Дата публикации: 25.01.2023 16:39:35
Бюджет: 5000 руб
Имеются следующие составляющие: аудиодорожка, с русской речью, которая воспроизведена в виде звука роботом; аудиодорожка, с английской или иной речью, которая воспроизведена в виде звука роботом, причем текст был переведен с русского на английский гугл переводчиком. Проблема т.к. текст воспроизводится разными дикторами с разной скоростью и интонацией, происходит некоторый рассинхрон, на какие-то доли секунды, но т.к. текста на 10 минут говорения, то рассинхрон довольно емкий получается. Даже если ускорять/замедлять дорожки и вывести их на единую скорость, это все равно не помогает, т.к. начало говорения должно быть после пауз одинаковым, а это не так. Пути решения проблемы можно конечно взять и ручками подправить, это не так долго, но будет человеческий фактор, которого хочется избежать, поэтому есть предложение по созданию скрипта, который позволит стабилизировать звук, ориентируясь на паузы, в русском пауза будет 1,5 секунды, в английком 0,8 секунды, и так каждый сегмент анализируется и выравнивается АВТОМАТИЧЕСКИ. Необходимо решить вопрос с автоматизированной подгонкой аудиоряда под эталон, т.е. под данный русскоязычный вариант, подогнать данный англоязычный, исходя из пауз. Порядок работы скрипта: программа получает ряд файлов, эталон и другие аудио файлы, схожие по структуре, файлов может быть сколько угодно много, т.е. 1 эталон и 30 подгоняемых под эталон; программа сразу стабилизирует общую длину файлов под эталон, т.е. если эталон равен 10 минутам ровно, а подгоняемый или подгоняемые файлы 11 минут, то подгоняемые файлы сразу сжимаются до 10 минут; после того, как общая длинна аудиодорожки одинаковая, то программа смотрит как урезать паузы у подгоняемых файлов, согласно эталону, важно, чтобы когда голос начинается после паузы у эталона, тогда голос начинается и у подгоняемого файла; иногда получается так, что начало голоса одинаковое, но окончание разное, и тут есть 2 пути, либо крадется следующая пауза, либо замедляется/ускоряется звук в рамках сегмента, в случае замедления/ускорения под эталон, происходит побочный эффект в виде плавающей скорости речи, но скорее всего она будет малозаметной. В случае необходимости, возможно на эталоне делать паузы любой длины, как и у самих файлов, которые будут подгоняться под эталон. Проблемные вопросы: в случае, если структура файла неверная, т.е. в эталоне 10 пауз, а в передаваемом файле их 20, то надо предупредить пользователя, что какая-то проблема, что-то не так, возможны иные системы защиты от дурака; в случае, если файл эталона и подгоняемый файл, один из залитых под редактирование, сильно разнится по времени, скажем, разница в 50% от эталона, это тоже признак, что что-то не так; возможны иные непредвиденные проблемы, которые в момент написания ТЗ оказались неочевидными. Ссылка на подопытные файлы ниже: drive.google.com/drive/folders/1Fpio618w5BcpVhwQQ2ADVv1wASfzLv-1?usp=sharing
Тип: Курсовая работа Предмет: Сети и телекоммуникации / Инфокоммуникационные системы и сети Тема: Структурная схема сети учебного корпуса. Объем: 16 страниц. Выполнение построения сети осуществить в программе Cisco Packet Tracer. Примеры, образцы прикладываю.
- Анализ пользовательских требований на основе коммуникаций с пользователями, заказчиком и проектной командой; - Формирование портретов пользователей и проектирование пользовательского взаимодействия; - Разработка концепции и графических прототипов интерфейсов; - Создание интерактивных прототипов; - Разработка дизайн-макетов интерфейсов; - Проведение регулярной экспертной оценки результатов разработки; - Совершенствование существующих интерфейсов; - Организация, проведение и оценка ...
Нужно сделать 3d модель для последующей печати на 3d принтере корпуса для принтера HP2055 по референсу. Фото референса, детальное описание в ЛС. приветствуются школьники и студенты.