Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет dibr ([info]dibr)
@ 2011-08-13 15:14:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
vocaloids
     До чего всё-таки дошёл прогресс синтеза речи. Ну, Хацуне Мику вроде все знают:
     Balalaika - Hatsune Miku
     Но "некоторая синтетичность", скажем, вот этого голоса - не сразу заметна, даже когда уже знаешь, что это так и есть:
     Long Long ago, 20th Century - Kaito.

     UPD: про первый ролик, похоже, был введён в заблуждение, и это человек. Но второй - точно синтез :-)


(Читать комментарии) - (Добавить комментарий)


[info]dibr@lj
2011-08-13 10:35 (ссылка)
Это, как ни странно, не очень важно :-) "Нечеловеческие" артефакты синтеза от языка слабо зависят - вот научат ту же Мику петь по русски (сейчас этого нет, у неё фонетика заточена под японский язык, с его особенностями) - мы тоже не заметим разницы :-)

Замечу, правда, что насколько я понимаю - для такого качества синтеза недостаточно "иметь программу, вбить текст и задать ноты" - требуется тщательная "доводка" деталей звучания вручную. Иначе будет звук "с интонациями программы", без артефактов, но "не живой". У той же Мику дофига роликов, где она поёт вполне заметно "синтетическим" голосом...

(Ответить) (Уровень выше) (Ветвь дискуссии)

Я эхо, горное эхо.
[info]slowkukuing@lj
2011-08-14 16:29 (ссылка)
Насколько я понимаю, это "с листа" не поётся...

lirics: лучшие спецИффекты (всякие синтезированные персонажи и прочие "полёты по воздуху") которые я до сих пор видел - в I Robot и у китайцев (типа "крадущийся тигр, затаившийся дракон"). Т.е. всю "движуху" делают люди, а "синтетикой" потом только полируют.

подозреваю, что и здесь так же - основную мелодику и интонации "насвистел Изя Кацман по телефону", а синтетика уже положила на это дело выбранный "voice" унд "pitch".

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Я эхо, горное эхо.
[info]dibr@lj
2011-08-14 17:08 (ссылка)
Motion capture для "спецэффектов" - да, удобно и хорошо, и очень часто используется: всё сыграли люди, а потом их просто перерисовали в нужных монстров. Но здесь я всё-таки сомневаюсь.

Поётся не с листа конечно, чтобы "с листа" петь - (почти) искусственный интеллект нужен. Но и не "изя насвистел, программа перепела голосом Мику" - за основу берётся всё-таки "лист" (текст и мелодия), а потом в программе допиливаются нюансы: "неправильно угаданные" программой тонкости произношения, дополнительные задержки-ускорения-сдвиги тональности. Если не допиливать (таких роликов с Мику тысячи - программа-то коммерчески доступна, используется соответственно кем ни попадя) - голос будет хороший, почти без артефактов, но слишком ровно интонированный (впрочем, "для музыки" часто и такой сойдёт) и потому таки не очень естественный. Если хорошо допилить - то, хм, пример выше :-)

(Ответить) (Уровень выше)


(Читать комментарии) -