Театр одного актора (КВ-Лайт)

Якщо ви ставитеся хоча б до однієї справи не в жарт, а всерйоз, то напевно страждаєте від жорсткого дефіциту часу. Причому, часу не вистачає не тільки на обдумування, реалізацію та доведення проектів, а й на саме елементарне - поповнення своєї особистої професійної "бази знань". Що вже говорити про такі "надмірності", як знайомство з новинками художньої літератури: багато хто може дозволити собі цю розкіш тільки у відпустці.

Якщо вищесказане відноситься і до вас, пропоную скористатися відпрацьованою технологією. Кожен день ваш мозок вимушено "простоює" багато хвилин, а то й годин: наприклад, коли ви забираєте квартиру, перебуваєте за кермом автомобіля, в трамвайної тисняві, в черзі до зубного лікаря і т.п. Використовувати цей час для споживання корисної інформації допоможуть програми синтезу мови , Багато з яких мають функцію запису в mp3-формат (а далі - справа техніки: скинути отримані аудіодокументи або аудіокниги на кишеньковий комп'ютер або mp3-флеш плеєр).

Ще кілька років тому, коли я тільки захопився темою синтезу мови, користувачі висловлювалися на форумах одностайно: краще програми "Говорилка" ( www.vector-ski.ru/vecs/govorilka ) не знайти. На жаль, ця програма вже кілька років не підтримується (хоча днями її автор пообіцяв в листі представити публіці нову версію в доступній для огляду перспективі). Святе місце порожнім не буває, і в ході недавнього пошуку по темі синтезу мови я виявив, що у народу з'явилися нові фаворити. Зокрема, багато користувачів рекомендують один одному програму Mp3book2005 ( www.mp3book2005.narod.ru ). Вона припала багатьом до вподоби завдяки унікальній особливості: вмінню автоматично змінювати темп, тембр і висоту мовлення в залежності від контексту. Завдяки цьому створені з її допомогою аудіокниги позбавлені традиційної монотонності комп'ютерного синтезатора мови. Комп'ютер перетворюється в театр одного актора, що створює цілі аудіопостановкі з безліччю героїв.

Давайте познайомимося з програмою і її розробником докладніше.


Володимир Шойтов-Харітановскій. 45 років. Освіта вища. Живе і працює в г.Курска (РФ). Голосовими технологіями займається майже 10 років, спочатку як користувач, а потім і як розробник.


- Володимире Юрійовичу, що Вас змусило зайнятися складним завданням синтезу мови?

- Одне з моїх постійних захоплень - фантастика. Я людина ледачий, тому завжди хотів, щоб книжку мені хто-небудь читав. Коли близько десяти років тому на світ з'явилася програма "Та, що говорить Миша для дому", я в ній знайшов те, що так довго шукав! Але з точки зору створення аудіокниг ця програма була недосконала: вона, наприклад, не сприймала текстові файли більше 40 кілобайт. А запис звукових файлів у ній була відсутня взагалі. Не цілком влаштувала мене і чудова програма Антона Рязанова Govorilka_CP. Я зрозумів, що з досить специфічною проблемою записи аудіокниг можу впоратися і сам, причому набагато краще.

- Як Вам прийшла в голову ідея, так би мовити, режисирування аудіокниг? Чи є у неї аналоги?

- Ідея наблизити звучання комп'ютера до нормального людського мови виникла відразу після знайомства з "Мовець Мишею". У ній закладена можливість за допомогою розстановки службових команд створювати свого роду радіо-вистави - з музикою, піснями та іншими ефектами. Залишалося зробити програму, яка буде сама аналізувати текст і автоматично розставляти потрібні команди в потрібних місцях, розбиваючи текст на блоки і програмно змінюючи параметри голосу в діалогах. Спочатку я створив свою програму для власних потреб, але потім зважився її опублікувати. У 2003 році з'явилася безкоштовна MP3book, в 2005-му - платна MP3book2005. Ще в минулому році моя розробка досить довго залишалася єдиною на ринку програмою, здатної автоматично розбивати текст книги на інтонаційні фрагменти і аналізувати діалоги. Але потім ідея настільки захопила маси, що окремі програмісти стали використовувати її у власних розробках. З деякими авторами (наприклад, з Олегом Подленко - www.kom-pas.narod.ru , Який створив програму Аudiobook) у мене склалися дуже хороші творчі стосунки: ми регулярно обмінюємося ідеями і новою інформацією по голосовим технологій.

- Які переваги і недоліки Mp3book2005, в порівнянні з конкуруючими продуктами?

- Коли я знайду програму, яка буде повністю відповідати всім моїм запитам, то, напевно, перестану розвивати свій проект. Є платна MaxReader ( maxreader.narod.ru ), Але розроблялася вона для незрячих користувачів, а для нормальних людей дуже незручна. Є безкоштовна "Говорилка", як і раніше одна з кращих програм синтезу мови, але вона практично непридатна для запису аудіокниг. Обидві програми підтримують лише старий стандарт SAPI-4, і нові розробки голосових движків їм недоступні. Є безкоштовний Audiobook, що підтримує новий стандарт SAPI-5, але він, як і попередні програми, не аналізує діалоги і мова виходить монотонної. Іноземні програми практично непридатні для використання російськомовної аудиторією, оскільки в них завжди виникають проблеми з голосовим движком: наприклад, Digalo2000 відмовляється вимовляти букву "ч" в будь-яких словах! Можливо, ситуація зміниться, коли азіатські виробники побутових пристроїв, які вже почали вбудовувати в свої вироби чіпи синтезу мови, зможуть забезпечити якісний синтез російської мови. Але повернемося до Mp3book2005. Її переваги: ​​прискорена запис в аудіофайл, підтримка форматів для мобільних телефонів і розширені сервісні функції. Дуже низьке завантаження процесора при роботі програми дозволяє створювати аудіокниги в фоновому режимі. Недолік - відсутність оперативного контролю процесу запису аудіокниги: зупинити запис можна тільки за допомогою горезвісної комбінації клавіш Ctrl + Alt + Del і диспетчера задач Windows. Але це проблема не стільки самої програми, скільки голосового інтерфейсу SAPI-5 від Microsoft. Можливо, в майбутньому я перейду на голосовий модуль сторонніх виробників, в якому такої проблеми немає - принаймні, перші експерименти мене дуже обнадіяли.

- Який відгук користувачів на Вашу програму?

- Mp3book2005 доступна в інтернеті майже рік. За цей час її скачало більше тисячі користувачів популярних download-порталів ( GetSoft.ru , Download.ru та ін.). Але основний потік закачувань йде з мого сайту www.mp3book2005.narod.ru - в середньому, його відвідують чотири тисячі користувачів в місяць. Незареєстрованої версією можна безкоштовно користуватися необмежений час - її функції урізані незначно. Серед зареєстрованих користувачів є спецбібліотеці для сліпих Барнаула і організація товариства сліпих Одеси. Для студії звукозапису аудіокниг "КРОТ" міста Желєзногорська зроблена спеціальна версія з їх рекламними вставками. Індивідуальні користувачі - це, в основному, люди старше 25 років, які на MP3-плеєрі слухають не тільки музику. Захоплених відгуків не багато (в основному, від жінок, в силу їхньої емоційності). Як правило, мені приходять листи з позитивною, в цілому, оцінкою програми і проханням реалізувати в майбутніх версіях якусь конкретну функцію. Якщо ці прохання не йдуть врозріз з моєї концепцією розвитку програми, я обов'язково йду назустріч "побажанням трудящих". Крім побажань, багато користувачів надають практичну допомогу. Особливо я вдячний Володимиру Ніколайчуку за надіслану інформацію по голосовим движкам і допомогу в тестуванні програми, а також професору Г.Н. Сердюкова - за надані електронні словники і практичні ідеї по оптимізації озвучування омографів (слів з однаковим написанням, але різним, залежно від контексту, вимовою).

- Які сфери можливого застосування програми?

- Основна - заповнення безцільно розтрачуємо часу приємним або корисним заняттям. Маю на увазі прослуховування аудіокниг (художніх творів, навчальної літератури та ін.) В тих життєвих ситуаціях, коли час просто не має сенсу, а читати звичайну книгу або незручно, або взагалі неможливо. Це можуть бути тренування в спортзалі і домашні клопоти, стояння в чергах і сидіння в транспорті, відпочинок і монотонна фізична робота. За допомогою Mp3book можна виробляти аудіокниги в промислових масштабах - благо, в програмі є можливість многокомпьютерной обробки, яка пропорційно збільшує продуктивність. Для серйозних студій аудіозаписи це можливість оперативно випустити "сигнальний" тираж перед студійної акторської записом з метою оцінки купівельного попиту (за аналогією з відео: спочатку - піратська "екранка", потім - ліцензійний DVD).

- Чи багато часу Ви приділяєте свого проекту?

- Голосові технології - це моє хобі, і тому, природно, я займаюся цим у вільний від роботи час, іноді навіть на шкоду родині. Саме тому програма MP3book2005 відноситься до категорії умовно-безкоштовних - щоб хоч якось виправдати моє захоплення комп'ютерним синтезом мови перед моїми близькими.

- І традиційне запитання - плагіатори, прокиньтеся! - про Ваших творчих планах ...

- Природно, буду займатися подальшим розвитком програми і, в першу чергу, виправленням недоробок майкрософтовського SAPI-5. Є ще кілька ідей, про які поки скромно промовчу. Конкуренти насправді ніколи не дрімають! До речі, до конкурентам ставлюся дуже доброзичливо. Їх наявність - додатковий стимул для вдосконалення програми! А ось до плагіаторам ставлення - як у будь-якої нормальної людини: це невдахи, які намагаються видертися на чужі плечі. Хоча наявність плагіату - теж в якійсь мірі підтвердження популярності і високого рівня програми.

Розмовляв Юрій СМИРНОВ

Володимире Юрійовичу, що Вас змусило зайнятися складним завданням синтезу мови?
Як Вам прийшла в голову ідея, так би мовити, режисирування аудіокниг?
Чи є у неї аналоги?
Які переваги і недоліки Mp3book2005, в порівнянні з конкуруючими продуктами?
Який відгук користувачів на Вашу програму?
Які сфери можливого застосування програми?
Чи багато часу Ви приділяєте свого проекту?