Что такое Аудиокниги и синтезаторы речи. — КиберПедия 

История создания датчика движения: Первый прибор для обнаружения движения был изобретен немецким физиком Генрихом Герцем...

Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...

Что такое Аудиокниги и синтезаторы речи.

2018-01-28 239
Что такое Аудиокниги и синтезаторы речи. 0.00 из 5.00 0 оценок
Заказать работу

В Эру цифровых технологий, угнаться за информацией, увеличивающейся чуть ли не в геометрической прогрессии, крайне сложно и в то же время чрезвычайно необходимо. Особенно когда институты образования и науки деградируют.Про это я писал в статьях: «Студенты - учащие конспект наизусть!», «Ликвидация образования Украины».Так же напомню, что из-за отсутствия времени,многим кажется, что заниматься самообразованием,в нашем ущербном и архаичном обществе, не только пустое занятие, но и роскошь. Что делать, когда есть масса полезных и интересных книг, статей, журналов, монографий и т.д.,а времени читать нет? Да и читать, книгу глазами уже мало кому нравится. Гораздо приятнее и продуктивнее её слушать. И тут нам на помощь приходят аудио книги и синтезаторы речи.

В других статьях (главах) рассматривал, «Электронные или бумажные книги лучше?», потом в статье «Зачем и как распознавать книги?» -подробно разъяснил, почему распознанный текст лучше простосканированного. Теперь пришло время остановиться на столь популярных аудиокнигах, и несправедливо отброшенных синтезаторах речи. Мне действительно есть, что написать по этому поводу т.к. переслушал уже не одну тысячу книг синтезаторами, а также для сравнения прослушал пару десятков книг в аудио-формате.

Итак, для начала, тем, кто не знает,в продолжение раздела «Электронные книги и ридеры. (устройства).», постараюсь повторить и дать дополнительные определение уже того, что такое аудио книга и что такое синтезатор речи.

Аудиокнига.

Это звукозапись речи человека, который читает книгу. Её можно записать, типа песни, в формате мп3. После этого, как и песню, слушать на любом плеере, компьютере, смартфоне, телефоне и т.д. Зачастую, естественно прочтенная книга на много длиннее чем песня. Поэтому такую книгу разбивают на много файлов – кусочков. Как правило, делят на части с учетом глав книги. Например, «предисловье», «первая глава», и т.д. Хотя, стоит уточнить, что и аудиокниги, постоянно развиваются и возможно, вскоре, это будет не только обычный звуковой файл. Но классические аудиокниги, грубо говоря, именно записанный голос человека, который читает книгу. Пока остановлюсь на этом, а убогие перспективы аудиокниг рассмотрю позже.

Синтезаторы речи.

Программы, которые могут прочесть текст. Т.е. преобразовать, к примеру, текст из ворда,веб сайта или др. текстового редактора и просмотрщика в звук.

Здесь хотелось бы сделать маленькое отступление, т.к. я раньше путал программы ридеры с синтезаторами речи. Ридеры это, на мой взгляд, убогие бесполезные программы, как и физические устройства с одноименным названием. Они наверно предназначены для отсталых домохозяек. Основная их функция, заключается в автоматическом проматывании текстов. Т.е. вам не надо пальцем крутить колесо мыши во время чтения. Конечно, у них есть и др. функции, но, по сути, я еще не встретил не одного ридера, который бы стал мне полезен, и функции которого нельзя было реализовать в различных текстовых редакторах. Например, ворде или опенофисе, так же можно проматывать текст, увеличивать шрифт,размер, фон, делать закладки и т.д. В общем ридеры для тех, кто любит глазами J читать с экрана, но не умеет полноценно пользоваться MicrosoftWord или OpenOffice. Совсем другое дело синтезаторы речи. Тут уже идет именно синтез речи из букв в звуки. Программа читает текст вместо вас! Проговаривает голосом компьютера слова.В этом и заключается вся сущность синтезаторов речи.Они-то и делают магический метаморфоз, превращающийтекст на экране(зачастую) в членораздельную, слышимуюи понятную речь.

В общем если сказать по-простому: аудиокнига это записанный какой-то один текст в звук (как правило, диктором), а синтезатор речи — это программа, которая может сама без участия дикторов преобразовать в любое время любой текст в звук.

 

Опубликовано [15]28.01.2015

Преимущества и недостатки аудиокниг и синтезаторов речи.

Для наглядности я условно разделюпреимущества и недостатки на 3и группы.

1–в принципе не реализуемые –которые невозможно реализовать.

2 – еще не реализованные – те, которые пока еще не реализовали.

3 – субъективные – те, которые вряд ли будут реализовывать т.к. они связаны с привычками, личными предпочтениями тех или иных людей. Это так сказать людские необоснованные прихоти, цепляние за традиции, атавизмы.

Преимущества аудиокниг.

-аудиокниги не требуют программы.

Либо им достаточно установки простенького плеера. Вам не требуется устанавливать программ для синтеза речи. Тем более если у вас книга записана на кассетный магнитофон.Хотя, если это уже цифровая техника, то может потребоваться установка плеера для проигрывания звука. К сожалению, почему-то плеер, как правило, устанавливают по умолчанию во многие устройства, а вот программы синтеза речи - нет… Несмотря на то, что технический это возможно сделать практический на любом современном устройстве.Соответственно отсутствие программ относится ко второй группе – можно реализовать, тем самым устранив данный недостаток, но пока не реализовали. Посему надеюсь, в скором будущем все современные устройства так же будут снабжены синтезатором речи, как и обычным плеером. К примеру, если не ошибаюсь, начиная с WindowsХрв систему Microsoft встраивают голосовой синтезатор. Но, по-видимому, это дань светлым идеям основателей компании. Бил Гейтс, кажется, в своей книге «Бизнес со скоростью мысли» упоминал о том, что надо развивать данные технологии: как синтез речи, так и восприятие голоса человека машиной. Увы, когда Гейтс ушел с компании она (извиняюсь за выражение) совсем захирела.Многие светлые идеи так и остались недоработанными, а место доморощенных программистов заняли кумовские блондинки и пиар-мальчики, сделавшие упор на разработке висюлек и бантиков внешнего вида недоработанной системы. Впрочем, тему Microsoft я уже затрагивал в другой статье «WindowsХР- похоронена заживо», поэтому вернусь к синтезаторам. На многих устройствах они все еще не установлены изначально. Хотя их можно доустановить самому как на компьютеры под ОС Windows и Linux, так и на смартфоны на платформе симбиан и андроид.

Теперь, перейдем к устройствам, в которых в принципе данные технологии не реализуемы. Т.е. их невозможно реализовать. Это кассетные магнитофоны, грамм пластинки, если не ошибаюсь,и самые древние сотовые телефоны. В этих всех устройствах можно прослушать записанную музыку и любую аудиозапись, в т.ч. и записанный с компьютера в аудио-формате: прочтенный программой текст.Но в них самих нельзя выполнить именно синтез речи. На кассетный магнитофон нельзя в принципе установить программу синтеза речи; а вот аудио книгу записать на аудио магнитофон и грампластинку- можно. Так что тут аудиокниги вне всяких сомнений имеютпреимущество, которое для синтезаторов в принципетехнический не реализуемы.Но это преимущество отчасти даже кажется смешным, т.к. вряд ли кто-то будет пользоваться грампластинками. Тем не менее, анахронисты будут всегда с пеной у рта доказывать, что грампластинки лучше – у них лучше звучание, они надежнее и т.д. Для нормальных людей уже созданы масса устройств типа ПК и смартфонов, на которые можно без труда установить синтезатор речи, с такой же легкостью, как и плеер.

И все же аудиокниги в этом плане проще. Малый размер программы воспроизведения в отличии от программы синтезатора речи, в котором, на данный момент, помимо самой программы, надо устанавливать и голосовой модуль, а возможно и словари ударения.Поэтому хорошая программа для синтеза речи скорей всего будет весить значительно больше, чем самплеер для воспроизведения звуков.

Таким образом, данное преимущество аудио книг перед синтезаторами, в её простоте. Если развить аналогию, то аудио книга как дубина - можно любому по башке дать. В любое самое древнее устройство всунуть.А синтезатор, как аккуратный молоточек, для ювелирных работ: нужно умение смекалка, ловкость. -К доисторическим устройствам не применим.

- произношение, ударение, интонация,дикция и др. фикции.

Анекдот:

— Гляди, книжку старую нашёл. Обложка потёртая, осталось только:

"...альный... екс...ля...низма".

— Ого, советская прно?! — Да нет: "Моральный кодекс строителя коммунизма".

© http://anekdoty.ru/pro-knigi/page/2/?f=r

Произношениеаудиокнигизаписанной диктором, гораздо лучше, чем у синтезаторов. Это уже более весомое преимущество. Интонация, произношение, дикция, эмоции аудиокниг, не входят не в какое сравнение с монотонным бульканьем синтезатора. Вряд ли в скором времени появятся синтезаторы речи, которые могли бы с тем же воодушевлением читать книги,что и живые люди. Так что если вам интересна не сама книга, несам смысл написанного, а именно тот или иной диктор, то вам естественно лучше слушать дикторов. А еще лучше певцов – они «читают» в рифму и под музыку. А если вы хотите послушать шедевр ораторского гения, то слушать синтезатор, то же что искать смысл в какофонии писка диалап модема. Уже лучше послушайте Шаляпина, а желательно прямо в гроте. Долго колебался: к какой группе преимуществ отнести это. Скорей всего, если рассматривать книгу именно как источник информации, а не эстетического удовлетворения, то к субъективным.

Но почему-то люди считают, что книга именно должна красиво звучать и мелодично пахнуть. Мне не однократно приходилось слышать от некоторых, что голос синтезатора для них абсолютно не понятен. Их буквально коробило от слов, произносимых роботом. Но на самом деле это лишь субъективное впечатление. Да. Можно установить такой голосовой движок, и так его настроить, что он будет вызывать только смех.Но проявив смекалку, можно настроить и так, что удастся без труда понять сказанное.

Конечно, ради справедливости стоит заметить, что, даже вопреки словарям ударений, синтезаторы речи изредка ставят ударение неправильно. Иногда это действительно отвлекает и даже вызывает смех.

Вот, например,

Вместо фИИИговое дерево, произноситфигОООвое, а вместобелкИИИ, многие синтезаторы читают бЕЕЕлки. Но все же, вы и когда с бумаги глазами читаете, там тоже ударение, как правило,не стоит. Вам приходится догадываться. По началу, идети,когда учатся читать, они все еще ставят в незнакомых словах ударение неправильно, но потом, в процессе обучения, произносят правильно: произвольно, даже не задумываясь над этим. Поэтому особенно детям лучше начать прослушивания первых книг именно с аудиокниг, а уже потом перейти на синтетические голоса.Вряд ли в скором времени синтезаторам удастся обучиться воспринимать контекст. Программа, в отличии, от человека, так же могла бы запомнить, как ставить ударение.Но она пока не может понять, как произносить правильно идентичные слова, в которых ударение, в зависимости от контекста, разнИИИтся. Поэтому даже в предложении «Белки́ — высокомолекулярные органические вещества, состоящие из альфа-аминокислот, соединённых, в цепочку пептидной связью.» Некоторые синтезаторы читают бееелки ставя ударение на букву «е». Но все токи, думаю, даже прослушав этот текст синтезатором, грамотный человек понимает, что речь идет не о пушистых симпатичных зверьках, а о высокомолекулярных органических соединениях. Со временем, даже у самых нервозных слушателей дискомфорт должен прОпасть, а понимание не пострадать. Более того, некоторые словосочетания на слух могут позабавить, тем самым подняв настроение.

Например, в одной технической литературе мне встретилось словосочетание «матки кабеля». Хорошо, что не в биологической.J

Или вот, анекдот:

«Во фразах “Мы же на ты!” и “Мы женаты!” одинаковый набор и порядок букв. Но какой разный смысл!»

В данной книге есть, к примеру, сочетание «верхом интеллекта» в котором синтезатор ставит ударение на букву «о». Такое вряд ли в скором времени удастся исправить, поэтому придётся терпеть и улыбаться… А вот исправить прочтение цифр, исходя из контекста, можно было бы уже сейчас. Но пока многие синтезаторы продолжают читать первый век третьего тысячелетияХХІ века –как ха ха! века.

 

Но это мелочи, т.к. мозг человека так устроен, что он сам может дорисовывать картину мира – ставить в нужном месте ударения, и даже переставлять буквы местами. Например:

Цитата: «По рзелульаттамилссеоваднийодонгоанлигйсокгоунвиертисета, не иеемтзанчнеия, в кокам пряокдерсапожоленыбкувы в солве. Галвоне, чотбыпреавя и пслоендяябквуыблыи на мсете. Осатьлынебкувымгоутселдовтаь в плоонмбсепордяке, все-рвано ткестчтаитсея без побрелм. Пичрионйэготоялвятеся то, что мы чиатем не кдаужюбкуву по отдльенотси, а все солвоцликеом.» К. Ц.

Примечание для слушающих. В этом непонятном тексте некоторые буквы (в середине некоторых слов) поменяли местами. Их можно быстро прочесть даже этого не замечая.Но на слух воспринять, написанное, с ошибками именно такого типа, практический невозможно.

 

Далеко не все могут сразу это заметить.Особенно если читают быстро. Мозг, как бы автоматический меняет буквы местами, выставляя их в правильном порядке. Но это работает, если вы не пытаетесь изначально найти именно ошибки в тексте и проверить орфографию. Синтезаторы речи, естественно, сами не переставляют буквы. Да и мозгу, воспринимая такие слова на слух, понять подлог бывает проще, а разобрать слова сложнее.Поэтому некоторые ошибки в тексте, при определенной сноровке, бывает проще выявить на слух, нежели визуально. Но воспринимая текст на слух, в то же время можно не обращать внимание на неправильное ударение и другие нюансы.Так же как при быстром чтении глазами, смысл будет ясен.Даже если текст звучитдалеко не идеально. В общем, и там и там есть свои преимущества и недостатки. Но раз сейчас речь о недостатках синтезаторов, то опять вернемся к тому, насколько данный недостаток существенен.

При прослушивании, в головах опытных слушателей синтезаторов речи, все само собой становится на место. Я, к примеру: уже не обращаю внимания, на голос робота, а напротив дорисовываю в своем воображении и нужную интонацию, и картину, и понимаю настроение автора, без всяких дикторов.Ярким этому примером, из моего субъективного опыта, прослушиванияя является творчествоЖванетского. Несмотря на то, что его выступления монотонно тараторились женским голосом синтезатора речи на моём смарте, я получил массу впечатлений.При прослушиваниибуквально улавливал, и домысливал все детали харизмы этого тонкого и уникального юмориста. А вот сборник анекдотов, там, где прямая речь, мне не пошел… Многое я не смог воспринять – возможно, из-за того, что слушал очень быстро, может из-за того, чтонедостаточно опыта. Так что, все зависит от вас самих.Но все же, вряд ли вы слушаете диктора новостей в надежде, что он вам, что-то красиво споет, но люди слушающие книги, почему-то хотят услышать от синтезаторов речи именно хорошую интонацию, а не смысл. Конечно, я не стану отрицать, что все токи синтезаторы речи требуют значительной доработки. Из-за непопулярности данных программ сам синтез речи на достаточно низком уровне – особенно для русского и украинского языков (в сравнении с английским). Словари ударений весьма скудные…Да и сами программы сыроваты. А вот плееры для аудиокниг, как я уже писал,отработанные и буквально встроены в систему каждого девайса. Из-за чего, записанный человеческий голос, пока, в этом плане, выигрывает утехнологически еще молодых синтезаторов речи, которых можно было бы в большинстве случаев, обучить ставить правильно ударение и подбирать интонацию. Хотя,теоретический это естественно намного сложнее, чем просто воспроизвести речь. Да и не имеет смысла, есливажна именно суть написанного.

Тем не менее, если нужна не книга, а шедевр ораторского и актерского мастерства то лучше опять сходить в Колизей. Ой!Т.е. театр... Т.е. что я такое пишу у нас же двадцать первый век на дворе.Для современных дикарей уже театр записан в виде аудиокниг! Слушайте - не обляпайтесь! Раз фантазии и смекалки догадаться о настроении автора без диктора не хватает, то аудиокниги, как раз для вас. А еще лучше, все токи, живое общение.Ведь без мимики все равно не понятно, что же хотел сказать автор.J (Примечание. Специально для людей, слушающих данный текст через синтезатор: -В данный момент афтор улыбается…).

В принципе это все преимущества аудиокниг. Возможно, кто-то найдет еще какие-нибудь. Но я не нашел.

Опубликовал [16] 28.01.2015


Поделиться с друзьями:

Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...

Адаптации растений и животных к жизни в горах: Большое значение для жизни организмов в горах имеют степень расчленения, крутизна и экспозиционные различия склонов...

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

Архитектура электронного правительства: Единая архитектура – это методологический подход при создании системы управления государства, который строится...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.033 с.