Разработка технологии автоматического распознавания непрерывной русской речи, организация производства и продаж. — КиберПедия 

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...

Разработка технологии автоматического распознавания непрерывной русской речи, организация производства и продаж.

2017-09-29 1056
Разработка технологии автоматического распознавания непрерывной русской речи, организация производства и продаж. 0.00 из 5.00 0 оценок
Заказать работу

Проект 5.

Разработка технологии автоматического распознавания непрерывной русской речи, организация производства и продаж.

 

Краткое описание технических параметров

 

Предлагаемая технология основана на использовании фонемного распознавания речи. Разработанный алгоритм идентификации каждого отдельного звука дает проекту технологическое преимущество перед аналогами, так как повышает точность распознавания до 95-98%.

Благодаря уникальному базису на основе обучаемых искусственных нейронных сетей, программа сама приспосабливается к лингвистическим особенностям пользователя и устраняет проблему распознавания речи у людей, страдающих её дефектами.

 

Количественные параметры проекта, необходимые для оценки эффективности и анализа инвестиционной привлекательности

 

Горизонт расчета проекта ограничен 5 годами

 

Продукты и сегменты рынка:

Программный продукт для распознавания непрерывной речи в режиме реального времени для РС и мобильных устройств, контакт-центров с использованием уникальной технологии распознавания речи на основе искусственных нейронных сетей с высоким уровнем обучаемости.

Программа распознавания речи может применяться

· для быстрого доступа к оперативной информации (новости, спортивные известия, прогноз погоды, информация о ценных бумагах, и пр.) Контролируемые голосом wеb-браузеры избавляют пользователя от медленных ручных операций (ввода с клавиатуры).

· для голосовых диктофонных систем, необходимых людям тех профессий где требуется набор большого объема текстовой информации (врачам, юристам, журналистам, писателям).

· для активируемых голосом домашних приборов и приспособлений, управление бортовым компьютером в автомобиле.

Потребители

Компании, занимающиеся разработкой программного обеспечения (ПО) для корпоративных и коммерческих (аутсорсинговых) контакт - центров (call – центры – системы для сбора и обработки информации поступающей от клиентов), а также для IVR-систем (Interactive Voice Recognition). В число наиболее крупных компаний входят: Naumen, Avaya.

Согласно информации, полученной после переговоров с представителями таких компаний, система распознавания речи будет наиболее востребована в следующих приложениях:

- Замена тонального набора с различных справочных системах на голосовой набор;

- Использование в справочных системах для облегчения процесса получения необходимой абоненту информации (к примеру, в аэропортах – информация по конкретному рейса, в кинотеатрах – информация по конкретному фильму);

- В контакт-центрах крупных и средних компаний для облегчения процесса соединения с конкретным человеком, отделом.

Для рассмотренных применений технология распознавания речи имеет два важных преимущества:

· Во-первых, значительно облегчается ввод данных для абонента;

· Во-вторых, сокращается время обслуживания клиента и, естественно, уменьшаются расходы на телефонную сеть общего пользования.

 

Пользователи мобильных устройств

Здесь выделяются следующие основные категории пользователей:

- Пользователи КПК, УМУ (смартфоны,совмещают в себе свойства телефона и компьютера, коммуникаторы, GPS-навигаторы).

Современные смартфоны обладают достаточно широкими возможностями и позволяют достаточно эффективно работать с большинством офисных приложений. Однако, на сегодняшний день не существует по настоящему удобного средства для набора текста в различные мобильные устройства. Предлагаемые решения (стилус, клавиатура) существенно ограничивают скорость набора. Предлагаемое ПО является универсальным способом решения данной проблемы, позволяя не только полноценно работать в различных офисных приложениях мобильных устройств, но и осуществлять удобную навигацию по меню и управление работой устройства.

 

Рис. 3.2. Структура рынка речевых технологий

 

Согласно данным маркетингового исследования, проведенного компанией «Cognitive Technologies», объем российского рынка речевых технологий к концу 2017 года составит около 5500 млн. рублей. С учетом общего объема мирового рынка (67 млрд. рублей, данные компании Allied Business Intelligence, объем российского рынка составит от него около 8,2%. Ежегодный рост рынка прогнозируется на уровне - 20-25%.

Перечень конкурентов, цены конкурентов

 

Существуют как специализированные программы автоматического распознавания речи, так и программы, обладающие такой функцией среди прочих.

Разработчиками программ по распознаванию речи являются в основном иностранные фирмы. Лидирует в мире в этом направлении компания IBM.

Основные разработчики программ распознавания речи.

 

Продукт Dragon Naturally Speaking Preferred Via Voice Горыныч Проф. 1.0 (Dragon Dictate) Sakrament ASR Engine Наш продукт
Степень распознавания 90 % 80 % 60 – 70 % 85 % Не менее 95 %
Распознавание непрерывной речи нет слабое нет нет есть
Необходимость настройки на голос пользователя До 1 -2 часов До 1 -2 часов До 1 -2 часов Не требуется Не требуется
Обучаемость Нет Нет Слабая Нет Высокая
Распознавание русского языка Нет Нет Да Да Да
Цена 4 тыс. руб. От 1,9 до 3 тыс. руб. 1 тыс. руб. 3,75тыс. руб. 3 тыс. руб.

 

Принцип работы программ конкурентов построен на соответствии речи говорящего речи идеального диктора. Программа оценивает степень близости фонем говорящего человека к заложенным фонемам идеального диктора

 

Емкость сегмента рынка

Через пять лет реализации проекта компания планирует захватить 7,7 % (таблица) существующего рынка речевых технологий, в трех сегментах, распознавание русской речи для целей колл-центров, распознавание речи в персональных компьютерах для целей быстрого набора большого объема информации, навигации в Интернет, поиска оперативной информации и распознавание русской речи на мобильных устройствах (УМУ, КПК) для быстрой навигации и вызова опций.

Продажи будут осуществляться на территории России и для русскоязычного населения стран мира.

 

Год Потенциальный рынок России, с учетом ежегодного роста 20% (млн. руб.) Доля, планируемая к захвату в %
  5 550 -
  6 700 0,18
  8 000 1,6
  9 600 4,9
  11 500 7,7

 

Прогноз продажв натуральных и денежных единицах.

Год Объем продаж в натуральном выражении (комплект ПО и обновления ПО, тыс. штук) для физ. лиц Объем продаж в денежном выражении (млн. руб.) Объем продаж в натуральном выражении (комплект ПО и обновления ПО, тыс. штук) длякорпроративных пользователей Объем продаж в денежном выражении (млн. руб.)
  - - - -
  2,3 6,9 0,05  
  3,5 10,5 1,2  
  23,9 71,7    
  29,2 87,6    

 

 

Ценообразование и продвижение продукции

Цены на продукцию будут устанавливаться методом наценки на издержки, где минимальная цена определится валовыми издержками, а максимальная - платежеспособностью заказчика. Для корпоративных потребителей (coll- центры, производители автомобилей, стационарных телефонов и пр.) будет на уровне 100 тыс. руб. Для индивидуальных потребителей цена составит не более – 3000 руб.

Программное обеспечение будет поставляться комплектом из СD или DVD диском с записью программы и аппаратным USB ключом для запуска программы распознавания речи.

Реализация программного обеспечения будет производиться через существующие центры продаж программного обеспечения, компьютерной техники, кроме того программу можно будет купить на специализированном веб-сайте, где в течение года после покупки можно будет скачивать обновления программы, по прошествии первого года, обновления будут продаваться по цене 500 руб. за одно обновление.

 

Необходимые коммуникации.

Необходима телефонная линия, оптоволоконный Интернет, затраты составят 18 тыс. в год.

 

Налоговое окружение.

Компания будет действовать в режиме упрощенной системы налогообложения, исключающей уплату НДС. Налоговая база, на этот период будет состоять из следующих налогов: начисления на ФОТ - 30,2%, единый налог – 15% от разницы (доходы – расходы).

Необходимый объем инвестиций. Направления расходования средств.

Объем инвестиций, требуемый для реализации проекта – 17,7 млн. руб.

Стоимость имущества

Наименование Кол-во Стоимость тыс. руб. Итого тыс. руб.
Оборудование
  Компьютер      
  Сервер      
  Микрофон (профессиональный)   3,3  
  Мультифункциональное устройство   15.0 30.0
  Дубликатор CD дисков   35.0 35.0
  Устройство для нанесения галлограмм   40.0 40.0
  Принтер CD/DVD дисков   30.0 30.0
Офисная мебель
  Компьютерный стол   2.5  
  Кресла   1.5  
  Подкатные тумбочки      
  Шкафы под документы      
Лицензионное ПО
  Windows XP Professional Russian      
  Windows Server Standart      
  Microsoft Office Professional      
  Microsoft Visual Studio Pro w/MSDN Pro 2005 English CD      
  Microsoft Projects Pro, Open Lisence      
  C++Builder 2007 Enterprise      
  Антивирус Касперского, версия      
  Всего      

Затраты на персонал

 

1 ГОД
Специалисты Количество Оклад тыс. руб. Сумма тыс. руб. в мес.
Генеральный директор      
Руководитель отдела НИОКР      
Программист на постоянной основе      
Программист на временной основе      
Бухгалтер (0.5 ставки)      
Математик (0.5 ставки)      
Лингвист (0.5 ставки)      
Специалист по акустике (0.5 ставки)      
Итого ФОТ в месяц 21.00    
2 ГОД
Специалисты Количество Оклад Сумма
Генеральный директор      
Коммерческий директор      
Руководитель отдела НИОКР      
Программист на постоянной основе      
Программист на временной основе      
Сотрудник отдела продаж      
Бухгалтер (0.5 ставки)      
Итого      
3,4,5 ГОД реализации проекта
Специалисты Количество Оклад Сумма
Генеральный директор      
Коммерческий директор      
Руководитель отдела НИОКР      
Программист      
Маркетолог      
Бухгалтер (0.5 ставки)      
Итого      

 

Проект 5.

Разработка технологии автоматического распознавания непрерывной русской речи, организация производства и продаж.

 

Краткое описание технических параметров

 

Предлагаемая технология основана на использовании фонемного распознавания речи. Разработанный алгоритм идентификации каждого отдельного звука дает проекту технологическое преимущество перед аналогами, так как повышает точность распознавания до 95-98%.

Благодаря уникальному базису на основе обучаемых искусственных нейронных сетей, программа сама приспосабливается к лингвистическим особенностям пользователя и устраняет проблему распознавания речи у людей, страдающих её дефектами.

 


Поделиться с друзьями:

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Индивидуальные очистные сооружения: К классу индивидуальных очистных сооружений относят сооружения, пропускная способность которых...

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.011 с.