История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...
Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьшения длины пробега и улучшения маневрирования ВС при...
Топ:
Процедура выполнения команд. Рабочий цикл процессора: Функционирование процессора в основном состоит из повторяющихся рабочих циклов, каждый из которых соответствует...
Определение места расположения распределительного центра: Фирма реализует продукцию на рынках сбыта и имеет постоянных поставщиков в разных регионах. Увеличение объема продаж...
Интересное:
Искусственное повышение поверхности территории: Варианты искусственного повышения поверхности территории необходимо выбирать на основе анализа следующих характеристик защищаемой территории...
Как мы говорим и как мы слушаем: общение можно сравнить с огромным зонтиком, под которым скрыто все...
Инженерная защита территорий, зданий и сооружений от опасных геологических процессов: Изучение оползневых явлений, оценка устойчивости склонов и проектирование противооползневых сооружений — актуальнейшие задачи, стоящие перед отечественными...
Дисциплины:
2021-03-18 | 156 |
5.00
из
|
Заказать работу |
|
|
Лекция 4. Данные и знания
Всегда вызывает интерес соотношение между данными и знаниями, в особенности представления (способы формализации) тех и других, модели представления данных и знаний, поскольку данные и знания — это форма представления информации в ЭВМ (рис. 1.17).
Информация, с которой имеет дело ЭВМ, разделяется на процедурную и декларативную.
Процедурная информация овеществлена в программах, которые выполняются в процессе решения задач, декларативная — в данных, с которыми эти программы работают (рис. 1.18).
Стандартной формой представления информации в ЭВМ является машинное слово, состоящее из определенного для данного типа ЭВМ числа двоичных разрядов — битов. В ряде случаев машинные слова разбиваются на группы по восемь двоичных разрядов, которые называются байтами.
Одинаковое число разрядов в машинных словах для команд и данных позволяет рассматривать их в ЭВМ в качестве одинаковых информационных единиц (ИЕ) и выполнять операции над командами, как над данными. Содержимое памяти образует информационную базу (рис. 1.19).
Для удобства сравнения данных и знаний можно выделить основные формы (уровни) существования знаний и данных. Как представлено в табл. 1.2, у данных и знаний много общего. Однако знания имеют более сложную структуру, и переход от данных к знаниям является закономерным следствием развития и усложнения информационных структур, обрабатываемых на ЭВМ.
Данные
Параллельно с развитием структуры ЭВМ происходило развитие информационных структур для представления данных.
Появились способы описания данных в виде: векторов, матриц, списочных структур, иерархических структур, структур, создаваемых программистом (абстрактных типов данных).
|
В настоящее время в языках программирования высокого уровня используются абстрактные типы данных, структура которых создается программистом. Появление баз данных (БД) знаменовало собой еще один шаг по пути организации работы с декларативной информацией.
По мере развития исследований в области ИнС возникла концепция знаний, которая объединила в себе многие черты процедурной и декларативной информации.
Сегодня термины «база данных», «информационная интеллектуальная система», как и многие другие термины информатики, стали широко употребительными. Причина этого — всеобщее осознание (социальная потребность) необходимости интенсивного внедрения ЭВМ и других средств автоматизированной обработки информации в самые различные области деятельности современного общества. Начало последней четверти нынешнего столетия по праву можно назвать началом эры новой информационной технологии — технологии, поддерживаемой автоматизированными информационными ИнС.
Актуальность проблематики ИнС и лежащих в их основе БД определяется не только социальной потребностью, но и научно-технической возможностью решения классов задач, связанных с удовлетворением информационных нужд различных категорий пользователей (включая как человека, так и программно-управляемое устройство). Такая возможность возникла (примерно на рубеже 70-х годов) благодаря значительным достижениям в области технического и программного обеспечения вычислительных систем.
База данных как естественнонаучное понятие характеризуется двумя основными аспектами: информационным и манипуляцион-ным. Первый аспект отражает такую структуризацию данных, которая является наиболее подходящей для обеспечения информационных потребностей, возникающих в предметной области (ПО). С каждой ПО ассоциируется совокупность «информационных объектов», связей между ними (например, «поставщики», «номенклатура выпускаемых изделий», «потребители» — категории информационных объектов, а «поставки» — тип отношений, имеющих место между этими объектами), а также задач их обработки. Манипуляционный аспект БД касается смысла тех действий над структурами данных, с помощью которых осуществляются выборка из них различных компонентов, добавление новых, удаление и обновление устаревших компонентов структур данных, а также их преобразования.
Под системой управления базами данных (СУБД) понимается комплекс средств (языковых, программных и, возможно, аппаратных), поддерживающих определенный тип БД. Главное назначение СУБД, с точки зрения пользователей, состоит в обеспечении их инструментарием, позволяющим оперировать данными в абстрактных терминах (именах и/или характеристиках информационных объектов), не связанных со способами хранения данных в памяти ЭВМ. Следует заметить, что средств СУБД может, вообще говоря, не хватать для решения всех задач той или иной ПО. Поэтому на практике приходится адаптировать (дополнять, настраивать) средства СУБД для обеспечения требуемых возможностей. Системы, получаемые путем адаптации СУБД к данной ПО, относятся к ИнС.
|
Жизнеспособная ИнС, т. е. способная поддерживать модель БД с учетом динамики развития ПО, по необходимости должна в качестве своего ядра содержать СУБД. Выработанная на сегодняшний день методология проектирования ИнС (с точки зрения БД) включает четыре основные задачи:
1) системный анализ ПО, спецификацию информационных объектов и связей между ними (в результате вырабатывается так называемая концептуальная, или семантическая, модель ПО);
2) построение модели БД, обеспечивающей адекватное представление концептуальной модели ПО;
3) разработку СУБД, поддерживающей выбранную модель БД;
4) функциональное расширение (посредством некоторой системы программирования) СУБД с целью обеспечения возможностей решения требуемого класса задач, т.е. задач обработки данных, характерных для данной ПО.
Знания
Знание — в теории искусственного интеллекта, базах знаний и экспертных системах — совокупность данных, фактов и правил вывода (у индивидуума, общества или у системы ИИ) о мире, включающих в себя информацию о свойствах объектов, закономерностях процессов и явлений, а также правилах использования этой информации для принятия решений.
|
Рассмотрим общую совокупность качественных свойств для знаний (специфических признаков знаний) и перечислим ряд особенностей, присущих этой форме представления информации в ЭВМ и позволяющих охарактеризовать сам термин «знания».
Прежде всего знания имеют более сложную структуру, чем данные (метаданные). При этом знания задаются как экстенсионально (т.е. через набор конкретных фактов, соответствующих данному понятию и касающихся предметной области), так и интенсионально (т.е. через свойства, соответствующие данному понятию, и схему снязсй между атрибутами).
С учетом сказанного перечислим свойства.
База знаний
База знаний, БЗ (англ. Knowledge base, KB) — это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний. Раздел искусственного интеллекта, изучающий базы знаний и методы работы со знаниями, называется инженерией знаний.
Под базами знаний понимает совокупность фактов и правил вывода, допускающих логический вывод и осмысленную обработку информации. В языке Пролог базы знаний описываются в форме конкретных фактов и правил логического вывода над базами данных и процедурами обработки информации, представляющих сведения и знания о людях, предметах, фактах событиях и процессах в логической форме.
Наиболее важным свойством информации, хранящейся в базах знаний, является достоверность конкретных и обобщенных сведений в базе данных и релевантности информации, получаемой с использованием правил вывода, заложенных в базу знаний. В ответах на простейшие запросы к базам знаний системы логического программирования Пролог, выдает значения «истина» и «ложь» в зависимости от наличия соответствующих фактов.
Обобщенные сведения в языке Пролог задаются с помощью правил логического вывода, выполняющих роль определения понятий, а также логических процедур, состоящих из наборов правил логического вывода. Достоверность обобщенных сведений зависит от наличия необходимых фактов и достоверности данных в базах знаний.
|
Наиболее важный параметр БЗ — качество содержащихся знаний. Лучшие БЗ включают самую релевантную, достоверную и свежую информацию, имеют совершенные системы поиска информации и тщательно продуманную структуру, и формат знаний.
Классификация баз знаний
В зависимости от уровня сложности систем, в которых применяются базы знаний, различают:
· БЗ всемирного масштаба — например, Интернет или Википедия
· БЗ национальные — например, русская Википедия
· БЗ отраслевые— например, Автомобильная энциклопедия
· БЗ организаций
· БЗ экспертных систем
· БЗ специалистов
Применение баз знаний
Простые базы знаний могут использоваться для создания экспертных систем и хранения данных об организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз — помочь менее опытным людям найти существующее описание способа решения какой-либо проблемы предметной области.
Онтология может служить для представления в базе знаний иерархии понятий и их отношений. Онтология, содержащая еще и экземпляры объектов не что иное, как база знаний.
База знаний — важный компонент интеллектуальной системы. Наиболее известный класс таких программ — экспертные системы. Они предназначены для построения способа решения специализированных проблем, основываясь на записях БЗ и на пользовательском описании ситуации.
Создание и использование систем искусственного интеллекта потребует огромных баз знаний.
Лекция 4. Данные и знания
Всегда вызывает интерес соотношение между данными и знаниями, в особенности представления (способы формализации) тех и других, модели представления данных и знаний, поскольку данные и знания — это форма представления информации в ЭВМ (рис. 1.17).
Информация, с которой имеет дело ЭВМ, разделяется на процедурную и декларативную.
Процедурная информация овеществлена в программах, которые выполняются в процессе решения задач, декларативная — в данных, с которыми эти программы работают (рис. 1.18).
Стандартной формой представления информации в ЭВМ является машинное слово, состоящее из определенного для данного типа ЭВМ числа двоичных разрядов — битов. В ряде случаев машинные слова разбиваются на группы по восемь двоичных разрядов, которые называются байтами.
Одинаковое число разрядов в машинных словах для команд и данных позволяет рассматривать их в ЭВМ в качестве одинаковых информационных единиц (ИЕ) и выполнять операции над командами, как над данными. Содержимое памяти образует информационную базу (рис. 1.19).
Для удобства сравнения данных и знаний можно выделить основные формы (уровни) существования знаний и данных. Как представлено в табл. 1.2, у данных и знаний много общего. Однако знания имеют более сложную структуру, и переход от данных к знаниям является закономерным следствием развития и усложнения информационных структур, обрабатываемых на ЭВМ.
|
Данные
Параллельно с развитием структуры ЭВМ происходило развитие информационных структур для представления данных.
Появились способы описания данных в виде: векторов, матриц, списочных структур, иерархических структур, структур, создаваемых программистом (абстрактных типов данных).
В настоящее время в языках программирования высокого уровня используются абстрактные типы данных, структура которых создается программистом. Появление баз данных (БД) знаменовало собой еще один шаг по пути организации работы с декларативной информацией.
По мере развития исследований в области ИнС возникла концепция знаний, которая объединила в себе многие черты процедурной и декларативной информации.
Сегодня термины «база данных», «информационная интеллектуальная система», как и многие другие термины информатики, стали широко употребительными. Причина этого — всеобщее осознание (социальная потребность) необходимости интенсивного внедрения ЭВМ и других средств автоматизированной обработки информации в самые различные области деятельности современного общества. Начало последней четверти нынешнего столетия по праву можно назвать началом эры новой информационной технологии — технологии, поддерживаемой автоматизированными информационными ИнС.
Актуальность проблематики ИнС и лежащих в их основе БД определяется не только социальной потребностью, но и научно-технической возможностью решения классов задач, связанных с удовлетворением информационных нужд различных категорий пользователей (включая как человека, так и программно-управляемое устройство). Такая возможность возникла (примерно на рубеже 70-х годов) благодаря значительным достижениям в области технического и программного обеспечения вычислительных систем.
База данных как естественнонаучное понятие характеризуется двумя основными аспектами: информационным и манипуляцион-ным. Первый аспект отражает такую структуризацию данных, которая является наиболее подходящей для обеспечения информационных потребностей, возникающих в предметной области (ПО). С каждой ПО ассоциируется совокупность «информационных объектов», связей между ними (например, «поставщики», «номенклатура выпускаемых изделий», «потребители» — категории информационных объектов, а «поставки» — тип отношений, имеющих место между этими объектами), а также задач их обработки. Манипуляционный аспект БД касается смысла тех действий над структурами данных, с помощью которых осуществляются выборка из них различных компонентов, добавление новых, удаление и обновление устаревших компонентов структур данных, а также их преобразования.
Под системой управления базами данных (СУБД) понимается комплекс средств (языковых, программных и, возможно, аппаратных), поддерживающих определенный тип БД. Главное назначение СУБД, с точки зрения пользователей, состоит в обеспечении их инструментарием, позволяющим оперировать данными в абстрактных терминах (именах и/или характеристиках информационных объектов), не связанных со способами хранения данных в памяти ЭВМ. Следует заметить, что средств СУБД может, вообще говоря, не хватать для решения всех задач той или иной ПО. Поэтому на практике приходится адаптировать (дополнять, настраивать) средства СУБД для обеспечения требуемых возможностей. Системы, получаемые путем адаптации СУБД к данной ПО, относятся к ИнС.
Жизнеспособная ИнС, т. е. способная поддерживать модель БД с учетом динамики развития ПО, по необходимости должна в качестве своего ядра содержать СУБД. Выработанная на сегодняшний день методология проектирования ИнС (с точки зрения БД) включает четыре основные задачи:
1) системный анализ ПО, спецификацию информационных объектов и связей между ними (в результате вырабатывается так называемая концептуальная, или семантическая, модель ПО);
2) построение модели БД, обеспечивающей адекватное представление концептуальной модели ПО;
3) разработку СУБД, поддерживающей выбранную модель БД;
4) функциональное расширение (посредством некоторой системы программирования) СУБД с целью обеспечения возможностей решения требуемого класса задач, т.е. задач обработки данных, характерных для данной ПО.
Знания
Знание — в теории искусственного интеллекта, базах знаний и экспертных системах — совокупность данных, фактов и правил вывода (у индивидуума, общества или у системы ИИ) о мире, включающих в себя информацию о свойствах объектов, закономерностях процессов и явлений, а также правилах использования этой информации для принятия решений.
Рассмотрим общую совокупность качественных свойств для знаний (специфических признаков знаний) и перечислим ряд особенностей, присущих этой форме представления информации в ЭВМ и позволяющих охарактеризовать сам термин «знания».
Прежде всего знания имеют более сложную структуру, чем данные (метаданные). При этом знания задаются как экстенсионально (т.е. через набор конкретных фактов, соответствующих данному понятию и касающихся предметной области), так и интенсионально (т.е. через свойства, соответствующие данному понятию, и схему снязсй между атрибутами).
С учетом сказанного перечислим свойства.
Внутренняя интерпретируемость знаний.
Внутренняя интерпретируемость предусматривает возможность установки для элемента данных связанной с ним системы имен. Система имен включает в себя индивидуальное имя, которое присвоено данной информационной единице, а последовательности имен для тех множеств или классов, в которые это имя входит. Наличие системы «избыточных» имен позволяет экспертной системе знать, что хранится в ее базе знаний, и, следовательно, уметь отвечать на нечеткие вопросы о содержимом базы знаний.
|
|
Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...
Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...
Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...
Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...
© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!