Skip to Content

Исторический обзор работ в области Искусственного интеллекта

Исследования по ИИ часто классифицируются, исходя из области их применения, а не на основе различных теорий и школ. В каждой из этих областей применения на протяжении десятков лет разрабатывались свои методы программирования, формализмы; каждой из них присущи свои традиции, которые могут заметно отличаться от традиций соседней области исследования.

Тем не менее, можно выделить две научные школы с разными подходами к проблеме создания систем ИИ: конвенционный ИИ и вычислительный ИИ.
Конвенционный ИИ
В конвенционном ИИ главным образом используются методы машинного самообучения, основанные на формализме и статистическом анализе. К методам конвенционного ИИ относят:
- Экспертные системы: программы, которые действуя по определенным правилам, обрабатывают большое количество информации, и в результате выдают заключение на её основе.
- Рассуждение на основе аналогичных случаев (Case - based reasoning).
- Байесовские сети.
- Поведенческий подход: модульный метод построения систем ИИ, при котором система разбивается на несколько сравнительно автономных программ поведения, которые запускаются в зависимости от изменений внешней среды.
Вычислительный ИИ
Вычислительный ИИ подразумевает итеративную разработку и обучение, например, подбор параметров в сети связности. Обучение основано на эмпирических данных и ассоциируется с не-символьным ИИ и мягкими вычислениями. К основным методам относятся:
- Нейронные сети: системы с отличными способностями к распознаванию.
- Нечёткие системы: методики для рассуждений в условиях неопределенности (широко используются в современных промышленных и потребительских системах контроля).
- Эволюционные вычисления: здесь применяются понятия, традиционно относящиеся к биологии, такие как популяция, мутация и естественный отбор для создания лучших решений задачи. Эти методы делятся на эволюционные алгоритмы (например, генетические алгоритмы) и методы роевого интеллекта (например, муравьиный алгоритм).
Гибридный ИИ
В рамках гибридных интеллектуальных систем пытаются объединить два направления – конвенционный ИИ и вычислительный ИИ.
Экспертные правила умозаключений могут генерироваться нейронными сетями, а порождающие правила получают с помощью статистического обучения.
Многообещающий новый подход, называемый усилением интеллекта, рассматривает достижение ИИ в процессе эволюционной разработки как побочный эффект усиления человеческого интеллекта технологиями.
Разработки систем ИИ
Среди важнейших классов задач, которые ставились перед ИИ с момента его зарождения как научного направления (с середины 50-х годов ХХ века), следует выделить следующие трудно формализуемые задачи, имеющих большое значение для задач робототехники: доказательство теорем, управление роботами, распознавание изображений, машинный перевод и понимание текстов на естественном языке, игровые программы, машинное творчество (синтез музыки, стихотворений, текстов).

Доказательство теорем
Изучение приемов доказательства теорем сыграло важную роль в развитии ИИ. Формализация дедуктивного процесса с использованием логики предикатов помогает глубже понять некоторые компоненты рассуждений. Многие неформальные задачи, например, медицинская диагностика, допускают формализацию как задачу на доказательство теорем. Поиск доказательства математической теоремы требует не только произвести дедукцию, исходя из гипотез, но также создать интуитивные догадки и гипотезы о том, какие промежуточные утверждения следует доказать для вывода доказательства основной теоремы [10, 12].
В 1954 году А. Ньюэлл задумал создать программу для игры в шахматы. Дж. Шоу и Г. Саймон объединились в работе по проекту Ньюэлла и в 1956 году они создали язык программирования IPL-I (предшественник LISPа) для работы с символьной информацией. Их первыми программами стала программа LT (Logic Theorist) для доказательства теорем и исчисления высказываний (1956 год), а также программа NSS (Newell, Shaw, Simon) для игры в шахматы (1957 год).
LT и NSS привели к созданию А. Ньюэллом, Дж. Шоу и Г. Саймоном программы GPS (General Problem Solver) в 1957–1972 годах. Программа GPS моделировала используемые человеком общие стратегии решения задач и могла применяться для решения шахматных и логических задач, доказательства теорем, грамматического разбора предложений, математического интегрирования, головоломок типа «Ханойская башня» и т. д. Процесс работы GPS воспроизводит методы решения задач, применяемые человеком: выдвигаются подцели, приближающие к решению, применяется эвристический метод (один, другой и т. д.), пока не будет получено решение. Попытки прекращаются, если получить решение не удается.
Программа GPS могла решать только относительно простые задачи. Ее универсальность достигалась за счет эффективности. Специализированные «решатели задач» – STUDENT (Bobrov, 1964) и др. лучше проявляли себя при поиске решения в своих предметных областях. GPS оказалась первой программой (она была написана на языке IPL-V), в которой предусматривалось планирование стратегии решения задач.
Для решения трудно формализуемых задач и, в частности, для работы со знаниями были созданы языки программирования для задач ИИ: LISP (1960 год, J. MacCatthy), Пролог (1975-79 годы, D. Warren, F. Pereira), ИнтерLISP, FRL, KRL, SMALLTALK, OPS5, PLANNER, QA4, MACSYMA, REDUCE, РЕФАЛ, CLIPS. К числу наиболее популярных традиционных языков программирования для создания ИС следует также отнести С++ и Паскаль.
Распознавание изображений
Рождение робототехники выдвинуло задачи машинного зрения и распознавания изображений в число первоочередных [10].
В традиционном распознавании образов появился хорошо разработанный математический аппарат, и для не очень сложных объектов оказалось возможным строить практически работающие системы классификации по признакам, по аналогии и т. д.
В качестве признаков могут рассматриваться любые характеристики распознаваемых объектов. Признаки должны быть инвариантны к ориентации, размеру и вариациям формы объектов. Алфавит признаков придумывается разработчиком системы. Качество распознавания во многом зависит от того, насколько удачно придуман алфавит признаков. Распознавание состоит в априорном получении вектора признаков для выделенного на изображении отдельного распознаваемого объекта, и лишь затем в определении того, какому из эталонов этот вектор соответствует.
П. Уинстон в начале 80-х годов обратил внимание на необходимость реализации целенаправленного процесса машинного восприятия. Цель должна управлять работой всех процедур, в том числе и процедур нижнего уровня, т. е. процедур предварительной обработки и выделения признаков. Должна иметься возможность на любой стадии процесса в зависимости от получаемого результата возвращаться к его началу для уточнения результатов работы процедур предшествующих уровней.
У П. Уинстона, так же как и у других исследователей, до решения практических задач дело не дошло, хотя в 80-е годы вычислительные мощности больших машин позволяли начать решение подобных задач. Таким образом, ранние традиционные системы распознавания, основывающиеся на последовательной организации процесса распознавания и классификации объектов, эффективно решать задачи восприятия сложной зрительной информации не могли [9, 12].
В настоящее время под восприятием и распознаванием образов понимаются не просто технические системы, воспринимающие визуальную и звуковую информацию, кодирующие и размещающие ее в памяти, а проблемы понимания и логического рассуждения в процессе обработки визуальной и речевой информации.

Экспертные системы
Методы ИИ нашли применение при создании автоматических консультирующих систем. До 1968 года исследователи в области ИИ работали на основе общего подхода – упрощения комбинаторики, базирующегося на уменьшении перебора альтернатив исходя из здравого смысла, применения числовых функций оценивания и различных эвристик.
В начале 70-х годов произошел качественный скачок и пришло понимание, что необходимы глубокие знания в соответствующей области и выделение знаний из данных, получаемых от эксперта. Появляются экспертные системы (ЭС), или системы, основанные на знаниях.
- ЭС DENDRAL (середина 60-х годов, Стэнфордский университет) расшифровывала данные масс спектрографического анализа.
- ЭС MYCIN (середина 70-х годов, Стэнфордский университет) ставила диагноз при инфекционных заболеваниях крови, могла диагностировать небольшой набор заболеваний, причем часто так же точно как и доктора.
- ЭС PROSPECTOR (1974-1983 годы, Стэнфордский университет) обнаруживала полезные ископаемые.
- ЭС SOPHIE обучала диагностированию неисправностей в электрических цепях.
- ЭС XCON помогала конфигурировать оборудование для систем VAX фирмы DEC.
- ЭС PALLADIO помогала проектировать и тестировать СБИС-схемы –сверхбольшие интегральные схемы.
- ЭС JUDITH помогает специалистам по гражданским делам и вместе с юристом и со слов усваивает фактические и юридические предпосылки дела, а затем предлагает рассмотреть различные варианты подходов к разрешению дела.
- ЭС LRS оказывает помощь в подборе и анализе информации о судебных решениях и правовых актах в области кредитно-денежного законодательства, связанного с использованием векселей и чеков.
- ЭС «Ущерб» на основе российского трудового законодательства обеспечивает юридический анализ ситуации привлечения рабочих и служащих к материальной ответственности при нанесении предприятию материального ущерба действием или бездействием.
Список созданных ЭС можно перечислять очень долго. Были разработаны и внедрены тысячи реально работающих экспертных систем. Разработка инструментальных средств для создания ЭС ведется постоянно. Появляются экспертные системы-оболочки, совершенствуются технологии создания ЭС.
Язык Пролог (1975-79 годы) становится одним из основных инструментов создания систем, основанных на знаниях. В 1984 году Язык CLIPS (C Language Integrated Production System) начал разрабатываться в космическом центре Джонсона NASA [12]. Появляется инструментарий EXSYS, ставший в начале 90-х годов одним из лидеров по созданию ЭС [13].
В начале ХХI века появляется теория интеллектуальных агентов и экспертных систем на их основе [14]. Web-ориентированный инструментарий JESS (Java Expert System Shell), использующий язык представления знаний CLIPS, приобрел достаточную известность в настоящее время [15].
Среди отечественных инструментальных средств следует отметить веб-ориентированную версию комплекса АТ-ТЕХНОЛОГИЯ, разработанного на кафедре Кибернетики МИФИ. В этом комплексе вся прикладная логика как комплекса в целом, так и разработанных в нем веб-интегрированных ЭС, сосредоточена на стороне сервера [36].
Практика внедрения ЭС показала, что нет чудодейственных алгоритмов – нужна кропотливая работа по вводу в ЭВМ опыта и знаний специалистов всех областей науки.

Машинный перевод и понимание текстов на естественном языке
Началом работ по машинному переводу следует считать 1954 год, когда в США с помощью ЭВМ было переведено шестьдесят фраз. Этот известный «Джорджтаунский эксперимент» произвел неизгладимое впечатление на специалистов. Тогда казалось, что достаточно создать большие хранилища словарей для перевода с одного языка на другой, разработать правила перевода – и проблема будет решена. Когда выяснилось, что проблема не так проста, был создан язык-посредник, облегчающий сопоставление фраз на разных языках. Во второй половине семидесятых годов этот язык-посредник превратился в семантическую модель представления смысла переводимых текстов.
Таким образом, достижения в области машинного перевода оказались очень полезными для ИИ, так как они показали, что анализ естественно-языковых конструкций невозможен без создания семантической модели, в которой интерпретируется смысл слов. Создание семантической модели привело к пониманию необходимости создания языка для внутреннего представления знаний. И, наконец, важным достижением явилось понимание того, что анализ текстов на естественном языке состоит из четырех основных этапов: морфологический анализ, синтаксический анализ, семантический анализ, прагматический анализ [16, 17].
Задача разбора предложения на естественном языке даже с ограниченным словарем в сотню слов является типичной задачей ИИ. В 1971 году Т. Виноградом была создана система для достаточно формальных предметных областей и конкретных наборов предметов, обладающих однозначными, недвусмысленными характеристиками и названиями. Его знаменитая программа SHRDLU [18] работает в абстрактном мире, состоящем из разноцветных кубиков и пирамид. В этом мире функционирует «однорукий» робот Робби, способный общаться с человеком на естественном (английском) языке и совершать манипуляции с объектами этого мира. Этот робот также способен понимать достаточно сложные выражения и самостоятельно планировать свою деятельность и объяснять мотивы тех или иных действий.
Вот небольшой пример – фрагмент реального диалога с этой системой:
­ Найди блок, который выше, чем тот, что в твоей руке, и положи его в коробку.
­ ОК.
­ Поставь, пожалуйста, один из красных блоков на другой, а сверху либо зеленый блок, либо пирамиду.
­ ОК.
­ Служит ли самая короткая вещь, которая опирается на опору самой высокой пирамиды, опорой для чего-то еще?
­ Да, для зеленой пирамиды.
­ Когда ты брался за зеленую пирамиду?
­ В то время, когда я строил башенку из красного куба, большого красного блока и большого зеленого куба.
­ Почему?
­ Чтобы от нее избавиться.
­ Почему?
­ Чтобы освободить красный куб.
Многократное повторение вопроса «Почему?» в итоге приведет к ответу: «Потому что вы меня об этом попросили». Самым интересным здесь является то, что программа не отвечает на заранее заданные типовые фразы. SHRDLU, можно сказать, «понимает», о чем ее спрашивают, и отвечает достаточно разумно. Сам алгоритм Винограда настолько элегантен, что занимает всего несколько сотен строк кода на языке LISP, любимом языке разработчиков ИИ, занимающихся анализом естественного языка. Этот пример с роботом Робби весьма показателен.
Надо отметить, что даже для английского языка, который служит основой для всех современных языков программирования в силу своей лаконичности и достаточно формальной семантики, до сего дня не удалось создать более-менее эффективную программную систему, способную адекватно понимать смысл фраз из достаточно больших областей знаний, например, нашего обыденного мира.
В разборе и понимании естественного русского языка массу проблем создает сложная падежная система, склонения, времена, отсутствие формального порядка следования членов предложения. Также трудности связаны, в частности, с тем, что значительная часть информации в обычном диалоге с помощью языка не выражается определенно и ясно. Поэтому понимание естественного языка машинной с трудом поддается интерпретации. Тем не менее, российскими учеными созданы эффективные системы разбора фраз ограниченного естественного языка, а в последние годы был разработан ряд систем, таких как ViaVoice, способных обслуживать потребителей в различных сферах услуг [19], [20], [21].

Игровые программы
К числу первых игровых программ можно отнести программу Артура Самуэля по игре в чекерс (американские шашки), написанную в 1947 году, причем в ней использовался ряд основополагающих идей ИИ, таких, как перебор вариантов и самообучение.
Научить компьютер играть в шахматы – одна из интереснейших задач в сфере игровых программ, использующих методы ИИ. Она была поставлена уже на заре вычислительной техники, в конце 50-х годов. В шахматах существуют определенные уровни мастерства, степени качества игры, которые могут дать четкие критерии интеллектуального роста машины. Поэтому компьютерными шахматами активно занимались ученые умы во всем мире. Но шахматы – игра, соревнование, и чтобы продемонстрировать свои логические способности, компьютеру необходим непосредственный противник [21].
В 1974 году впервые прошел чемпионат мира среди шахматных программ в рамках очередного конгресса IFIP (International Federation of Information Processing) в Стокгольме. Победителем этого состязания стала советская шахматная программа «Каисса» . Эта программа была создана в Москве, в Институте проблем управления Академии наук в команде разработчиков программы-чемпиона, лидерами которой были Владимир Арлазаров, Михаил Донской и Георгий Адельсон-Вельский. «Каисса» показала всему миру способности русских специалистов в области эвристического программирования [12].
В наши дни Deep Blue – специализированный шахматный суперкомпьютер (IBM) одержал победу над чемпионом мира по шахматам – Гарри Каспаровым.
Машинное творчество
В 1957 году американские исследователи М. Мэтьюз и Н. Гутман посетили концерт одного малоизвестного пианиста. Концерт им обоим не понравился, и, придя домой, М. Мэтьюз тут же стал писать программу, играющую музыку. Идея Мэтьюза, развиваясь, породила целый класс музыкальных языков программирования, которые вначале назывались MUSIC с номером версии. Язык C-Sound произошел как раз из этих программ. Со временем отделение Стэндфордского института исследований, где работал тогда М. Мэтьюз, выросло в музыкальный исследовательский центр под названием CCRMA.
В 1959 году советский математик Рудольф Зарипов начал «сочинять» одноголосные музыкальные пьесы на машине «Урал» [22]. Они назывались «Уральские напевы» и носили характер эксперимента. При их сочинении использовались случайные процессы для различных элементов музыкальной фактуры (форма, ритм, звуковысотность и т. д.). С тех пор появилось очень много программ для алгоритмической композиции. Для различных музыкальных задач было создано специальное программное обеспечение: системы многоканального сведения; системы обработки звука; системы синтеза звука; системы интерактивной композиции; программы алгоритмической композиции и др.
В 1975-1976 годах были проведены эксперименты по сравнению машинной и «человеческой» музыки. Для эксперимента были выбраны мелодии песен известных советских композиторов, опубликованные в сборниках избранных песен, и мелодии, сочиненные на вычислительной машине «Урал-2» по программе Р. Зарипова. Результаты экспериментов таковы: машинные сочинения жюри признало в большинстве случаев наиболее интересными и, «без сомнения, написанными человеком». Таким образом, деятельность машины удовлетворяла критерию Тьюринга – слушатели-эксперты не узнали работу машины [22].
Д. А. Поспелов в своем интервью «Литературной газете» [№1, 1976] слегка иронизирует над методом Р. Зарипова, вспоминая, что примерно такой же способ «творчества» предложил еще Остап Бендер в «Золотом теленке», продав журналисту Ухудшанскому свое «Незаменимое пособие для сочинения юбилейных статей, табельных фельетонов, а также парадных стихотворений, од и тропарей», избавляющее от «необходимости ждать, покуда вас окатит потный вал вдохновенья». Из раздела первого (словарь) берутся нужные существительные, прилагательные, глаголы, смешиваются по образцам раздела второго (творческая часть) и получается «шедевр». Такой метод можно запрограммировать и можно написать повести, рассказы, стихи. Но вряд ли это можно назвать творчеством. Практически очевидно, что таким образом не будет создано гениальное в общечеловеческом смысле произведение.
Не будем требовать от интеллектуальных систем гениальности. ИС уже сейчас способны делать много полезной и разумной работы, которая требует какой-то доли интеллекта.

Среди направлений работ в области ИИ следует также выделить нейрокибернетику, или иначе говоря, подход к разработке машин, демонстрирующих «разумное» поведение, на основе архитектур, напоминающих устройство мозга и называемых нейронными сетями (НС). Одна из ключевых особенностей НС состоит в том, что они способны обучаться на основе опыта, полученного в обучающей среде.
В 1942 году Н. Винер определил концепции кибернетики, В. Мак-Каллок и В. Питс опубликовали первый фундаментальный труд по НС, где говорилось о том, что любое хорошо заданное отношение вход-выход может быть представлено в виде формальной нейронной сети [23]. В 1957 году Ф. Розенблат изобрел устройство для распознавания на основе НС – персептрон, который успешно различал буквы алфавита, хотя и отличался высокой чувствительностью к их написанию [24].
Пик интереса к НС приходится на 60-е и 70-е годы, однако в последние десять лет наблюдается резко возросший объем исследований и разработок по НС. Это стало возможным в связи с появлением нового аппаратного обеспечения, повысившего производительность вычислений в НС (нейропроцессоры, транспьютеры и т. п.).
НС хорошо подходят для распознавания образов и решения задач классификации, оптимизации и прогнозирования. Поэтому основными областями применения НС являются:
- промышленное производство и робототехника;
- военная промышленность и аэронавтика;
- банки и страховые компании;
- службы безопасности;
- биомедицинская промышленность;
- телевидение и связь;
- и другие области.

Заканчивая исторический обзор работ в области ИИ, следует вернуться в 1981 год. В это время японские специалисты, объединившие свои усилия под эгидой научно-исследовательского центра по обработке информации JIPDEC, опубликовали программу НИОКР с целью создания к 1991 году прототипа ЭВМ нового поколения. Эта программа, получившая на Западе название «японский вызов», была представлена как попытка построить интеллектуальный компьютер, к которому можно было бы обращаться на естественном языке и вести беседу.
Серьезность, с которой основные конкуренты Японии откликнулись на брошенный им вызов, объясняется тем, что прежде переход от одного поколения к другому характеризовался изменением элементной базы, ростом производительности и расширением сервисных возможностей для пользователей, владеющих в той или иной мере профессиональными навыками программирования. Переход к ЭВМ пятого поколения означал резкий рост «интеллектуальных» способностей компьютера и возможность диалога между компьютером и непрофессиональным пользователем на естественном языке, в том числе в речевой форме или путем обмена графической информацией – с помощью чертежей, схем, графиков, рисунков.
В состав ЭВМ пятого поколения также должна войти система решения задач и логического мышления, обеспечивающая способность машины к самообучению, ассоциативной обработки информации и получению логических выводов. Уровень «дружелюбия» ЭВМ по отношению к пользователю повысится настолько, что специалист из любой предметной области, не имеющий навыков работы с компьютером, сможет пользоваться ЭВМ при помощи естественных для человека средств общения – речи, рукописного текста, изображений и образов. В литературе того времени достаточно подробно описываются все эти вопросы [25]. Здесь отметим только основные компоненты программного обеспечения (ПО), планируемые для систем пятого поколения:
- Базовая программная система, включающая систему управления базой знаний (СУБЗ), систему приобретения и представления знаний, систему решения задач и получения выводов, систему обучения и объяснения решений.
- Базовая прикладная система, включающая интеллектуальную систему автоматизированного проектирования (САПР) сверхбольших интегральных схем (СБИС) и архитектур ЭВМ, интеллектуальную систему программирования, систему машинного перевода и понимания естественного языка, систему распознавания образов и обработки изображений (не менее 100 000 единиц информации в виде изображений), систему распознавания речи (не менее 10 000 слов), базы знаний (БЗ) о предметных областях, а также утилитные системы для ввода программ и данных, обеспечивающие диагностику и обслуживание.
Теперь с позиции нашего времени можно сказать, что фирма Microsoft постаралась частично ответить на «японский вызов» в своих версиях операционной системы Windows для персональных компьютеров серии IBM PC AT/486 и выше. Уровень «дружелюбия» ЭВМ пятого поколения по отношению к пользователю действительно значительно повысился по сравнению с другими поколениями ЭВМ. В эти же годы стремительное развитие Internet стало мощным шагом по пути создания распределенных баз знаний.

(c) 2009 Раздобарина Е.А.
Все права принадлежат ООО "Смарт Автоматикс" (Smart Automatics ltd).
Ссылка на www.smaut.com при использовании материалов ОБЯЗАТЕЛЬНА.