Самообучающиеся роботы
Ядро любой обучающейся системы — это внутренний пакет информации, позволяющий системе приступить к решению задачи самообучения и функциональной задачи. Эти исходные знания охватывают три сферы: функциональную задачу, задачу обучения и предметную область, в которой должны решаться названные задачи. При обучении на примерах может оказаться, что некоторые из них доказывают ложность или неполноту каких-либо фактов или правил. Таким образом, цель системы состоит в том, чтобы уточнить свои начальные знания или, основываясь на собственном опыте, создать новые и выполнить возложенную на нее миссию.
Обучающийся робот получает в качестве исходных знаний некоторое количество инструкций и фактов: например, инструкция «Пройди по радуге от начала до конца» относится к функциональной задаче робота. Задачу его обучения можно сформулировать так: «Научись узнавать добрых драконов». Знания о предметной области состоят из утверждений типа «У драконов есть золото» и так называемых иерархий обобщений признаков драконов. В этих иерархиях признаки организованы так, чтобы робот имел возможность сделать обобщения, встретившись с конкретным драконом. Знания о предметной области содержат, в частности, эвристики, которые руководят обучающейся системой примерно так же, как это сделал бы настоящий учитель. Если бы робота программировали не для путешествия по радуге и встреч с драконами, а для игры в шахматы, то его знания о предметной области содержали бы, среди прочего, правила игры, описания всех шахматных фигур и эмпирические правила, выработанные многими поколениями шахматистов.
Признаки в иерархиях обобщений — одна из составляющих исходных знаний робота — служат сырьем для задачи обучения, определяя характеристики, которые, по всей видимости, имеют отношение к делу. Так как робот не встретил еще ни одного дракона и так как ему ничего заранее не известно о признаках добрых драконов, он считает всю эту .информацию одинаково существенной для описания доброго дракона.
Таким образом, обобщения, которые робот делает на этом этапе, — понятия, используемые в качестве гипотез, — охватывают все возможные комбинации признаков — формы, цвета, места обитания. Эти комбинации меняются от самых общих до предельно конкретных. Например, обобщение «любая форма, любой цвет, любое место обитания» объединяет всех возможных драконов, тогда как обобщение «толстый, темный, небесный» выделяет из них небольшую группу, а обобщение «змеевидный, желтый, речной» — еще меньшую.
Однако не все драконы добрые. Чтобы выполнить свою функциональную задачу — набрать золото; и наполнить им горшок на дальнем конце радуги, — робот должен быстро научиться отличать добрых драконов от жадных. Встретив первого же дракона, он начнет просеивать эту гору информации через сито индуктивных рассуждений.