ДЕРЕВЬЯ РЕШЕНИЙ
ДЕРЕВЬЯ РЕШЕНИЙ
Пусть через {C1, C2, … Ck} обозначены классы (значения метки класса), тогда существуют 3 ситуации:
1. Множество T содержит один или более примеров, относящихся к одному классу Ck. Тогда дерево решений для Т – это лист, определяющий класс Ck;
2. Множество T не содержит ни одного примера, т.е. пустое множество. Тогда это снова лист, и класс, ассоциированный с листом, выбирается из другого множества отличного от T, скажем, из множества, ассоциированного с родителем;
АЛГОРИТМЫ деревьев решений CART, C4.5, NewId, ITrule, CHAID, CN2 CART (Classification and Regression Tree) – это алгоритм построения бинарного дерева решений – дихотомической классификационной модели. Каждый узел дерева при разбиении имеет только двух потомков. Как видно из названия алгоритма, решает задачи классификации и регрессии.
C4.5 – алгоритм построения дерева решений, количество потомков у узла не ограничено. Не умеет работать с непрерывным целевым полем, поэтому решает только задачи классификации.
- Пусть нам задано множество примеров T, где каждый элемент этого множества описывается m атрибутами.
Количество примеров в множестве T будем называть мощностью этого множества и будем обозначать |T|.
Пусть метка класса принимает следующие значения C1, C2 … Ck.
- Пусть мы имеем проверку X, которая принимает n значений A1, A2 … An.
Тогда разбиение T по проверке X даст нам подмножества T1, T2 … Tn, при X равном соответственно A1, A2 … An.
(1)
(2)
(3)
{v1, v2 … vi}, {vi+1, vi+2 … vn}.
ПОРОГ
GAIN (X)=Info (T)- InfoX (T)
Info(T2)= 0
InfoX(T)= [27\37*0.274]+ 10\37*0 = 0.199
4. Критерий
GAIN (X)=Info (T)- InfoX (T)
Идентично просчитываются все потенциальные пороговые значения других атрибутов.
Выбирается тот атрибут у которого найдено максимальное значение критерия GAIN и в качестве проверки в узле принимается это пороговое значение.
Долгота > 67.75
TROP, 27
BARO, 10
no
Долгота > 62.5
BARO, 9
TROP, 18
(7)
(8)
(9)
Если пример из множества T с известным выходом Oi ассоциирован с подмножеством Ti, вероятность того, что пример из множества Ti равна 1. Пусть тогда каждый пример из подмножества Ti имеет вес, указывающий вероятность того, что пример принадлежит Ti. Если пример имеет значение по атрибуту A, тогда вес равен 1, в противном случае пример ассоциируется со всеми множествами T1, T2 … Tn, с соответствующими весами
Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:
Email: Нажмите что бы посмотреть