print('Начальная прямая: ', A, '* X')
Укажем значение скорости обучения:
lr = 0.001
Зададим количество эпох:
epochs = 3000
Эпоха – значение количества проходов по обучающей выборке. Если в нашей выборке девять наборов, то одна эпоха – это один проход в цикле всех девяти наборов данных.
Зададим наш набор данных, используя массивы. Создадим два массива. В один массив поместим все входные данные – x, а в другой целевые значения (ответы) – Y.
Создадим массив входных данных х:
arr_x = [1, 2, 3, 3.5, 4, 6, 7.5, 8.5, 9]
Создадим массив целевых значений (ответы Y):
arr_y = [2.4, 4.5, 5.5, 6.4, 8.5, 11.7, 16.1, 16.5, 18.3]
Задаем в цикле эпох, вложенный цикл – for i in range(len(arr)), который будет последовательно пробегать по входным данным, от начала до конца. А циклом – for e in range(epochs), мы как раз указываем количество таких пробегов (итераций):
for e in range(epochs):
for i in range(len(arr)):
Функция len(arr) возвращает длину массива, в нашем случае возвращает девять.
Получаем x координату точки из массива входных значений x:
x = arr_x[i]
А затем действуем как в случае с линейным классификатором:
# Получить расчетную y, координату точки
y = A * x
# Получить целевую Y, координату точки
target_Y = arr_y[i]
# Ошибка E = целевое значение – выход нейрона
E = target_Y – y
# Меняем коэффициент при x, в соответствии с правилом A+дельтаA = A
A += lr*(E/x)
Напомню, процессом изменения коэффициентов в ходе выполнения цикла программы, называют – процессом обучения.
Выведем результат после обучения:
print('Готовая прямая: y = ', A, '* X')
Полный текст программы:
# Инициализируем любым числом коэффициент крутизны наклона прямой
A = 0.4
A_vis = A # Запоминаем начальное значение крутизны наклона
# Вывод данных начальной прямой
print('Начальная прямая: ', A, '* X')
# Скорость обучения
lr = 0.001
# Зададим количество эпох
epochs = 3000
# Создадим массив входных данных x
arr_x = [1, 2, 3, 3.5, 4, 6, 7.5, 8.5, 9]
# Создадим массив целевых значений (ответы Y)
arr_y = [2.4, 4.5, 5.5, 6.4, 8.5, 11.7, 16.1, 16.5, 18.3]
# Прогон по выборке
for e in range(epochs):
for i in range(len(arr_x)): # len(arr) – функция возвращает длину массива
# Получить x координату точки
x = arr_x[i]
# Получить расчетную y, координату точки
y = A * x