Сделай Сам Свою Работу на 5

в условиях неопределённости факторного пространства и вида модели





1. По каждому измеряемому факторному признаку дополнительно вводится среднеквадратическая погрешность его измерения σХj2, которая определяется как инструментальная погрешность средства измерения, используемого в многофакторном эксперименте для измерений каждого факторного признака. Если исследуется социально-экономический объект, то вместо инструментальной погрешности по каждому факторному признаку вводится субъективно оцениваемая средняя погрешность определения численных значений этих признаков при формировании исходной выборки данных.

2. Задаётся вид аппроксимирующей модели (степень полинома).

3. С учётом заданного вида моделей (для нелинейных моделей) вводятся правила прямой и обратной замены переменных.

4. Исходные данные (вся имеющаяся выборка данных, характеризующая объект исследования) систематизируются по величине результирующего признака Y, после чего вся выборка данных делится на две равные по объёму подвыборки – обучающую и проверочную (нечётные номера систематизированной последовательности данных образуют обучающую подвыборку, чётные – проверочную). Такое разделение обеспечивает равные диапазоны и примерно одинаковое распределение обеих подвыборок по значениям результативного признака.



5. Проводится нормирование исходных данных обучающей выборки относительно их среднеарифметических значений, включая результирующий признак, которому присваивается нулевой индекс j=0 (y = x0 ) и вычисление нормированных значений дополнительно введённых факторных признаков (взамен нелинейных членов модели):

 

(6)

где: Xij – измеренное значение j-го фактора;

– среднее арифметическое значение j-го фактора.

Этим устраняется различие размерностей разных факторных признаков, а их численные значения приводятся к одному порядку, что уменьшает погрешности дальнейших вычислений.

6. По полученным нормированным значениям рассчитывается матрица дисперсий-ковариаций (центральных моментов второго порядка) для обучающей выборки:

где j, k = 0, 1, 2, …, n (n определяет размерность расширенного факторного пространства с учётом замены нелинейных членов модели дополнительными линейными). С учётом проведённого ранее нормирования переменных, среднеарифметические значения всех нормированных переменных будут равны нулю. Тогда формула для нахождения дисперсий-ковариаций примет вид



(7)

7. Для этой же выборки рассчитываются все парные коэффициенты корреляции факторных признаков (включая и дополнительно введённые вместо нелинейных членов модели) с результирующим признаком:

.

С учётом проведённого нормирования переменных и это выражение упроститься

. (8)

 

8. По максимальному парному коэффициенту корреляции с результирующим признаком отбирается первый фактор (первый шаг алгоритма отбора) и строится однофакторная регрессионная модель:

 

,

 

где в качестве индекса а фигурирует индекс первого отобранного фактора, а свободный член b0 при нормированных переменных будет равен нулю (поскольку он равен среднеарифметическому значению результирующего признака, а оно при нормировании будет равно нулю). Поэтому для нормированных переменных уравнение регрессии примет вид

 

. (9)

 

Для вычислений коэффициентов модели из общей матрицы дисперсий-ковариаций, построенной в п. 6, выделяется усечённая матрица, включающая только результирующий и отобранный признаки:

 

; (10)

 

Проводится её обращение

 

(11)

 

и по элементам обратной матрицы вычисляется коэффициент при отобранном признаке

 

(12)

 

и остаточная дисперсия

 

(13)

 

9. С использованием средних арифметических, найденных по обучающей выборке, производится нормирование значений проверочной выборки для результирующего и первого отобранного факторного признаков. Эти значения подставляются в найденное уравнение регрессии и вычисляется остаточная дисперсия по проверочной выборке как



 

, (14)

 

где yii-е нормированное значение результативного признака проверочной выборки;

i-е значение результативного признака проверочной выборки, вычисленное по уравнению регрессии, при подстановке в него i-х значений отобранного факторного признака для проверочной выборки.

Далее по выражению (3) вычисляется значение D-критерия.

10. По очереди строятся все двухфакторные модели, т.е. к отобранному в п. 8 первому факторному признаку по очереди добавляется каждый из оставшихся, из общей матрицы дисперсий-ковариаций выделяются соответствующие усечённые матрицы:

, (15)

 

где а – индекс первого (отобранного на первом шаге) фактора;

b – индекс второго (добавляемого на данном шаге) факторного признака.

Затем проводится её обращение и по элементам обратной матрицы вычисляются коэффициенты b1, и b2 и остаточная дисперсия (выражения 12 и 13).

11. С использованием средних арифметических, найденных по обучающей выборке, производится нормирование значений проверочной выборки тех факторов, которые попали в модель, эти значения подставляются в найденное уравнение регрессии и по выражению (14) вычисляется остаточная дисперсия по проверочной выборке.

Далее по выражению (3) вычисляется значение D-критерия.

Все эти расчёты повторяются для каждого добавляемого в модель признака, т.е. рассчитываются коэффициенты и значения D-критерия всех двухфакторных моделей и по минимуму D-критерия отбирается наилучшая модель данного шага (т.е. наилучшая двухфакторная модель).

Затем для этой наилучшей модели по критерию Фишера проверяется незначимость превышения . Если незначимость подтверждается, то значение D-критерия для лучшей двухфакторной модели сравнивается с его значением для модели предыдущего шага. Если значение D-критерия значимо уменьшилось, то можно переходить к следующему шагу. Значимость уменьшения D-критерия определяется путём сравнения абсолютного значения его уменьшения с заданной погрешностью измерения результативного признака.

Если же незначимость превышения над не подтверждается, то происходит выход из алгоритма по неадекватности и наилучшей считается модель, полученная на первом шаге (однофакторная).

12. Третий шаг состоит в построении наилучшей трёхфакторной модели. Для этого, к отобранным в результате п.п. 9, 10 двум факторным признакам, по очереди добавляется каждый из оставшихся, и строятся соответствующие трёхфакторные модели. Для них вычисляются значения , и D-критерия. По минимуму D-критерия выбирается наилучшая трёхфакторная модель. По критерию Фишера проверяется её адекватность. Если адекватность модели подтверждается, то полученное для неё значение D-критерия сравнивается со значением D-критерия для наилучшей двухфакторной модели. Если значение D-критерия значимо уменьшилось, то осуществляется переход к четвёртому шагу, т.е. к построению четырёхфакторных моделей. Если же значение D-критерия возросло, то алгоритм прерывается по глобальному минимуму D-критерия и оптимальной считается модель, полученная на предыдущем шаге.

Примечание: При больших объёмах выборок и высокой точности измерения факторных признаков после проведения нескольких шагов наращивания мерности модели изменения D-критерия от шага к шагу могут быть незначительными, поэтому прерывать алгоритм по глобальному минимуму D-критерия следует лишь тогда, когда его рост на очередном шаге можно признать значимым. В качестве критерия значимости изменения D-критерия можно сравнивать его абсолютное изменение со среднеквадратической погрешностью определения результирующего признака в исходных данных. Если изменение D-критерия превышает величину этой погрешности, то его можно считать значимым и, соответственно, прервать алгоритм.

13. Все последующие шаги выполняются аналогично п. 12.

14. Когда алгоритм отбора факторов будет закончен (по неадекватности или по глобальному минимуму D-критерия) и среди отобранных факторов оказались дополнительные (введённые путём замены переменных), производится обратная подстановка переменных и приводится оптимальная нелинейная модель относительно исходных переменных (т.е. непосредственно измеряемых факторов) и выдаются все её характеристики ( , и D-критерий). Для удобства интерпретации и дальнейшего использования построенной модели производится обратный пересчёт к ненормированным переменным. Оптимальная модель считается построенной. Чтобы легче было проследить динамику улучшения модели при последовательном возрастании её мерности целесообразно выводить на печать не только окончательную модель, но и наилучшие модели каждого шага с их характеристиками.

15. Если объект характеризуется несколькими выходными величинами (Y1, Y2, … , Yk), то для каждой из них математическая модель строится независимо, т.е. для каждой повторяется вся процедура (п.п. с 1 по 11).

Литература

1. Дрейзин В. Э. Проблемы математического моделирования сложных объектов и процессов по опытным данным [Текст] / В. Э. Дрейзин …

2. Дрейпер Н. Прикладной регрессионный анализ [Текст] / Н. Дрейпер, Г. Смит. М.: Мир, 1973. – 392 с.

3. Дрейзин В. Э. О статистическом подходе к решению многопараметровых метрических задач неразрушающего контроля [Текст] / В. Э. Дрейзин // Дефектоскопия, 1981, № 3. С. 5-14.

4. Дрейзин В. Э. Чаплыгин А. Г. Исследование эффективности регрессионного метода и D-критерия для построения оптимальных метрических моделей многопараметрового контроля [Текст] / В. Э. Дрейзин, А. Г. Чаплыгин // Методы и приборы автоматического неразрушающего контроля. Рига: Рижск. политехн. ин-т. 1986. С. 138-150.

5. Дрейзин В. Э. Построение многомерных моделей для определения параметров материалов и изделий [Текст] / В. Э. Дрейзин, С. В. Панекин // Методы и средства измерений (материалы заочной Всероссийской конф.). Нижний Новгород: 2003. 8 с.

6. Дрейзин В. Э. Задачи дальнейшего развития методов построения математических моделей многопараметрового контроля [Текст] / В. Э. Дрейзин, С. В. Панекин // Известия Курск. гос. техн. ун-та. Курск: Курск. гос. техн. ун-т. 2004. С. 131-133.

7. Дрейзин В. Э. Основы научных исследований и инженерного творчества: учебное пособие [Текст]. В 4 кн. Кн. 2. Математическая обработка экспериментальных данных и построение по ним математических моделей объектов / В. Э. Дрейзин, И. С. Захаров; Курск. гос. техн. ун-т. Курск, 2005. 174 с.

 

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.