1.5.Совместное оценивание параметров и состояния

Лекция



Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game

Привет, Вы узнаете о том , что такое 1.5.Совместное оценивание параметров и состояния, Разберем основные их виды и особенности использования. Еще будет много подробных примеров и описаний. Для того чтобы лучше понимать что такое 1.5.Совместное оценивание параметров и состояния , настоятельно рекомендую прочитать все из категории Идентификация систем управления.

Висследовании систем автоматического управления ДЛА особый интерес представляет класс САУ с ограничениями по измерениям. Анализ известных методов идентификации показал, что большинство из них ориентированы на объекты с полной измеряемостью. Однако на практике полностью измерить переменные состояния не всегда представляется возможным [3, 7, 22]. Так, для объектов СУ ДЛА характерна ограниченная измеряемость, что предполагает усложнение алгоритма идентификации и отдельное исследование измеряемого объекта. Для гидромеханических агрегатов, являющихся исполнительными механизмами СУ ДЛА, основными динамическими координатами являются перемещения подвижных элементов. Такое выделение целесообразно, поскольку перемещения – выходные переменные динамических типовых функциональных элементов гидросистем. Однако не все перемещения являются измеряемыми переменными. Конструктивные особенности таких элементов, как золотник или изодром, не позволяют измерить перемещение их хода, так как движение поршней элементов происходит внутри закрытого объема.

53

Для данного класса объектов задача идентификации сводится к одновременному оцениванию параметров и неизмеряемых координат. Анализ известных методов идентификации показал, что существует несколько подходов к решению поставленной задачи. Наибольший интерес представляет совместное оценивание параметров и состояния, которое предполагает расширение вектора состояния за счет неизмеряемых координат.

Пусть объект описывается системой уравнений

dX (t)

= F

(

X

t

,U

t

, A ,

dt

( )

( )

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
)

(1.76)

(

(

)

( )

)

Y

(

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
)

= G

X

,U

t

t

t

, C ,

где X (t) – вектор состояния; U (t)

– вектор входных переменных;

Y (t) – вектор выходных переменных;

A – матрица коэффициентов; С –

матрица выхода.

Если параметры системы являются постоянными по времени, то векторизованную матрицу неизвестных параметров можно представить в следующем виде:

dA(t)

= 0.

(1.77)

dt

Тогда систему уравнений (1.76) можно записать как

dX (t) = F(X (t),U (t), A),

dt

(1.78)

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
dA

= 0.

dt

Нетрудно заметить, что даже если динамика объекта линейна, то данную систему уравнений невозможно преобразовать к виду

dX (t)

dt

=

dA

dt

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
X

D . (1.79)

A

Следовательно, задача совместного оценивания параметров и состояния носит нелинейный характер относительно вектора параметров и состояния. Для решения нелинейных уравнений в общем виде суще-

54

ствуют только итерационные методы, на основе которых и разработаны алгоритмы одновременного оценивания параметров и состояния:

•квазилинеаризация;

•метод инвариантного погружения;

•фильтры Калмана–Бьюси.

1. Квазилинеаризация.

Квазилинеаризация является итерационным методом, в основе которого лежит метод Ньютона–Рафсона.

Постановка задачи совместного оценивания параметров и состояния формулируется следующим образом.

Необходимо решить систему нелинейных дифференциальных уравнений:

dX

F(X (t),U (t),A)

dt

,

(1.80)

=

dA

0

dt

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
удовлетворяющих следующим граничным условиям:

Y (t) = CX (t).

(1.81)

Таким образом, сформулирована многоточечная краевая задача. Метод квазилинеаризации предлагает следующий алгоритм решения данной задачи:

dX (i +1) = F(X (i),A(i)) + F

(i)(X

(i +1) − X (i)) +

dt

1

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game

+F2 (i)(A(i +1) − A(i)),

(1.82)

dA(i +1)

= 0

dt

при условии

CX (i +1) =Y (i +1),

(1.83)

где F1(x),F2 (x) – якобианы,

F (i) =

dF

,

1

dX

X (i),A(i)

55

F (i) =

dF

.

2

dA

X (i),A(i)

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
При применении итерационных методов, в том числе и метода квазилинеаризации, необходимо оценить их сходимость. Исследования показали, что сходимость метода гарантируется, если функция F(X ,A) является выпуклой, а элементы якобианов F1(x), F2 (x), стоя-

щие над и под главной диагональю, должны быть положительными. Оценка сходимости для звена 3-го порядка, а такие звенья явля-

ются одними и самых распространенных в СУ ДЛА, показала следующее: наличие обратных отрицательных связей приводит к наличию отрицательных элементов как в матрице F(X ,A) , так и в якобиа-

нах F1(x),F2 (x) .

Таким образом, сходимость данного метода не гарантируется, а следовательно, метод квазилинеаризации не может быть применен для совместного оценивания параметров и состояния СУ ДЛА.

2. Метод инвариантного погружения.

Воснове метода инвариантного погружения лежит преобразование многоточечной краевой задачи в одноточечную.

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
Вотличие от предыдущих методов данный метод менее зависим от начальных значений. Сходимость алгоритма идентификации к фактическим значениям параметров обеспечивается в довольно широком диапазоне начальных приближений. К недостаткам метода инвариантного погружения следует отнести существенные затраты времени на преобразования модели, что делает невозможным применение идентификации объектов управления в реальном времени, а также зависимость сходимости алгоритма от выбора вспомогательных матриц.

3.Фильтр Калмана–Бьюси.

Алгоритм фильтра Калмана позволяет в реальном времени построить оптимальную оценку состояния системы X (t) , основываясь

на измерениях Y (t) , содержащих погрешности. Вектор измерений X (t) рассматривается в качестве многомерного выходного сигнала системы, при этом зашумленного, а вектор состояния Y (t) – неизвест-

ный многомерный сигнал, подлежащий определению. Условием оптимальности построенной оценки является минимум среднеквадратичного отклонения оцененного значения от истинного.

56

В общем случае задача фильтрации по Калману формулируется для нелинейной нестационарной системы в условиях действием допущения. Модификация метода – фильтр Калмана–Бьюси – применяется для линейного стационарного объекта, представленного в пространстве состояния при действующем белом шуме [6, 8]:

dX (t)

= AX (t) + BU (t) + N (t) ,

(1.84)

dt

где X (t) – случайный марковский n-мерный процесс, задаваемый необходимой априорной информацией: M{X} = X0 – математическое ожида-

ние X (t) ; cov(X (t)) = M{(X (t) − M{X (t)})(X (t) − M{X (t)})T}= P0 – ко-

вариационная матрица X (t) ; U (t) – измеряемое векторное входное воздействие, которое может быть как детерминированной, так и случайной величиной; N(t) – k-мерный вектор случайных воздействий,

полагаемых процессами типа белого шума: M{N(t)} = 0 ,

cov(N(t)) =

= M{N(t)N(t)T} =Vδ(t −τ) , где δ(t) – дельта-функция; V

– симмет-

ричная неотрицательно определенная матрица интенсивности белого шума N(t) .

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
Процесс X (t) наблюдается с помощью измерителя, а вектор из-

меряемых координат – соотношением

Y (t) = CX (t) +ε(t),

(1.85)

где ε(t) – p-мерный вектор шумов измерения, полагаемый случайным

процессом

в виде

белого

шума: M{ε(t)} = 0 , cov(ε(t)) =

= M ε(t)ε(t)T

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
}

= Rδ(t −τ) ,

где R

– симметричная неотрицательно оп-

{

ределенная матрица интенсивности белого шума ε(t) .

Процессы N(t) и ε(t) , а также X (t) и N(t) , X (t) и ε(t) полагаются некоррелированными: M{N(t)ε(t)T}= 0 , M{X (t)N (t)T}= 0 ,

M{X (t)ε(t)T}= 0.

Требуется построить линейную динамическую систему, обеспе-

чивающую получение оптимальной оценки i вектора , если

X (t) X (t)

ошибка оценивания задана:

57


E(t) = X (t) − X (t).

(1.86)

Критерием оптимальности является условие минимума ее квадратичной нормы:

J (t) = E(t)E(t)T → min.

(1.87)

Задача фильтрации по Калману–Бьюси соответствует следующей структурной схеме, представленной на рис. Об этом говорит сайт https://intellect.icu . 1.19.

Рис. 1.19. Структурная схема формирующего фильтра (ФФ) и измерителя при действии случайных возмущений и наличии помех

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
При построении фильтра Калмана используется идея n-мерного наблюдателя (наблюдателя полного порядка), когда в качестве идентификатора состояния принимается математическая модель системы.

Фильтр Калмана осуществляет процедуру рекурсивного оценивания на основе наблюдений за входным и выходным сигналами объекта, где для уменьшения дисперсии оценок в алгоритм идентификатора вводится корректирующая обратная связь по выходу системы Y (t) .

Исходя из требования получения несмещенной оценки i

X (t),

уравнение фильтра имеет вид [6, 8]

d X (t)

= AX (t) + BU (t) + L(Y (t) −C X (t)),

(1.88)

dt

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
где L – матрица коэффициентов усиления фильтра, обеспечивающая оптимальную в смысле минимальной дисперсии оценку состояния, которая определяется выражением

L = PCT R−1,

(1.89)

58


где P – ковариационная матрица ошибок оценивания, которая в случае стационарности процессов определяется решением алгебраического матричного уравнения Риккати:

AP + PAT − PCR−1CP +CVCT = 0.

(1.90)

В общем случае построение оптимального наблюдателя является решением задачи оптимального стохастического управления в условиях неполноты информации о векторе переменных состояния. Нахождение матрицы коэффициентов усиления фильтра может быть реализовано методом аналитического конструирования регуляторов [6, 23, 24].

Фильтрация в случае выборочных измерений функции времени

k=1, 2,K имеет следующий алгоритм:

1.По априорным значениям характеристик сигналов находится априорное значение ковариационной матрицы сигнала, основанное на k наблюдениях:

Q(k +1) = AP(k)AT +V.

(1.91)

2. Рассчитывается апостериорное значение ковариационной матрицы сигнала, основанное на k +1 наблюдениях:

P(k +1) = Q(k +1) −Q(k +1)CT [CQ(k +1)CT + R]−1CQ(k +1). (1.92)

3. Определяется матрица коэффициентов усиления L(k +1) , задающая вес поправок к начальным условиям на основе ковариационных матриц оценки состояний

L(k +1) = Q(k +1)CT [CQ(k +1)CT + R]−1 = P(k +1)CT R−1. (1.93)

Величины P(k +1) , Q(k +1) , L(k +1) полностью определяются априорной информацией. Вычисления продолжаются до установления стационарности фильтра, условием которой является равенство P(k +1) − P(k) ≤ ξ или, соответственно, L(k +1) − L(k) ≤ ξ, где ξ – за-

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
данная точность.

После определения матрицы L(k) алгоритм работы фильтра Кал- мана–Бьюси сводится к последовательной обработке поступающих входных и выходных данных, при которой текущая оценка сигнала получается на основе корректировки ранее сделанной оценки с учетом информации, поступающей на вход фильтра в процессе наблюдения на каждом шаге: требует дополнительную априорную информацию, а

59

именно вероятностные характеристики возмущений и помех. Данные требования являются избыточными для оценивания параметров и состояния детерминированного объекта.

Таким образом, описанные исследования показали, что ни один из вышеприведенных методов оценивания параметров и состояния не является универсальным. Каждый из рассмотренных методов обладает своими недостатками, ограничивающими область их применения.

Поэтому при идентификации моделей СУ ДЛА с ограничениями по измерениям необходимо разработать прикладной метод идентификации, простой в реализации, отвечающий требованиям сходимости, быстроты решения и ориентированный на конкретный класс моделей.

Для решения поставленной задачи предлагается следующий алгоритм идентификации [22, 25].

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
Объект описывается системой уравнений

V (k +1) = ФV (k),

(1.94)

U (k)

где V (k) – обобщенный вектор состояния, V (k) = X (k) ; U (k) – век-

Y (k)

тор входных воздействий; X (k) – вектор неизмеряемых координат; Y (k) – вектор измеряемых координат; Ф – матрица перехода.

Рассмотрим ограниченный класс модели, присущий гидромеханическим агрегатам СУ ДЛА. Согласно классификации, приведенной в [25], объекты данного класса могут быть представлены следующими типами звеньев:

•апериодическое звено;

•идеальное интегрирующее звено;

•реальное интегрирующее звено;

•реальное интегрирующее звено с суммарным входом;

•последовательное соединение апериодического звена 2-го порядка и интегрирующего звена.

Первые два типа звеньев являются полностью измеряемыми, и поэтому могут быть оценены любым методом идентификации для полностью измеряемых объектов. Реальное интегрирующее и реальное интегрирующее звено с суммарным входом имеют одну неизмеряемую внутреннюю переменную. Объект, включающий в себя после-

довательное соединение апериодического звена 2-го порядка и интегрирующее звено, – две неизмеряемые переменные.

Матрицы перехода данных объектов имеют следующий вид:

• реальное интегрирующее звено

1

0

0

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
a11

;

(1.95)

Ф = b1

0

0

a21

0

• реальное интегрирующее звено с суммарным входом:

1

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
0

0

a11

;

(1.96)

Ф = b1

0

a21

b2

0

• последовательное соединение апериодического звена 2-го порядка и интегрирующего звена:

1

0

0

0

a11

0

Ф =

b1

0

(1.97)

.

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game

0

a21

a22

0

0

0

a32

1

Для звеньев 2-го порядка обобщенная матрица перехода имеет

вид:

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
1

0

0

a11

0

Ф = b1

.

a21

a22

b2

С учетом структуры матрицы перехода уравнение динамики (1.94) может быть записано в следующем виде:

u(k +1) = u(k),

x(k +1) = b1u(k) +a11x(k),

(1.98)

y(k +1) = b2u(k) + a21x(k) + a22 y(k).

Выражение (1.98) после исключения из x(k) – неизмеряемой координаты – имеет вид

61


1

( y(k

+2) −(a11 +a22 ) y(k +1) +

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
b1a21 +b2 (1−a11)

+a11a22 y(k)) = u(k)

или

c1 y(k +2) +c2 y(k +1) +c3 y(k) = u(k),

где

1

c1

=

,

b1a21

+b2 (1−a11)

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game

c2

=

−(a11 +a22 )

,

b1a21

+b2 (1−a11)

c3

=

a11a22

.

b1a21

+b2 (1−a11)

(1.99)

(1.100)

(1.101)

(1.102)

(1.103)

После наблюдений над объектом, в результате которых сформируются матрицы измерений входных U (k) и выходных Y (k) переменных,

уравнение (1.100) решается относительно коэффициентов c1, c2 , c3.

По известным коэффициентам c1, c2 , c3 определяются коэффициенты матрицы переходов:

• реальное интегрирующее звено:

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
b1a21 = 1 ,

c1

a

+a

22

= −

c2

,

(1.104)

11

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
c1

a a

=

c3

;

11

22

c1

• реальное интегрирующее звено с суммарным входом:

b a

21

+b (1

−a ) =

1

,

1

2

11

c1

a

+a

22

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game

= −

c2

,

(1.105)

11

c1

a a

=

c3

.

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game

11

22

c1

62

Коэффициент b2 представляет собой реакцию системы на вход-

ное воздействие на первом интервале дискретности, поэтому вычислить его несложно.

Таким образом, в результате идентификации определяются ко-

эффициенты матрицы перехода: a11, a22 , b1a11 или b2 , a11, a22 , b1a11. Это означает, что предложенный алгоритм идентификации по-

зволяет определить постоянные времени a

=

1

,

a

=

1

и общий

11

T1

22

T2

коэффициент усиления K = K K

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
2

=

b1a21

.

Σ

1

a11

Для звеньев 3-го порядка, в которых неизмеряемыми являются две внутренние переменные x1,x2 , с учетом структуры матрицы перехода уравнение динамики (1.94) может быть записано в следующем виде:

u(k +1) = u(k),

x1(k +1) = b1u(k) + a11x1(k),

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
(1.106)

x2 (k +1) = a21u(k) + a22 x2 (k),

y(k +1) = a32 x2 (k) + y(k).

Выражение (1.106) после исключения из него неизмеряемых ко-

ординат имеет вид

c1 y(k +3) +c2 y(k + 2) +c3 y(k +1) +c4 y(k) = u(k),

(1.107)

где

1

c

=

,

(1.108)

1

b1a21a32

c

= −

a11 +a22 +1

,

(1.109)

2

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
b1a21a32

c

=

a11a22 +a11 +a22

,

(1.110)

3

b1a21a32

c

= −

a11a22

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
.

(1.111)

4

b1a21a32

63


После наблюдений над объектом, в результате которых сформируются матрицы измерений входных U (k) и выходных Y (k) переменных, уравнение (1.107) разрешается относительно коэффициентов c1, c2 , c3 , c4.

По известным коэффициентам c1, c2 , c3 , c4 определяются:

• коэффициенты матрицы переходов:

b a

a

=

1

,

1

21

32

c1

a

+a

22

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
+1 = −

c2

,

11

c1

(1.112)

c3

a

a

+a +a

22

=

,

11

22

11

c1

a

a

= −

c4

;

11

22

c1

• реальное интегрирующее звено с суммарным входом:

b1a21 +b2 (1−a11) = 1 ,

c1

a

+a

22

= −

Hungry Weevils

Game: Perform tasks and rest cool.6 people play!

Play game
c2

,

(1.113)

11

c1

a

a

=

c3

.

11

22

c1

Система уравнений (1.113) разрешается относительно

a11, a22 ,

b1a21, a32 , т.е. так же, как и для звеньев 2-го порядка определяются по-

стоянные времени a =

1

, a

22

=

1

и общий коэффициент усиления

11

T1

T2

KΣ = K1K2 K3 = b1a21a32 . a11a22

Таким образом, предложенный подход к решению задачи идентификации с неизмеряемыми координатами позволяет получить простой и практический реализуемый алгоритм для идентификации объектов данного класса.

Исследование, описанное в статье про 1.5.Совместное оценивание параметров и состояния, подчеркивает ее значимость в современном мире. Надеюсь, что теперь ты понял что такое 1.5.Совместное оценивание параметров и состояния и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Идентификация систем управления

создано: 2024-09-23
обновлено: 2024-09-23
28



Рейтиг 9 of 10. count vote: 2
Вы довольны ?:


Поделиться:

Найди готовое или заработай

С нашими удобными сервисами без комиссии*

Как это работает? | Узнать цену?

Найти исполнителя
$0 / весь год.
  • У вас есть задание, но нет времени его делать
  • Вы хотите найти профессионала для выплнения задания
  • Возможно примерение функции гаранта на сделку
  • Приорететная поддержка
  • идеально подходит для студентов, у которых нет времени для решения заданий
Готовое решение
$0 / весь год.
  • Вы можите продать(исполнителем) или купить(заказчиком) готовое решение
  • Вам предоставят готовое решение
  • Будет предоставлено в минимальные сроки т.к. задание уже готовое
  • Вы получите базовую гарантию 8 дней
  • Вы можете заработать на материалах
  • подходит как для студентов так и для преподавателей
Я исполнитель
$0 / весь год.
  • Вы профессионал своего дела
  • У вас есть опыт и желание зарабатывать
  • Вы хотите помочь в решении задач или написании работ
  • Возможно примерение функции гаранта на сделку
  • подходит для опытных студентов так и для преподавателей

Комментарии


Оставить комментарий
Если у вас есть какое-либо предложение, идея, благодарность или комментарий, не стесняйтесь писать. Мы очень ценим отзывы и рады услышать ваше мнение.
To reply

Идентификация систем управления

Термины: Идентификация систем управления