Matematica
Crearea modelelor statistice pe baza experientelor pasiveCrearea modelelor statistice pe baza experientelor pasive Forma generala a legaturilor dintre factorii Xi, Xj si variabila la iesire y, de obicei, se reprezinta prin ecuatii polinomice: (1) unde - coeficienti, care caracterizeaza corespunzator efectele liniare, de interactiune si patrate. Utilizarea polinomului ca model matematic al obiectului studiat este necesara din mai multe considerente. Se stie ca cel mai reusit model matematic este acel care este prezentat in forma de ecuatii diferentiale. Dar, deoarece datele despre natura fenomenelor din obiect lipsesc, aceste ecuatii nu pot fi rezolvate. In schimb, in forma generala ecuatia procesului poate fi reprezentata prin functia: (2) unde: X1,X2,.Xn - parametrii la intrare; - coeficientii modelului. Atunci coeficientii ai polinomului (1) pot fi interpretati ca coeficientii sirului Taylor, in care se va desfasura functia (2) pentru circumstantele unui oarecare punct cu coordonatele (X10,X20,.,Xn0).
Coeficientii sunt coeficienti de distributie si ecuatia (3) - ecuatie de regresie. Coeficientii polinomului (1) pot fi determinati folosind datele experientelor pasive sau active. Dar, avand in vedere natura statistica a proceselor studiate si precizia datelor experimentale, operatorul obtine aprecierea coeficientilor . In acest caz ecuatia regresiei se va scrie in forma urmatoare: (4) unde: - aprecierea parametrului la iesire; Xi - . modelului; n - numarul de factori. Ecuatia regresiei (4) se utilizeaza pe larg pentru obtinerea modelelor statistice a obiectelor, proceselor tehnologice. Din punct de vedere al studiului procesului, proprietatilor lui fizice si chimice modelul polinomului nu poseda cantitatea necesara de informatie. Cunoscand numai valorile numerice ale coeficientilor Taylor, este imposibil de alcatuit functia initiala sau ecuatia diferentiala care ar descrie procesul desfasurat. Insa ecuatia regresiei este admisibila la rezolvarea problemelor experimentale de determinare a conditiilor optime de parcurgere a procesului. Pentru intocmirea modelelor matematice ale obiectelor, parametrii carora la intrare sunt variabili si nu se supun reglarii sau variatia lor este limitata de regimul tehnologic, se foloseste experienta pasiva. Esenta experientei pasive consta in faptul ca operatorul ocupa o pozitie "pasiva" si fixeaza valorile experimentale ale factorului Xi si parametrul la iesire yn, care, de obicei, sunt inscrisi in tabelul datelor statistice. Datele la intrare si la iesire Tabelul 2
Pentru obtinerea modelelor statistice in forma de polinoame pe baza datelor statistice obtinite in urma experientelor pasive, in practica se utilizeaza modelele analizei corelative si regresive. In procesul crearii modelelor statistice aceste metode permit: 1 - determinarea corectitudinii alegerii ecuatiei de regresie; 2 - calcularea coeficientilor regresiei pentru polinomul ales; 3 - determinarea existentei legatrii dintre parametri la iesire si factorii independenti X si aprecierea cantitativa a acestei legaturi; 4 - verificarea preciziei calcularii coeficientilor regresiei; 5 - determinarea adecvata a ecuatiilor regresiei procesului real. Analiza regresiva admite legatura valorii aleatoare y cu valoarea nealeatoate X. Utilizarea metodei analizei regresive este posibila cu respectarea urmatoarelor conditii:1. Rezultatele masurarii y1,y2,.yN reprezinta valori aleatoare independente; 2. Factorii X1,X2,.Xn se schimba cu eroare mica in comparatie cu eroarea lui y si nu coreleaza una cu alta; 3. Aprecierea dispersiei valorii parametrului y obtinuta in conditii egale trebuie sa obtina valori egale. Vom prevedea un model statistic in forma de polinom liniar. La studiul obiectelor in multe cazuri legatura dintre parametrul la iesire y si factorul X poate fi aproximata prin dependente liniare: (5) In aceasta ecuatie este necesar de determinat coeficientii. Pentru aceasta se efectueaza: in caz ideal - 2 experiente; in cazuri reale - 2 experiente sunt insuficiente. De obicei, se efectueaza N repetari. Pentru determinarea modelului (5) este necesar de determinat valorile coeficientilor b0 si b1. Cand lipsesc valorile pentru determinarea coeficientilor sunt destule doua repetari. Daca sistemul studiat se caracterizeaza prin dependenta liniara si in el nu apar bariere, atunci toate datele experimentale trebuie sa se aseze pe o dreapta. In practica intotdeauna are loc divergenta rezultatelor, determinata de influenta factorilor aleatorii. Atunci, pentru determinarea coeficientilor b0 si b1 se efectueaza N repetari si se obtine un sistem cu ecuatii redeterminate: (6) Asadar, apare problema obtinerii valorilor medii a datelor experimentale. Cea mai raspandita metoda este metoda patratelor minime, care contine cerintele minimumului sumei patratelor abaterilor parametrului la iesire a obiectului si modelului. (7) Sau avand in vedere ecuatia (5):
Asadar, procedura determinarii coeficientilor ecuatiei regresiei se reduce la determinarea minimumului functiei. Functia obtine valori minimale daca derivata partiala este egala cu zero. De aceea trebuie sa determinam derivata partiala. (9) (10) Trecem la asa-numitele ecuatii normale:
(11) Am ajuns la aceea ca putem determina coeficientii: (12) (13) Coeficientul b0 poate fi determinat din prima ecuatie (11). (14) Pentru aprecierea densitatii legaturii dependentei liniare se utilizeaza coeficientul secundar al corelatiei pare , care se determina dupa formula: (15) unde: N - numarul de repetari; - valoarea medie a factorului si parametrului la iesire; - devierea medie patratica. se calculeaza in modul urmator: (16) (17) Coeficientul corelatiei se schimba de la -1 pana la +1. Cu cat este mai aproape de 1 cu atat este mai puternica legatura dintre valorile masurate. Semnul "+" al coeficientului de corelatie inseamna ca valorile X1 si y scad sau cresc concomitent. Semnul "-" arata ca X1 si y se schimba in directii contrare. Coeficientul corelatiei pare poate fi determinat din urmatoarea relatie: (18) Atunci din ecuatiile (5), (14) si (18) vom obtine inca o forma a ecuatiei regresiei: (19) In practica la proces influenteaza mai multi factori, de aceea pentru a simplifica problema, noi suntem nevoiti sa trecem la unele operatii noi. Pentru calcularea dependentelor statistice a obiectelor tehnologice deseori apare necesitatea de a determina forma liniara a variabilelor n (20), adica este necesara determinarea coeficientilor. In principiu aceasta problema nu se deosebeste de cea examinata mai sus (dependenta liniara dintre doua variabile), insa greutatile de calcul aparute ne impun sa trecem la operatii care atribuie procesului de calcul un sir de particularitati. Admitem ca a fost efectuata o experienta pasiva si datele experimentale au fost introduse in tabel, unde N este numarul de repetari si n - numarul factorilor. Exprimam toti factorii variabili intr-o scara noua standardizata. Pentru aceasta este necesar de recalculat toate valorile marimilor intamplatoare conform formulelor: (21) unde: - sunt valorile normate ale parametrului la iesire si factorilor; - valorile medii ale parametrului la iesire si factorilor;
Su,SXi - valorile abaterilor medii patrate corespunzatoare. Din formulele expuse mai sus se vede ca, in scara normala, evidenta fiecarui factor variabil se incepe de la valoarea sa medie, pe cand in scara standardizata toate variabilele sunt egale cu "zero", iar dispersiile cu "1". (22) (23) Dupa normare, materialul statistic apare in scara noua. Statistica matematica afirma faptul ca in ecuatia regresiei prezentata pentru materialele normate, membrul liber lipseste si ea se va scrie in felul urmator: (24) Forma standardizata a ecuatiei permite determinarea gradului de actiune a fiecarui factor asupra parametrului la iesire. Coeficientii selectati ai corelatiei la utilizarea scarii standardizate au urmatoarea forma: (25) (26)
Conform formulei (26), coeficientul selectat al corelatiei () este egal cu coeficientul corelatiei variabilelor in forma naturala (). Coeficientii ecuatiei regresiei (24) ai se determina conform metodei patratelor minimi: (27) (28) (29) Daca se folosesc ecuatiile (25), (26) si proprietatile coeficientilor corelatiei ( si ), atunci sistemul (29) se va exprima in felul urmator: (30) Coeficientii selectati ai corelatiei, care nu sunt inclusi in sistemul de ecuatii (30), trebuie sa fie statistic semnificativ. In statistica matematica este demonstrat ca, conditia semnificatiei coeficientilor corelatiei este respectarea inegalitatii: (31) unde: N este numarul de repetari; tT - valoarea criteriului t; Valoarea criteriului t se determina din tabelul de alocare Student, conform nivelului de semnificatie selectat q si numarul gradelor de libertate. In caz daca in urma verificarii inegalitatii (31) un oarecare coeficient de corelatie se nimereste nesemnificativ, atunci electric este exclus din sistemul de ecuatii (30). Trecerea la ecuatia regresiei in scara naturala se petrece cu ajutorul formulelor: (32) Dupa determinarea coeficientilor regresiei b0,b1,.bn este necesar de verificat semnificatia lor. Procedura verificarii consta in determinarea relatiei tbi si compararea ei cu valoarea criteriului t, care se gaseste din tabelul de alocare Student conform nivelului de semnificatie selectat q si numarul gradelor de libertate f: (33) Daca are loc conditia (33), atunci coeficientul bi este semnificativ. Pentru determinarea gradului de legatura a parametrului la iesire y cu factorul Xi se calculeaza coeficientul corelatiei multiple: (34) Daca pentru determinarea coeficientului corelatiei in pereche () a fost selectat un volum mic, apoi marimea R, determinata conform (34), care este forma exagerata a puterii legaturii. Pentru corectia lui R se recomanda formula: (35) unde: R* - valoarea corectata a corelatiei multiple; l - numarul de legaturi (pentru polinomul liniar n+1); N - numarul de repetari; n - numarul de factori. In cazul legaturii dintre variabile, coeficientul corelatiei plurale R apreciaza cu aproximatie adecvatitatea ecuatiei liniare de regresie, adica corespunderea modelului matematic al obiectului studiat datelor experimentale. Ultima verificare a modelului matematic are loc conform criteriilor statistice (criteriul Fisher). Se considera ca modelul matematic descrie adecvat procesul studiat, daca dispersia remanenta a parametrului de iesire , calculata dupa ecuatia regresiei nu depaseste eroarea experientelor . Dispersia remanenta se determina dupa formula: (36) unde: - numarul gradelor de libertate; N - numarul de repetari; m - numarul de repetari paralele; Nm - numarul total al experientelor. Determinarea dispersiei experientei este posibila cand cunoastem cateva valori ai parametrului la iesire, masurate in conditii egale. Pentru aceasta este necesar de efectuat m repetari paralele si de calculat dispersia selectata pentru fiecare grup de repetari paralele. (37) unde: m - numarul de repetari paralele; yuk - valoarea experimentala a parametrului la iesire; - valoarea medie a experientei u pentru m repetari paralele. Eroarea experientei in acest caz se va determina in felul urmator: (38) Numarul legaturilor libere care caracterizeaza aceasta dispersie este f=N(m-1) Ecuatia liniara de regresie va descrie adecvat procesul dat, daca se va respecta urmatoarea inegalitate: (39) in care FT este valoarea criteriului Fisher, electric se determina conform tabelelor Fisher in dependenta de q - nivelul de semnificatie selectat si numarul legaturilor libere al numaratorului , si numitorului . Atunci cand , atunci si inegalitatea (39) se respecta, deoarece toate valorile criteriului Fisher sunt mai mari ca 1. Daca inegalitatea (39) se respecta, apoi ecuatia regresiei obtinuta este adecvata si poate fi oprita la factorii X1,X2,.Xn alesi. In caz contrar, este necesar de schimbat numarul factorilor sau ecuatia regresiei din liniara in alta forma. Daca repetarile paralele nu pot fi efectuate, atunci dispersia experientei nu poate fi determinata si atunci in loc de verificare la adecvatitate are loc aprecierea calitatii aproximarii punctelor experimentale de catre ecuatia regresiei. Astfel se verifica daca are sens aceasta ecuatie. Verificarea are loc prin compararea dispersiei remanente cu dispersia mediei parametrului la iesire , care se calculeaza in modul urmator: (40) unde: - dispersia mediei parametrului la iesire; yu - valoarea experimentala a parametrului la iesire; - valoarea medie a parametrului la iesire. Ecuatia are sens atunci cand dispersia mediei parametrului la iesire este mai mare decat dispersia remanenta , . In acest caz, valorile dispersiilor trebuie sa difere esential si criteriul semnificativ (criteriul Fisher) va reprezenta raportul dispersiilor: (41) Conditia la care ecuatia are sens se exprima prin relatia: F>FT(f1,f2) (42) in care FT este valoarea Fisher din tabele si se determina in functie de: f1=N-l f2=N-l=N-n-1 Atunci cind se respecta inegalitatea (42), relatia (41) arata de cate ori scade dispersia ecuatiei obtinute in raport cu cea medie. Cu cat F depaseste mai mult FT, cu atat ecuatia regresiei este mai efectiva.
|