Średniowo ważony ruchome średnie sas


Średnie ruchome średnie wykładnie EWMA to statystyka do monitorowania procesu, który uśrednia dane w sposób, który zapewnia mniej i mniej wagi danych, gdy są one dalej usuwane w timeparison wykresu kontrolnego Shewhart i technik kontroli wykresu EWMA. W celu śledzenia wykresów Shewhart technika, decyzja o stanie kontroli nad procesem w dowolnym czasie, t, zależy wyłącznie od ostatniego pomiaru z procesu, a oczywiście od stopnia prawdziwego oszacowania limitów kontrolnych od danych historycznych Dla EWMA technika kontrolna, decyzja zależy od statystyki EWMA, która jest średnią waŜoną wykładniczo wszystkimi wcześniejszymi danymi, w tym ostatnim pomiarem. Z wyboru współczynnika wagi lambda, procedura kontroli EWMA może być wrażliwa na małe lub stopniowe dryfować w procesie, podczas gdy procedura kontrolna Shewhart może się zareagować tylko wtedy, gdy ostatni punkt danych znajduje się poza granicą kontrolną. Definicja EWMA. The statystyka, jest obliczany jako mbox t lambda Yt 1-lambda mbox,,, mbox,,, t 1,, 2, ldots,, n gdzie. mbox 0 oznacza średni cel danych historycznych. Yt jest obserwacją w czasie t. n jest liczbą obserwacji, które mają być monitorowane, w tym mbox 0.Interpretacja wykresu kontrolnego EWMA. Czerwone kropki to surowe dane, które w przeszłości jest statystyką EWMA. Wykres pokazuje nam, że proces jest kontrolowany, ponieważ wszystkie mbox t lie między ograniczeniami kontroli Jednak wydaje się, że tendencja ta wzrasta w ciągu ostatnich pięciu okresów. Modyfikowanie średnich i wykładniczych modeli wygładzania. Jest to pierwszy krok w wychodzeniu poza średnie modele, przypadkowe modele chodu i modele trendów liniowych, wzorce i tendencje niepożądane być ekstrapolowana przy użyciu modelu ruchomo-średniego lub wygładzającego Podstawowym założeniem za modelami uśredniania i wygładzania jest to, że szereg czasowy jest lokalnie stacjonarny, a powoli zmienia się średnio. W związku z tym ruchomą lokalną średnią szacujemy bieżącą wartość średniej, a następnie wykorzystujemy że jako prognoza na najbliższą przyszłość To można uznać za kompromis między średnim modelem a modelem losowo-chodzić bez drift Ta sama strategia może być użyta do oszacowania i ekstrapolacji późna tendencja lokalna Średnia ruchoma jest często nazywana wygładzaną wersją oryginalnej serii, ponieważ uśrednianie krótkotrwałe ma efekt wyrównywania uderzeń w oryginalnych seriach Dzięki dostosowaniu stopnia wygładzania szerokości średniej ruchomej możemy mieć nadzieję do osiągnięcia jakiegoś optymalnego balansu między osiągnięciem średnich i przypadkowych modeli chodu Najprostszym modelem uśredniania jest równa równoważna średnia ruchoma. Prognoza dla wartości Y w czasie t 1, która jest wykonywana w czasie t jest równa średniej z ostatnich obserwacji m. Tutaj i gdzie indziej będę używać symbolu Y-hat do prognozowania serii czasowej Y dokonanej najwcześniej w poprzednim terminie przez dany model Średnia ta jest skoncentrowana w przedziale 1 2, co oznacza, że ​​oszacowanie lokalna średnia będzie miała tendencję do opóźnienia w stosunku do prawdziwej wartości średniej lokalnej o około m 1 2 okresy Tak więc mówimy średni wiek danych w prostej średniej ruchomej wynosi m 1 2 w stosunku do okresu, na który obliczana jest prognoza jest to kwota czasu, w jakim prognozy będą się spóźniały za punktami zwrotnymi w danych Na przykład, jeśli uśrednimy ostatnie 5 wartości, prognozy będą wynosić około 3 okresy późne w odpowiedzi na punkty zwrotne Zauważ, że jeśli m 1, prosty średni ruchowy model SMA jest równoważny modelowi losowego spaceru bez wzrostu Jeśli m jest bardzo duże porównywalne z długością okresu szacowania, model SMA jest równoważny modelowi średniemu Tak jak w przypadku dowolnego parametru modelu prognozowania, zwyczajowo dostosować wartość ki n Aby uzyskać najlepsze dopasowanie do danych, tzn. najmniejsze błędy prognozy przeciętnie. Oto przykład serii, która wydaje się wykazywać przypadkowe wahania wokół średnio zróżnicowanej średniej. Po pierwsze, spróbuj dopasować ją do przypadkowego spaceru model, co odpowiada prostej średniej ruchomej 1 terminu. Model przypadkowego spaceru reaguje bardzo szybko na zmiany w serii, ale w ten sposób pobiera dużo hałasu w danych losowych wahań, jak również sygnału lokalnego średnia Jeśli weźmiemy pod uwagę prostą średnią ruchomą wynoszącą 5 terminów, otrzymujemy gładsze wyobrażenia prognoz. 5-letnia prosta średnia ruchoma daje w tym przypadku znacznie mniejsze błędy niż model losowego spaceru w tym przypadku Przeciętny wiek danych w tym prognoza wynosi 3 5 1 2, tak że ma ona tendencję do opóźnienia za punktami zwrotnymi o około trzy okresy Na przykład, spadek koniunktury wydaje się mieć miejsce w okresie 21, ale prognozy nie odwracają się do kilku okresów później. Notyczność, długoterminowe prognozy z mod SMA mod El jest poziomej prostej, podobnie jak w modelu random-walk. Model SMA zakłada więc, że nie ma tendencji do danych. Jednak prognozy z modelu random walk są po prostu równe ostatniej obserwowanej wartości, prognozy od model SMA jest równy średniej ważonej z ostatnich wartości. Obciążenia ufności obliczone przez Statgraphics w odniesieniu do długoterminowych prognoz dotyczących prostej średniej ruchomej nie są szersze w miarę wzrostu horyzontu prognozowego. To oczywiście nie jest poprawne Niestety, nie ma podstaw teorii statystycznej, która mówi nam, jak przedziały ufności powinny poszerzać się w tym modelu Jednak nie jest zbyt trudno obliczyć empiryczne szacunki dopuszczalnych granic dla prognoz dłuższego horyzontu Na przykład można utworzyć arkusz kalkulacyjny, w którym model SMA byłby wykorzystywany do prognozowania 2 kroków do przodu, 3 kroków do przodu, itd. w ramach historycznej próbki danych Można następnie obliczyć próbkowe odchylenia standardowe błędów w każdej prognozie h orizon, a następnie skonstruuj interwały zaufania na potrzeby prognoz długoterminowych przez dodawanie i odejmowanie wielokrotności odpowiedniego odchylenia standardowego. Jeśli spróbujemy 9-letnią prostą średnią ruchomej, otrzymamy jeszcze gładsze prognozy i bardziej opóźniamy efekt. Średni wiek to teraz 5 okresów 9 1 2 Jeśli weźmiemy 19-letnią średnią ruchliwą, średni wiek wzrasta do 10.Notice, że rzeczywiście prognozy są teraz w tyle za punktami zwrotnymi o około 10 okresów. Jaka ilość wygładzania jest najlepsza dla tej serii Oto tabela, w której porównano ich statystykę błędów, również zawierającą średnią 3-miesięczną. Model C, 5-letnia średnia ruchoma, daje najniższą wartość RMSE przez mały margines w średnim okresie 3-letnim i 9-dniowym, a ich inne statystyki są prawie identyczne Więc wśród modeli o bardzo podobnych statystykach błędów możemy wybrać, czy wolelibyśmy nieco lepszej odpowiedzi lub trochę bardziej płynnie w prognozach. Powrót do góry strony. Brown s Simple Exponential Wygładzanie wykładniczo ważone średniej ruchomej. Opisany powyżej prosty model średniej prędkości ma niepożądaną właściwość, która traktuje ostatnie obserwacje równomiernie i całkowicie ignoruje wszystkie poprzednie obserwacje Intuicyjnie, dane z przeszłości powinny być dyskontowane w sposób bardziej stopniowy - na przykład najnowsze obserwacje powinny trochę więcej niż druga ostatnia, a druga najnowsza powinna mieć trochę więcej wagi niż trzeci ostatni, i tak dalej Prosty wygładzający model SES osiąga to. Oznacza to, że wygładzanie stale zmienia liczbę pomiędzy 0 a 1 Jednym ze sposobów zapisania modelu jest zdefiniowanie serii L, która reprezentuje poziom bieżący tj. Lokalna średnia wartość serii, szacowana na podstawie danych do dnia dzisiejszego. Wartość L w czasie t jest obliczana rekurencyjnie od własnej poprzedniej wartości, jak ta. Tak więc bieżąca wygładzona wartość jest interpolacją między poprzednią wygładzoną wartością a bieżącą obserwacją, gdzie kontroluje bliskość interpolowanej wartości najbardziej średnia prognoza Prognoza na następny okres jest po prostu aktualną wygładzoną wartością. W równym stopniu możemy wyrazić następną prognozę bezpośrednio w odniesieniu do poprzednich prognoz i wcześniejszych obserwacji, w każdej z następujących równoważnych wersji W pierwszej wersji prognoza jest interpolacją pomiędzy poprzednią prognozą a wcześniejszą obserwacją. W drugiej wersji następna prognoza uzyskuje się przez dostosowanie poprzedniej prognozy w kierunku poprzedniego błędu w ułamkowej wartości. Jest to błąd popełniony w czasie t W trzecim projekcie prognoza jest wykładnicza ważona, tzn. zdyskontowana średnia ruchoma ze współczynnikiem dyskonta 1. Wersja interpolacyjna formuły prognozowania jest najprostszym rozwiązaniem, jeśli model jest stosowany w arkuszu kalkulacyjnym, który mieści się w jednej komórce i zawiera odwołania do komórek wskazujące na poprzednią prognozę, poprzednią obserwacja i komórka, w której zachowana jest wartość. Zwróć uwagę, że jeśli 1, model SES jest równoważny losowemu modelowi spacerowemu z hout growth Jeśli 0, model SES jest równoważny modelowi średniemu, przy założeniu, że pierwsza wygładzona wartość jest równa średniej. Powrót na górę strony. Średni wiek danych w prognozie wygładzania wykładnicza prostokątnego wynosi 1 względny do okresu, w którym obliczana jest prognoza To nie powinno być oczywiste, ale można to łatwo wykazać przez ocenę nieskończonej serii W związku z tym prosta prognoza średniej ruchowej skłania się do punktów zwrotnych o około 1 okresy Przykładowo, gdy 0 5 opóźnienie to 2 okresy, gdy 0 2 opóźnienie wynosi 5 okresów, gdy 0 1 opóźnienie wynosi 10 okresów, itd. Dla danego wieku średniego tj. Czas opóźnienia, prosta predykcyjna wygładzająca prognoza SES jest nieco wyższa niż zwykłe poruszanie się średnia prognoza SMA, ponieważ w ostatniej obserwacji obserwuje się relatywnie większą wagę - co nieco odpowiada na zmiany zachodzące w niedawnej przeszłości Przykładowo model SMA z 9 terminami i model SES z 0 2 mają średni wiek z 5 dla da w swoich prognozach, ale model SES wiąże się z ostatnimi 3 wartościami niż model SMA, a jednocześnie nie zapominają o wartościach powyżej 9 okresów, jak pokazano na poniższej wykresie. Inna ważna przewaga model SES w modelu SMA polega na tym, że model SES wykorzystuje parametr wygładzania, który jest ciągle zmienny, dzięki czemu można z łatwością zoptymalizować przy użyciu algorytmu solver w celu zminimalizowania średniego kwadratu. wynosiła 0 2961. Średni wiek danych w tej prognozie wynosi 1 0 2961 3 4 okresów, co jest zbliżone do średniej 6-letniej średniej ruchomej. Prognozy długoterminowe z modelu SES to horyzontalna linia prosta, jak w modelu SMA i model losowego chodzenia bez wzrostu Jednak należy zauważyć, że przedziały ufności obliczane przez Statgraphics różnią się w rozsądny sposób i że są one znacznie węższe niż przedziały ufności dla rand om walk model Model SES zakłada, że ​​seria jest nieco bardziej przewidywalna niż model losowego spaceru. Model SES jest w rzeczywistości przypadkiem specjalnym modelu ARIMA, więc statystyczna teoria modeli ARIMA stanowi solidną podstawę do obliczania przedziałów ufności dla Model SES W szczególności model SES jest modelem ARIMA z odmienną różnicą, terminem MA 1, a nie określonym terminem znanym jako model ARIMA 0,1, bez stałego Współczynnik MA 1 w modelu ARIMA odpowiada ilość 1 - w modelu SES Przykładowo, jeśli pasujesz do modelu ARIMA 0,1,1 bez stałej wartości w analizowanych seriach, szacowany współczynnik MA 1 wyniósł 0 7029, czyli prawie o jeden minus 0 2961. Możliwe jest dodanie założenia niezerowej stałej tendencji liniowej do modelu SES W tym celu wystarczy podać model ARIMA z jedną różniczką różniczkową i termin MA 1 ze stałą, tj. Model ARIMA 0,1,1 ze stałymi prognozami długoterminowymi a następnie mają tendencję, która jest równa średniej tendencji obserwowanej w całym okresie szacowania Nie można tego zrobić w połączeniu z dostosowaniem sezonowym, ponieważ opcje sezonowej korekty są wyłączone, gdy typ modelu jest ustawiony na ARIMA. Można jednak dodać stałą długo tendencja wykładnicza do prostego modelu wyrównania wykładniczego z sezonową korektą lub bez sezonu z zastosowaniem opcji dostosowania inflacji w ramach procedury prognozowania Odpowiednia stopa wzrostu inflacji w danym okresie może być oszacowana jako współczynnik nachylenia w modelu tendencji liniowej dopasowany do danych w w połączeniu z naturalną transformacją logarytmową lub może opierać się na innych, niezależnych informacjach dotyczących perspektyw wzrostu długoterminowego Powrót na górę strony. Brown s Linear czyli podwójne wyrównywanie wyrównania. Modele SMA i modele SES zakładają, że nie ma tendencji do jakiegokolwiek rodzaju w danych, które zwykle są OK lub przynajmniej nie-zbyt-kiepskie w przypadku prognoz jednostopniowych, gdy dane są stosunkowo noi sy i mogą być modyfikowane w celu uwzględnienia stałej tendencji liniowej, jak pokazano powyżej. Co z trendami krótkoterminowymi Jeśli seria wykazuje zmienną szybkość wzrostu lub cykliczny wzór, który wyróżnia się wyraźnie na tle hałasu, a jeśli istnieje potrzeba prognozowanie bardziej niż 1 okresu do przodu, a następnie oszacowanie lokalnej tendencji może być problem Prosty model wyrównywania wykładniczego może być uogólniony w celu uzyskania liniowego modelu wygładzania wykładniczego mierzącego lokalną estymację zarówno poziomu, jak i tendencji. Najprostszy trend zmieniający się w czasie model jest brązowym linearnym wykładnikiem wykładniczym, który wykorzystuje dwie różne wygładzone serie, które są skoncentrowane w różnych punktach czasu Formuła prognozowana oparta jest na ekstrapolacji linii przez dwa centra Wyrafinowaną wersją tego modelu, Holt s, jest omówione poniżej. Forma algorytmowa liniowego modelu wygładzania wykładanego przez Brown'a, podobnego do prostego modelu wygładzania wykładniczego, może być wyrażona w wielu różnych, ale formy kwantancyczne Standardowa forma tego modelu jest zwykle wyrażana w następujący sposób Niech S oznacza pojedynczo wygładzoną serię otrzymaną przez zastosowanie prostego wygładzania wykładniczego do serii Y Oznacza to, że wartość S w okresie t jest podana przez. Przypomnijmy, że w prostym wyrównaniu wykładniczym byłaby to prognoza dla Y w okresie t 1 Następnie niech S oznacza podwójnie wygładzoną serię otrzymaną przez zastosowanie prostego wyrównania wykładniczego przy użyciu tego samego do serii S. Na koniec prognoza dla Y tk dla dowolnego k 1, daje te plony e 1 0 tj. oszukiwać nieco i niech pierwsza prognoza będzie równa rzeczywistej pierwszej obserwacji, a y 2 Y 2 Y 1, po której generowane są prognozy przy użyciu powyższego równania To daje takie same dopasowane wartości jako wzór oparty na S i S, jeśli te ostatnie zostały uruchomione przy użyciu S 1 S 1 Y 1 Ta wersja modelu jest używana na następnej stronie, która ilustruje kombinację wygładzania wykładniczego z dostosowaniem sezonowym. Holt s Linear Exponential Smoothing. Brown s Model LES oblicza lokalne szacunki poziomu i tendencji, wygładzając ostatnie dane, ale fakt, że robi to z pojedynczym parametrem wygładzania, ogranicza wzorce danych, które jest w stanie dopasować do poziomu i tendencji nie można zmieniać w niezależne modele Model LES Holt'a rozwiązuje ten problem przez uwzględnienie dwóch stałych wygładzania, po jednym dla poziomu i jednego dla trendu W dowolnym momencie t, podobnie jak w modelu Browna, istnieje szacunkowy poziom L t na poziomie lokalnym i szacunek T t lokalnej tendencji Tutaj są one obliczane rekurencyjnie z wartości Y obserwowanej w czasie t oraz poprzednich szacunków poziomu i tendencji przez dwa równania, które stosują wyrównywanie wykładnicze osobno dla nich. Jeśli szacowany poziom i tendencja w czasie t-1 są odpowiednio L t 1 i T t 1, wówczas prognoza dla Y t, która została dokonana w czasie t-1, jest równa L t-1 T t-1 Gdy rzeczywista wartość jest zaobserwowana, zaktualizowane oszacowanie poziom jest obliczany rekurencyjnie przez interpolowanie pomiędzy Y t a jego prognozą, L t-1 T t-1, przy użyciu odważników i 1. Zmiana szacowanego poziomu, mianowicie L t L t 1 może być interpretowana jako hałaśliwy pomiar trend w czasie t Uaktualniony szacunek trendu oblicza się rekurencyjnie przez interpolację między L t L t 1 i poprzedni szacunek trendu T t-1 przy użyciu odważników i 1. Interpretacja stała wygładzania trendu jest analogiczna do stałej wygładzania poziomu Modele o małych wartościach zakładają, że tendencja zmienia się tylko bardzo powoli w czasie, a modele o większym założeniu, że zmienia się szybciej Model z dużą grupą uważa, że ​​dalekiej przyszłości jest bardzo niepewna, ponieważ błędy w oszacowaniu tendencji stają się bardzo ważne, gdy prognozuje się więcej niż jeden rok naprzód Powrót do początku strony. Stałe wygładzania i można je oszacować w zwykły sposób minimalizując średnie kwadratowe błędy prognoz 1-krotnego wyprzedzenia Jeśli to nastąpi w programie Statgraphics, szacunki szacuje się na 0 3048 i 0 008 Bardzo mała wartość oznacza, że ​​model zakłada bardzo niewielką zmianę tendencji z jednego okresu do następnego, więc w zasadzie ten model próbuje oszacować długoterminową tendencję Przez analogię do pojęcia średniego wieku danych używanych do szacowania t lokalny poziom szeregu, średni wiek danych wykorzystywanych do oszacowania tendencji lokalnej jest proporcjonalny do 1, choć nie jest do niego równy. W tym przypadku okazuje się, że wynosi on 1 0 006 125 To jest bardzo dokładna liczba ponieważ dokładność szacunkowa nie jest naprawdę 3 miejsc po przecinku, ale ma ten sam ogólny porządek wielkości jak wielkość próbki 100, więc model ten jest uśredniony w odniesieniu do dość dużej liczby historii w szacowaniu tendencji Wykres prognozy poniżej pokazuje, że model LES szacuje nieco większą tendencję lokalną na końcu serii niż stała tendencja szacowana w modelu tendencji SES Również szacunkowa wartość jest niemal identyczna z wartością otrzymaną przez dopasowanie modelu SES z tendencją lub bez , więc jest to prawie ten sam model. Jest to wyglądające jak uzasadnione prognozy modelu, które ma być szacowaniem tendencji lokalnej Jeśli zauważysz tę fabułę, wygląda na to, że lokalny trend spadł w dół pod koniec seria Wh jak się zdarzyło Parametry tego modelu zostały oszacowane przez zminimalizowanie kwadratu błędu prognoz 1-krotnego wyprzedzenia, a nie dłuższych prognoz, w których to przypadku trend nie robi dużo różnicy Jeśli wszystko, co szukasz, to 1 - stop-ahead błędy, nie widzisz większego obrazu trendów w ciągu 10 lub 20 okresów Aby uzyskać ten model w zgodzie z naszą ekstrapolacją danych wzrokowych, możemy ręcznie dostosować stałą wygładzania trendu tak, aby używa krótszej linii odniesienia do szacowania tendencji Na przykład, jeśli zdecydujemy się na ustawienie 0 1, średni wiek danych wykorzystywanych do oszacowania tendencji lokalnej wynosi 10 okresów, co oznacza, że ​​uśrednimy tendencję w ciągu ostatnich 20 okresów Oto jak wygląda planowana fabuła, jeśli ustawimy 0 1, zachowując 0 3 To intuicyjnie rozsądne dla tej serii, chociaż prawdopodobne jest, że prawdopodobne jest, że ekstrapolacja tej tendencji nastąpi więcej niż 10 okresów w przyszłości. porównanie modelu f lub dwóch modeli pokazanych powyżej oraz trzech modeli SES Optymalna wartość modelu SES wynosi około 0 3, ale uzyskuje się podobne wyniki z nieco większą lub mniejszą czułością na reakcję przy wartości 0 5 i 0 2. Wyrównanie liniowe Holta z alfa 0 3048 i beta 0 008. B Wyrównanie liniowe Holta z alfa 0 3 i beta 0 1. C Zwykłe wyrównanie wykładnicze z alfa 0 5. D Zwykłe wyrównanie wykładnicze z alfa 0 3. E Proste wyrównanie wykładnicze z alfa 0 2 Statystyki są prawie identyczne, więc naprawdę nie możemy dokonać wyboru na podstawie jednoetapowych prognoz błędów w próbce danych Musimy zwrócić uwagę na inne rozważania Jeśli uważamy, że ma sens oprzeć obecny oszacowanie tendencji na tym, co się wydarzyło w ciągu ostatnich 20 okresów, możemy stworzyć przypadek modelu LES z 0 3 i 0 1 Jeśli chcemy być agnostyczni na temat tego, czy istnieje tendencja lokalna, wówczas jeden z modeli SES mógłby łatwiej wyjaśnić, a także dać więcej middl e-of-the-road prognozy na najbliższe 5 lub 10 okresy Powrót na początek strony. Jakiego rodzaju tendencja-ekstrapolacja jest najlepsza w horyzontalnym lub liniowym Dane empiryczne sugerują, że jeśli dane zostały już skorygowane, jeśli jest to konieczne dla inflacji, to może być nierozsądne ekstrapolacja krótkoterminowych trendów liniowych bardzo daleko w przyszłość Trendy widoczne dziś mogą spowolnić w przyszłości ze względu na różne przyczyny, takie jak nieaktualność produktu, zwiększona konkurencja i cykliczne spowolnienie gospodarcze lub wzrost w przemyśle Z tego powodu prosty wykładniczy wygładzanie często wykonuje lepszą próbę poza próbą niż oczekiwano inaczej, pomimo jej naiwnej ekstrapolacji trendu horyzontalnego Często w praktyce często stosuje się modyfikacje trendu tłumiącego liniowego modelu wygładzania wykładniczego, aby wprowadzić w notatki konserwatyzmu tendencje tendencji tendencji tłumionej Model LES może być implementowany jako szczególny przypadek modelu ARIMA, w szczególności modelu 1,1,2 ARIMA. Można obliczyć przedziały ufności a długoterminowe prognozy wygenerowane przez wykładnicze modele wygładzania, biorąc pod uwagę je jako szczególne przypadki modeli ARIMA Należy uważać, że nie wszystkie programy obliczają prawidłowe przedziały ufności dla tych modeli prawidłowo Szerokość przedziałów ufności zależy od błędu RMS modelu, ii typu wygładzanie proste lub liniowe iii wartość s stała wygładzania s oraz liczba przewidywanych okresów W ogóle odstępy czasowe rozciągają się szybciej, powiększając się w modelu SES i rozchodzą się znacznie szybciej, gdy liniowy, a nie prosty wygładzanie jest wykorzystywane Ten temat został omówiony w dalszej części sekcji ARIMA w notatkach Powrót na górę stronyPodź średniej ruchomej w SAS. A często zadawane pytania dotyczące forów dyskusyjnych SAS to obliczanie średniej ruchomej w SAS Ten artykuł pokazuje, jak używać PROC EXPAND i zawiera linki do artykułów, które używają kroku DATA lub makr do obliczania średnich kroczących w SAS. W poprzednim poście wyjaśniono, jak zdefiniować średnią ruchomej i prowizorycznie dedykowany przykład, który jest tutaj przedstawiony Wykres jest wykresem rozliczeniowym miesięcznej ceny zamknięcia dla zasobów IBM w okresie 20 lat Trzy krzywe są ruchome średnie Krzywa MA jest pięciopunktową końcową średnią ruchoma Krzywa WMA jest średnia ważona średnia krocząca z ciężarami 1 do 5 Podczas obliczania ważonej średniej ruchomej w czasie t wartość yt ma ciężar 5, wartość y t-1 ma ciężar 4, wartość y t-2 ma ciężar 3 itd. Krzywa EWMA jest geometrycznie ważoną średnią ruchomą ze współczynnikiem wygładzania 0 3. Niniejszy artykuł pokazuje, jak wykorzystać procedurę EXPAND w oprogramowaniu SAS ETS do obliczania prostej średniej ruchomej, ważonej średniej ruchomej oraz średniej ruchomej wykładniczej w SAS. EXPAND i wiele jej możliwości polecam przeczytanie krótkiego artykułu "Głupi ludzkie sztuczki" z PROC EXPAND autorstwa Davida Cassella 2017. Ponieważ nie każdy klient SAS ma licencję na oprogramowanie SAS ETS, na końcu tego artykułu znajdują się linki, które pokazują, jak obliczyć prosta średnia ruchoma w SAS przy użyciu kroku DATA. Zestawienie przykładowej serii czasów. Przed obliczanie średniej ruchomej w SAS potrzebne są dane Następujące wywołanie PROC SORT tworzy przykładową serię czasową z 233 obserwacjami Nie ma brakujących wartości Dane są sortowane według zmiennej czasowej, T Zmienna Y zawiera miesięczną cenę zamknięcia zasobów IBM podczas 20-letniego okresu średniej ruchomej w SAS przy użyciu PROC EXPAND. PROC EXPAND oblicza wiele średnich kroczących i innych statystyk kroczących, takie jak odchylenia standardowe toczenia, korelacje i skumulowane sumy kwadratów. W procedurze instrukcja ID identyfikuje zmienną czasową, T Dane powinny być sortowane według zmiennej ID. Instrukcja CONVERT określa nazwy zmiennych wejściowych i wyjściowych TRANSFORMACJA opcja określa metodę i parametry, które są wykorzystywane do obliczania statystyk kroczących. Przykład używa trzech instrukcji CONVERT. Najpierw określa, że ​​MA jest zmienną wyjściową, mputed jako średnia kroku wstecznego, która wykorzystuje pięć wartości danych k 5. Drugie oświadczenie CONVERT określa, że ​​WMA jest zmienną wyjściową, która jest ważoną średnią ruchoma. Wagi są automatycznie standaryzowane przez procedurę, więc formuła jest WMA t 5 yt 4 y 15. Trzeci CONVERT stwierdza, że ​​EWMA jest zmienną wyjściową, która jest średnią ważoną ruchliwą wykładniczo z parametrem 0 3.Notyczność opcji METHOD NONE na Oświadczenie PROC EXPAND Domyślnie procedura EXPAND dostosowuje krzywe sześciennego splajnu do wartości nie zmienionych. Opcje METHOD NONE zapewniają, że surowe punkty danych są używane do obliczania średnich ruchomej, a nie interpolowanych. Sprawdzanie średnich kroczących. średnia ruchoma to pokrywanie krzywej na wykresie rozproszonym surowych danych Pozwala to na wizualizację krótkoterminowych trendów w danych Następujące połączenie PROC SGPOT tworzy wykres na górze tego artykułu. Aby utrzymać ten artykuł jak najszybciej, nie omówiłem, jak radzić sobie z brakiem danych podczas obliczania średnich kroczących Zobacz dokumentację PROC EXPAND dla różnych problemów związanych z brakiem danych W szczególności możesz skorzystać z opcji METHOD, aby określić, jak interpolować brakujące wartości Możesz także użyj opcji transformacji, aby kontrolować, jak średnie ruchome są zdefiniowane dla pierwszych kilku punktów danych. Utwórz średnią ruchową w SAS, używając kroku DATA. Jeśli nie masz oprogramowania SAS ETS, poniższe odniesienia wskazują, jak korzystać z kroku SAS DATA do obliczyć proste średnie ruchome za pomocą funkcji LAG. Baza wiedzy SAS zawiera artykuł Obliczenie średniej ruchomej zmiennej. Premal Vora 2008 porównuje krok DATA z kodem PROC EXPAND w artykule Easy Rolling Statistics z PROC EXPAND. Ron Cody zawiera SAS makro w kilku jego książkach Na przykład Cody s Kolekcja popularnych zadań programowania SAS i jak to sobie radzi to makro o nazwie moveAve Możesz pobrać makro jako p sztuka kodu przykładowego i danych dla książki. Każdy krok danych, który jest przeznaczony do obsługi jednej obserwacji na raz, nie jest najlepszym narzędziem obliczania szeregów czasowych, które naturalnie wymagają wielu opóźnień obserwacji i prowadzi W przyszłym blogu post, Pokażę, jak zapisywać funkcje SAS IML, które obliczają proste, ważone i wykładniczo ważone średnie ruchome. Język matrycy w PROC IML jest łatwiejszy do pracy z obliczeniami, które wymagają dostępu do wielu punktów czasowych. O autorze Autor: Rick Wicklin, PhD jest wybitny naukowiec w statystyce obliczeniowej w firmie SAS i jest głównym twórcą PROC IML i SAS IML Studio Jego obszerne doświadczenie obejmuje statystyki obliczeniowe, symulacje, grafikę statystyczną i nowoczesne metody analizy danych statystycznych Rick jest autorem książek Programy statystyczne z SAS IML Oprogramowanie i dane symulacyjne z SAS. Możesz również utworzyć średnie kroczące, łącząc PROC SUMMARY z MLFormat, a także za pomocą tablic w e krok DATA Możesz przeczytać więcej o tych technikach w książce Carpenter s Guide to Innovative SAS Techniques. I m ma problem z przenoszeniem średniej, że nie mogłem wymyślić jakiegokolwiek rozwiązania do tej pory muszę obliczyć ruchome średnie z poprzednich 6 miesiące przez 6 miesięcy Chodzi o to, aby uwzględnić poprzednie obliczone średnie ruchome, w tym statystykę ruchu, którą próbowałem z funkcją LAG i PROC EXPAND, ale nie działało. Kolumna X to moje oryginalne informacje, Y1 jest co im osiągnięcie SAS uważa M7 do M12 za brakujące, a Y2 jest tym, czego chcę. X Y1 Y2 M1 100,0 100,0 100,0 M2 200,0 200,0 200,0 M3 300,0 300,0 300, 0 M4 400,0 400,0 400,0 M5 500,0 500,0 500,0 M6 600,0 600,0 600,0 M7 350,0 350,0 M8 400,0 391,7 M9 450,0 423 , 6 M10 500,0 444,2 M11 550,0 451,6 M12 600,0 443,5. Najlepiej zadać pytania dotyczące programowania SAS w społeczności wsparcia SAS, ponieważ zawiera funkcje, które zadają pytania i publikują kod SAS łatwiejsze Możesz też uzyskać poradę wiele osób, a nie tylko ja. Ji To tylko niewielka odmiana rozwiązania SQL, które zostało opublikowane w SAS Community, nie każdy ma dostęp do SAS ETS i PROC EXPAND. dodaj numer obserwacyjny do już posortowanego zestawu danych seria danych seria set series xn run. proc sql stwórz tabelę jako wybór, wybierz średnią y z serii, gdzie x między x-4 a toporem jako przemieszczenie z serii jako quit. Pierwsze cztery obserwacje MOVINGAVG wykorzystują 1, 2, 3 i 4 wartości Y do obliczenia średniej ruchomej, a następnie zawsze jest to aktualna obserwacja plus poprzednie 4. To jest zmienione z pliku. posted przez SAS Yoda, Ksharp.

Comments