Thursday 16 November 2017

Ruchome średnie wartości


powiedzmy, mam tabeli postgresql z następujących wartości. Jeśli używać postgresql do obliczania średniej, to daje mi średnio 24 8, ponieważ wysoka wartość 100 ma wielki wpływ na obliczenia Chociaż chciałbym znaleźć średnią gdzieś około 6 i wyeliminować ekstremalne sI szukam sposobu, aby wyeliminować skrajności i chcesz to zrobić statystycznie poprawnie Skrajnych nie można ustalić Nie mogę powiedzieć, jeśli wartość jest ponad X, to musi być wyeliminowane. Graduję moje głowa na funkcje agregatu postgresql, ale nie mogę umieścić mojego palca na co jest właściwe dla mnie używać Any suggestions. asked 29 maja 10 w 8 41.Postgresql może również obliczyć odchylenie standardowe. Możesz wziąć tylko punkty danych, które są w średniej - 2 stddev, które odpowiadałyby w przybliżeniu 90 punktom danych najbliższym średniej. Oczywiście 2 może też wynosić 3 95 lub 6 99 995, ale nie spotykaj się z liczbami, ponieważ w obecności zbędnych odbiorców nie ma już pracy z normalnym di stribution. Be bardzo uważać i sprawdzić, czy działa zgodnie z oczekiwaniami. Mind za pomocą funkcji okna ntile Pozwala łatwo wyizolować ekstremalnych wartości z zestawu wyników. Powiedzmy, że chcesz wyciąć 10 z obu stron zestawu wyników Następnie przejść wartość od 10 do ntile i szukanie wartości pomiędzy 2 a 9 daje wynik pożądany Należy pamiętać, że jeśli masz mniej niż 10 rekordów, może przypadkowo wyciąć więcej niż 20, więc sprawdź, czy całkowita liczba rekordów jak dobrze. Jednakże 29 czerwca 16 w 14 28. Twoja odpowiedź.2017 Stack Exchange, Inc Mamy demona, który czyta w danych z niektórych czujników, a wśród rzeczy, które oblicza oprócz po prostu tylko raportowanie stanu jest średni czas potrzebuje dla czujników zmieniających się z jednej wartości na drugą Zachowuje ona przeciętnie 64 punkty danych i zakłada, że ​​czas pracy jest dość stały. Niestety, jak pokazano na poniższym wykresie, dane wejściowe nie są najbardziej nieskazitelne. Każda linia reprezentuje inny zestaw danych, w którym oś x nie ma znaczenia, poza niewyraźną historyczną osią czasu. Moim oczywistym rozwiązaniem jest utworzenie histogramu danych, a następnie wybranie trybu. Jednakże zastanawiałem się jeśli istnieją inne metody, które przyniosłyby lepszą wydajność lub byłyby bardziej odpowiednie do pracy z przeciętną średnią Niektóre szybkie wyszukiwania w Wikipedii sugerują algorytmy wykrywania nieprawidłowości mogą być również przydatne Prostota jest plus, ponieważ demona jest napisany w C. Edit I scoped a następnie wymyślić te różne techniki. Kryterium Chauvenet przy użyciu średniego i standardowego odchylenia, obliczyć prawdopodobieństwo wystąpienia konkretnego punktu danych, a następnie wykluczyć, jeśli prawdopodobieństwo jest w rzeczywistości, że zło jest mniejsze niż 50. Chociaż wydaje się to dobrze nadaje się do korygowania średniej bieżącej w locie, nie jestem całkiem przekonany o jego skuteczności, jak się wydaje przy dużych zbiorach danych, że nie chce odrzucić datapoints. Grubbs test Inna metoda, która wykorzystuje różnicę od średniej do odchylenia standardowego i ma pewne wyobrażenie, kiedy hipoteza nie jest odrzucana. Zbliżenie odległości Mierzenie oddziaływania punktu danych na regresję najmniejszych kwadratów, którą nasza aplikacja najprawdopodobniej odrzuci, jeśli przekroczy 1 Średnia skrócona Odrzuć niski koniec i wysoki koniec, a następnie przyjmuj średnią jako normalną. Każdy ma określone doświadczenie i może komentować te techniki statystyczne. Ponadto niektóre komentarze dotyczące sytuacji fizycznej powtarzamy średni czas do zakończenia mechaniczna pralka, więc jej działanie powinno być dość stałe Nie jestem pewien, czy rzeczywiście ma normalną dystrybucję. Edit 2 Kolejną ciekawą kwestią, gdy demona jest bootstrapping, podobnie jak w, nie ma żadnych wcześniejszych danych do analizy, jak to powinno radzić sobie z przychodzącymi danymi Po prostu nie robić nic lepszego przycinania. Edytuj 3 Jeszcze jedna rzecz, jeśli sprzęt zmienia się tak, że czas pracy się zmienia, czy warto algorytm wystarczająco wytrzymały, aby nie wyrzucić tych nowych czasów, powinienem pamiętać, aby zapełnić pamięć podręczną, kiedy to nastąpi. Zauważyła 12 kwietnia o godz. 7 24. Tawani - nie wszystkie brakuje punktu Co mówisz trzeba zdefiniować używając pojęć ogólnych Nie możesz pojednać z jednym przykładem Bez ogólnych definicji, jeśli 400 to 30 to wciąż wyprzedzenie A jeśli jest 14 A 9 Gdzie zatrzymasz Potrzebujesz stddev s, zakresów, kwarty, by to zrobić Daniel Daranas Feb 2 09 przy 17 05. Przycinanie nie musisz usunąć wartości odbiegających od wartości, które po prostu nie uwzględnisz w obliczeniach Usunięcie może sugerować, że punkty nie są już w zbiorze danych i nie usuwasz lub ignorujesz ich, ponieważ są one niekorzystne, kryterium jest zazwyczaj to, że są w jakiejś skrajnej części danych Wartość nieuwzględniona w środku przyciętym często jest nieco mniej lub bardziej niż najwyższa najniższa wartość Nick Cox Dec 3 14 w wieku 16 48. Nie wiem, czy ma to imię, ale można łatwo wymyślić wiele algorytmów hms aby odrzucić outliers. Find wszystkie liczby między 10 a 90th percentiles zrobić to sortując następnie odrzucić pierwsze N ​​10 i ostatnie N 10 numery i wziąć średnią wartość pozostałych wartości. Sort wartości, odrzucić wysokie i niskie wartości, dopóki czyniąc to, średnie odchylenie standardowe zmienia się bardziej niż X. Sort wartości, odrzuć wysokie i niskie wartości, o ile tak się dzieje, wartości są o więcej niż K odchylenia standardowe od średniej. Najczęstszym sposobem na uzyskanie Solidnego zwykłe słowo oznaczające odporność na złe średnie dane to użycie medianu To jest tylko średnia wartość w posortowanej liście w połowie drogi między środkowymi dwoma wartościami, więc na przykład byłaby ona 90 5 w połowie drogi pomiędzy 90 a 91. Jeśli chcesz uzyskać naprawdę do solidnych statystyk, takich jak solidne szacunkowe odchylenia standardowe itp. Polecam zgubić kod w grupie AGORAS, ale może to być zbyt zaawansowane dla celów. odpowiedzi 13 lutego 09 w 9 22.Jeśli masz wszystko jest jedną zmienną, jak sugerujesz myślę s z powyższych respondentów są krytyczne dla twojego podejścia Z pewnością inne metody, które wyglądają na takie rzeczy, jak dźwignia są bardziej statystyczne, ale to oznacza, że ​​robisz modelowanie jakieśgo rodzaju Jeśli masz tylko na przykład wyniki testu lub wiek osób starszych wiarygodne przykłady Twojego przykładu Myślę, że jest praktyczne i rozsądne, aby być podejrzanym o wyższy współczynnik można przywołać Możesz spojrzeć na ogólną średnią i przycięte średnie i zobaczyć, jak wiele się zmienia, ale to będzie funkcja wielkości próbki i odchylenie od średniej dla outliers. With bardzo złych odchyleń tak, to na pewno chcesz spojrzeć na te proces generowania danych, aby dowiedzieć się, dlaczego tak jest w przypadku wejścia danych lub administracyjnych fluke Jeśli tak i jest to prawdopodobnie niezwiązane z prawdziwa prawdziwa wartość, która jest niezauważalna wydaje mi się doskonale przystosowana do wykończenia Jeśli jest to prawdziwa wartość, o ile możesz powiedzieć, może nie być w stanie usunąć, chyba że jesteś wyraźnie w swojej analizie dotyczącej it. an przeskakiwał Dec 3 14 at 13 58.My podręcznik statystyczny odnosi się do tego jako Przykładowa średnia w przeciwieństwie do próbki średniej populacji sugeruje, że istnieje ograniczenie zastosowane do pełnego zestawu danych, chociaż nie dokonano żadnych modyfikacji w zestawie danych. w 3 13.0 Witamy na stronie 1 Która książka Proszę podać numer referencyjny 2 Średnia próbka zazwyczaj nie odnosi się do średniej uzyskanej po usunięciu odstających Juho Kokkala 26 marca w wieku 8 06. Może to być mediana Nie zawsze, ale czasami nie mam pomysł, co nazywa się w innych okazjach Nadzieję, że to pomogło Przynajmniej trochę.

No comments:

Post a Comment