Wie berechnet man das "genaue Konfidenzintervall" für das relative Risiko?
Ich habe gerade die neueste Version von R installiert. Welche Pakete soll ich erhalten?
Konferenzen zum maschinellen Lernen?
Wie kann ich die Genauigkeit früherer Wahrscheinlichkeitsberechnungen bestimmen?
Wie würden SIE die IMDB-Filmbewertung berechnen?
Lineares Modell mit Einschränkungen
Berechnung der falschen Akzeptanzrate für eine Gaußsche Verteilung der Punktzahlen
Binomialtest für eine binäre Variable
Wie kann ich R in PHP integrieren?
Lineare Regression mit kleiner Stichprobe: Wo soll ich anfangen?
R Ressourcen in nicht englischen Sprachen
Wie kann man eine große symmetrische Matrix mit geringer Dichte diagonalisieren, um die Eigenwerte und Eigenvektoren zu erhalten?
Gestapeltes Barplot
Keine gültigen Koeffizienten für die NegBin-Regression
Ermitteln Sie die Anzahl der Parameter eines linearen Modells
ΣΑΣ / ΙΜΛ κομπαρεδ το Ρ
Knotenauswahl für kubische Regressionssplines
Interpretation des zweiseitigen Welch T-Tests mit zwei Stichproben
Sollte eine Multiple-Choice-Umfrage eine neutrale Antwort enthalten?
Wie lautet die Formel von Silverman zur Berechnung der Bandbreite bei einer Schätzung der Kerneldichte?
Kullback-Leibler-Divergenz - Interpretation
z Score-Funktion in R.
Wie sollten Sie mit Zellenwerten gleich Null in einer Kontingenztabelle umgehen?
Erstellen einer Uniform vor der logarithmischen Skala
Wie werden aus der Faktoranalyse abgeleitete Variablen als Prädiktoren für die logistische Regression verwendet?
Gibt es eine Möglichkeit, die Vielfalt in einer Bevölkerung zu berechnen?
Was sind die Softwareeinschränkungen bei allen möglichen Teilmengenauswahlen in der Regression?
Was bedeutet ein F-Wert kleiner als 1 in einer Einweg-ANOVA?
Exponentiell gewichtete bewegte lineare Regression
Kann jemand Gibbs Sampling mit sehr einfachen Worten erklären?
Fragen zur Variablenauswahl für die Klassifizierung und zu verschiedenen Klassifizierungstechniken
Zufallszahlengenerierung mittels T-Verteilung oder Laplace-Verteilung
Was wäre ein guter Weg, um mit einem großen Datensatz in Excel zu arbeiten?
Faktorabhängige Korrelation
Gibt an, ob EFA oder PCA zur Beurteilung der Dimensionalität einer Reihe von Likert-Elementen verwendet werden soll
Wenn eine Statistik keine Bedeutung aufzeigt, muss ich die Leistung dafür berechnen?
Vorhersage des Clusters eines neuen Objekts mit km in R.
Was sind die Hauptunterschiede zwischen Z-Scores und T-Scores und werden beide als Standard-Scores betrachtet?
Ist es möglich, Datenanalysen in Open Office Calc durchzuführen?
Welche Methoden zur statistischen Vorhersage / Prognose von Handelsdaten?
Effiziente Möglichkeit, mehrere Datenrahmen in R zusammenzuführen
Akzeptabler r-Quadrat-Wert für das multiple lineare Regressionsmodell
Was ist das beste Tool für die Kundensegmentierung?
Was sind gute Techniken und Ressourcen für den Unterricht des Bayes-Theorems?
Ist es angemessen, Ausreißer zu identifizieren und zu entfernen, weil sie Probleme verursachen?
Ist es angebracht, einen Interaktionseffekt zu untersuchen, der statistisch nahezu signifikant ist?
Wo finden Sie mathematische Modellierungshilfen für Low-Budget-Projekte?
Vergleich reproduzierbarer Forschungsstrategien: Brew oder Sweave vs. R2HTML
Korrektur von Ausreißern im laufenden Durchschnitt
Kann die Schätzung von Korrelationen angesichts der Fortschritte bei statistischen Tests ein Selbstzweck sein?
Reicht bei der linearen Regression der Wert $ R ^ 2 $ aus, um zu beurteilen, ob die Beziehung zwischen der unabhängigen und der abhängigen Variablen linear ist?
Worauf bezieht sich "repräsentative Stichprobe" genau?
Wie speichere ich die Standardfehler mit der Funktion lm () in R?
Wenn Zufallsvariablen aus einer identischen Verteilung gezogen werden, warum garantiert dies nicht, dass sie unabhängig sind?
Wie konvertiere ich einen Vektor mit aufzählbaren Zeichenfolgen in einen Vektor mit Zahlen?
Alpha-Anpassung für mehrere Tests
Verursacht das Zusammensetzen (Boosten) eine Überanpassung?
Transformieren der Dummy-Werte, um Protokolle erstellen zu können
Was sind der Mittelwert und die Varianz des Verhältnisses zweier lognormaler Variablen?
Bewertungsmaßstäbe für die Güte oder Gültigkeit von Clustering (ohne Wahrheitsbezeichnungen)
Auswahl des besten Modells basierend auf der linearen, quadratischen und kubischen Anpassung der Daten
Interpretation einer negativen Konfidenzgrenze für einen Anteil
Wie können 8 Dimensionen auf 3 reduziert werden?
Welches Leistungsmaß ist bei Verwendung von SVM zu verwenden: MSE oder MAE?
Kann der Interaktionsterm zweier nicht signifikanter Koeffizienten signifikant sein?
Modellbewertung und Vergleich zur Auswahl des besten Modells
Regressionskoeffizienten nach Gruppe in R?
Ist die Kreuzvalidierung das wichtigste Maß für die Wirksamkeit eines Vorhersagemodells?
Effektgröße interpretieren
Warum sind meine p-Werte so hoch?
Wie korreliere ich ordinale und nominale Variablen in SPSS?
Ist es jemals gut, das Signifikanzniveau zu erhöhen?
Effektgröße und statistische Signifikanz
Wenn zwei Ereignisse $ A $ und $ B $ kein gemeinsames Ergebnis haben
Warum ist das arithmetische Mittel> Median eines Histogramms nach rechts geneigt?
Warum sich ANOVA / Regressionsergebnisse ändern, wenn für eine andere Variable gesteuert wird
Warum ist die Varianz von $ X-Y $ gleich der Summe der Varianzen, wenn $ X, Y $ unabhängig sind?
Extrahieren Sie Standardfehler der linearen Koeffizientenregression R.
Konfidenzintervall für einen Anteil, wenn der Stichprobenanteil fast 1 oder 0 beträgt
Ist Kosinusähnlichkeit eine Klassifikation oder eine Clustering-Technik?
Was ist die genaue Definition der Profilwahrscheinlichkeit?
Wie führe ich ein Histogramm mit nicht gleichem Abstand in R durch?
Ist es akzeptabel, ein Vorzeichen einer Hauptkomponentenbewertung umzukehren?
Was ist das optimale $ k $ für den Klassifikator für den nächsten Nachbarn $ k $ im Iris-Datensatz?
Wahrscheinlichkeitsdichtefunktion zwischen -1 und 1?
Müssen wir den Median oder den Mittelwert angeben, wenn wir einen Kruskal-Wallis-Test verwenden?
PCA auf die ursprünglichen Variablen zurücksetzen
Zufälliger Effekt gleich 0 im verallgemeinerten linearen gemischten Modell
OLS mit gruppierten Standardfehlern im Vergleich zur Mehrebenenmodellierung, wenn das Hauptinteresse auf individueller Ebene liegt
Welche Art von statistisch genauem Test sollte ich verwenden?
Kausalität mit t-Test / Regression nachweisen
Aussterberisiko von Schrödingers Katzen
Kullback-Leibler-Divergenz: negative Werte?
Sind Messungen am selben Patienten unabhängig?
Konvention für Symbole, die statistische Signifikanz anzeigen?
Was ist die "Root-MSE" in Stata?
Was sind die verschiedenen Arten von Durchschnittswerten?
Was sind die mehrdimensionalen Versionen des Medians?
Wolfram Mathematica, MATLAB oder etwas anderes?
R vs STATA, was für einen Aktuar wertvoller ist?
Intuition hinter Vollständigkeit
Regressionsanalyse für einen massiven Datensatz
ANCOVA und seine störenden Annahmen
Wie hoch sind die Chancen, dass meine Frau Lupus hat?
Generieren von Proben aus Gibbs-Probenahme
Warum quadratische Residuen anstelle von absoluten Residuen bei der OLS-Schätzung?
R-Quadrat im gemischten Modell mit zufälligen Effekten
Erwarteter Wert der quadratischen Form
Was bedeutet die y-Achse in einem Kernel-Dichtediagramm?
Summe der Quadrate der Residuen anstelle der Summe der Residuen
Caret und randomForest Anzahl der Bäume
Punkte bewerten, die nicht einfach zu vergleichen sind
Ist das Gewinnen eines Fußballspiels unabhängig von früheren Gewinnen / Verlusten?
Interpretation eines seltsamen Boxplots mit umgekehrten Whiskern
Interpretation von p-Werten in Fisher vs Neyman-Pearson-Frameworks
Was ist Gratregression?
Bedeutung der Vollständigkeit einer Statistik?
Excel-, Heatmap- und Datenvisualisierung ohne Add-Ins
Woher kommen die Annahmen für die lineare Regression?
Beweisen Sie, dass der F-Test gleich dem Quadrat des T-Tests ist
Rücktransformation eines MLR-Modells
Wie teste ich meine Daten gegen eine bestimmte Normalverteilung?
Was sind gute RMSE-Werte?
Wie interpretiere ich die Ausgabe der Zusammenfassungsmethode für ein lm-Objekt in R?
Erklärungen zur linearen Regression
Wahl zwischen ANOVA Typ I, Typ II oder Typ III
Warum ist die Formel für Standardfehler so wie sie ist?
Unvoreingenommener Schätzer der Varianz der Binomialvariablen
Verteilung einer Logit-Transformation einer normalen Variablen
Geeignetes Diagramm zur Visualisierung der Datenverbreitung
Unerwartetes Residuendiagramm eines gemischten linearen Modells unter Verwendung von lmer (lme4-Paket) in R.
Wie können bedingte Zufallsfelder und logistische Regression gleich sein?
Gibt es nützliche Anwendungen von SVD, die nur die kleinsten Singularwerte verwenden?
Warum dreht sich die Bootstrap-Korrelation um Null, während die ursprüngliche Korrelation $ \ ca. 0,52 $ beträgt?
Quadratische Modelle mit R. Die Verwendung von Poly (..) - und I (..) -Funktionen (R-Sprache)
Wohin geht der Offset in der Poisson / negativen Binomialregression?
Wie kann man aus einer diskreten Verteilung abtasten?
Zeichnen Sie die logarithmische Normalverteilung in R.
Warum müssen wir Daten vor der Hauptkomponentenanalyse (PCA) normalisieren?
Lineare Regression und Nichtinvertierbarkeit
Mittelwert hat einen niedrigeren Standardfehler als 5% getrimmter Mittelwert?
Wie kann man eine Regression mit bekannten Korrelationen zwischen den Fehlern durchführen?
Wie melde ich Daten für eine gesamte Bevölkerung?
Gibt es einen statistischen Grund für diagonale Linien im Streudiagramm auf einer logarithmischen Skala?
Lineare Regression mit stark nicht normaler Antwortvariable
Protokoll- oder Quadratwurzeltransformation für ARIMA
F: Welches Buch über Bayes'sche Statistik, vorzugsweise mit R?
Ist das MCMC einfach ein probabilistischer Gradientenabstieg?
Warum nimmt die statistische Signifikanz mit den Daten zu, ABER die Auswirkungen sind möglicherweise nicht aussagekräftig?
PCA findet iterativ Richtungen mit der größten Varianz; aber wie findet man einen ganzen Unterraum mit größter Varianz?
Problem beim Verständnis der logistischen Regressionsverknüpfungsfunktion
Wie hoch ist die Wahrscheinlichkeit, dass eine Person an ihrem Geburtstag stirbt?
Grundlegendes zu dieser ACF-Ausgabe
Ist der geschätzte Wert in einer OLS-Regression "besser" als der ursprüngliche Wert?
Warum ist die Homogenität der Varianz so wichtig?
Ist "unabhängig und identisch verteilt" eine Annahme oder eine Tatsache?
Grafische Modelle und Erklärungen?
Wie passt man Daten an, die wie ein Gaußscher aussehen?
Negative Werte für AIC im allgemeinen gemischten Modell
Ist eine bestätigende oder eine explorative Statistik "Induktion gegen Abzug"?
Warum scheinen ein Dichtediagramm und ein Teppichplot nicht übereinzustimmen?
Was bedeutet die Dichte einer Verteilung an einem Punkt?
Was ist der richtige Name für eine "River Plot" -Visualisierung?
Ist die binäre logistische Regression ein Sonderfall der multinomialen logistischen Regression, wenn das Ergebnis zwei Ebenen hat?
Wie erstelle ich eine ROC-Kurve, um die Leistung von Regressionsmodellen zu bewerten?
Warum nimmt die Standardabweichung nicht ab, wenn ich mehr Messungen durchführe?
Warum einen z-Test anstelle eines t-Tests mit proportionalen Daten verwenden?
Why is leave-one-out cross-validation (LOOCV) variance about the mean estimate for error high?
How do I get "V-shaped" distributed random numbers from uniformly distributed numbers?
Sign of coefficients in linear regression vs. the sign of correlation
Kann ein mathematisch fundiertes Vorhersageintervall eine negative Untergrenze haben?
Ist die visuelle Inspektion die einzige Möglichkeit, große Datenmengen zu vergleichen?
Wenn $ X $ normal verteilt ist, kann $ \ log (X) $ auch normal verteilt werden?
Ist ein p-Wert eine Stichprobenstatistik oder ein Populationsparameter oder keiner?
Regression - Woher weiß ich, ob meine Residuen normal verteilt sind?
Wie kann ich zeigen, dass ein zufälliger Spaziergang keine stationäre Kovarianz ist?
Ist es ein gültiger Algorithmus, um beim Casino-Roulette zu gewinnen?
Ist statistische Bedeutungslosigkeit tödlich?
Beim Erzwingen des Abfangens von 0 in linearer Regression ist dies akzeptabel / ratsam
Wie nennt man dieses Diagramm mit Symbolen für Künstler auf einer horizontalen Achse, die die Anzahl der verwendeten eindeutigen Wörter angeben?
Zufällige Waldfrage
Berechnen Sie die Wahrscheinlichkeit (Fläche) unter der Überlappungsfläche zweier Normalverteilungen
Was bedeutet es, sich über den Seitenzahn zu integrieren?
Warum verwenden wir GLM?
Verständnis der Ergebnisse von $ \ chi ^ {2} $ und Cramér $ V $
Wie verwende ich SVD zur Reduzierung der Dimensionalität, um die Anzahl der Spalten (Merkmale) der Datenmatrix zu reduzieren?
Wie gehe ich mit einer verzerrten Klasse in der binären Klassifikation mit vielen Merkmalen um?
Interpretation von ein- und zweiseitigen Tests
Ähnlichkeiten und Unterschiede zwischen Korrelation und Regression
Wie man Koeffizienten von $ x $ und $ x ^ 2 $ in derselben Regression interpretiert
Wenn zwei Zeitreihen $ X $ und $ Z $ auf $ 0 \ leq Z \ leq X $ folgen, können wir dann sagen, dass $ \ text {var} (Z) \ leq \ text {var} (X) $?
Sollte ich T-Test für stark verzerrte und diskrete Daten verwenden?
Beweis / Ableitung von Skewness- und Kurtosis-Formeln
SPSS- und Stata-Ausgabe unterschiedlich
Interpretation der Ausgabe von anova () bei Verwendung von lm () als Eingabe
Regression für die binäre Klassifikation
Wann wurde die Wichtigkeitsstichprobe zum ersten Mal angegeben?
Vorzeichen für Koeffizientenänderungen beim Hinzufügen einer Variablen in der logistischen Regression
Verwirrung der Teilkomplexitätsparameter
Ist kNN am besten für die Klassifizierung geeignet?
Erhalten des P-Werts mit gemischtem Effekt mit dem lme4-Paket
Wachsende Anzahl von Gaußschen in einer Mischung
Was ist die konvexe Hülle in der ROC-Kurve?
Wie ist die Wahrscheinlichkeitsverteilung von $ 1- \ text {mean} (| A-B |) $, wobei $ A $ und $ B $ unabhängige U (0,1) sind?
Wann sollte ich die Feature-Skalierung für meine Daten anwenden?
Studienwahl für Data Science?
Wenn wir $ H_0 $ nicht glauben, warum dann einen p-Wert angeben, der unter der Annahme berechnet wurde, dass $ H_0 $ wahr ist?
Stichprobengröße zu groß?
Wie werden standardisierte Regressionskoeffizienten und p-Werte in multipler Regression interpretiert?
quadratische Dinge in der Statistik - verallgemeinerte Begründung
Warum bekomme ich diesen p-Wert beim Jarque-Bera-Test in R?
Warum wird der Typ-I-Fehler nicht durch unterschiedliche Stichprobengrößen beeinflusst - Hypothesentests?
Warum nicht das gesamte Trainingsset validieren?
Der Unterschied zwischen den drei Augmented Dickey-Fuller-Tests (keine, Drift, Trend)
Lineare Regression - ist ein Modell "nutzlos", wenn $ R ^ 2 $ sehr klein ist?
Beweis, dass die Wahrscheinlichkeit, dass ein Wohnmobil größer als $ n-1 $ andere ist, $ \ frac {1} {n} $ ist
Nichtlinearer Effekt in einem Interaktionsterm
Beliebte Software zur Auflösung benannter Entitäten
Warum ist $ p (A) \ mal p (B | A) = p (B) \ mal p (A | B) $?
Normalisierungen: Teilen durch Mittelwert
Ist die Wahrscheinlichkeit eine echte Funktion?
Kann die Wahrscheinlichkeit Werte außerhalb des Bereichs [0, 1] annehmen?
Unterschied zwischen R Quadrat und rmse in der linearen Regression
Einfaches nichtlineares Regressionsproblem
Was verstehen wir unter Hyperparametern?
Verwirrt durch die Lage der Zäune in Box-Whisker-Parzellen
Was bedeutet Großbuchstabe ich in diesen Formeln?
Wie erhält man die Ableitung einer Normalverteilung mit ihren Parametern?
Wie sollen stark korrelierte Kovariaten für die logistische Regression behandelt werden?
Bewertung des endgültigen Modells nach k-facher Kreuzvalidierung
Wenn $ X $ und $ Y $ normalverteilte Zufallsvariablen sind, welcher Art von Verteilung folgt ihre Summe?
Was folgt, wenn wir die Nullhypothese nicht ablehnen?
Bias-Varianz-Zerlegung und Unabhängigkeit von $ X $ und $ \ epsilon $
Kann der Bestimmungskoeffizient $ R ^ 2 $ mehr als eins sein? Was ist seine Obergrenze?
Standardisierung einer normalen Standardvariablen
Beispiel für eine Verteilung, deren Unterstützung streng positiv ist
Wie heißt dieser statistische Irrtum?
Area Under Curve ROC bestraft Modelle mit zu vielen erklärenden Variablen?
Erstellen eines einzelnen Entscheidungsbaums aus einer zufälligen Gesamtstruktur
R: geom_density values in y-axis
Was bedeutet "räumlich unregelmäßig verteilte Daten"?
Nichtübereinstimmung zwischen dem p-Wert und dem Konfidenzintervall in einem Binomialtest
Grundlegende Ableitung von Gini-Verunreinigungen
Jaccard Ähnlichkeit in R.
Was ist der erwartete absolute Unterschied zwischen Stichprobe und Populationsmittel?
Statistischer Irrtum, wenn keine Variablen kontrolliert werden?
Welche Art von GLM sollte ich verwenden, wenn meine Antwortvariable die Koloniengröße hat?
Ist es eine gute Praxis, Daten für maschinelles Lernen immer zu skalieren / zu normalisieren?
Nachteile der ROC-Kurve
Was ist für die Schätzung der kleinsten Quadrate der Unterschied zwischen der Verwendung des Schätzers $ \ hat {\ beta} = X ^ {T} Y $ und $ \ hat {\ beta} = (X ^ {T} X) ^ {- 1} X ^ {T} Y $
Was sind die Varianz und die Standardabweichung für einen sechsseitigen Standardwerkzeug?
Wann müssen Daten in der Regression normalisiert werden?
Normalverteilung oder nicht?
Methoden des maschinellen Lernens, die die Zeit bis zum Ereignis berücksichtigen?
Verteilung des Verhältnisses zweier Gamma-Zufallsvariablen
95% Konfidenzintervall für Anteile in R.
Hutmatrix und Hebel in der klassischen multiplen Regression
Ist es gültig, aus kategorialen Daten einen Mittelwert abzuleiten?
Wie wirken sich die Anzahl der Imputationen und die maximalen Iterationen auf die Genauigkeit bei Mehrfachimputationen aus?
Warum ist die empirische kumulative Verteilung von 1: 1000 eine gerade Linie?
Residuen in einem linearen Modell sind unabhängig, summieren sich aber zu Null; Ist das nicht ein Widerspruch?
Vollständige Trennung für logistische Regression verstehen
Wie ist die $ \ chi ^ 2_1 $ -Verteilung kein Gaußscher?
Umgang mit Prädiktoren, die in hohem Maße mit der Antwort korrelieren
Protokolltransformation und Korrelation
Was ist die Intuition für Modelle mit festen und zufälligen Effekten?
Ist die glm-Funktion von R in einer Big-Data- / maschinellen Lernumgebung nutzlos?
Definition des Probenraums
Wie kann man sich zwischen PCA und logistischer Regression entscheiden?
Unterschied zwischen bedingter Wahrscheinlichkeit und Bayes-Regel
Welche mathematische Beziehung besteht zwischen R2 und MSE?
Wahrscheinlichkeit, dass jeder der drei Weihnachtspuddings genau 2 Münzen hat
Berechnung der PCA-Varianz erklärt
Lineare Regression mit logarithmisch transformierten Daten - großer Fehler
PCA vor der zufälligen Waldregression liefert bessere Vorhersagewerte für meinen Datensatz als nur die zufällige Waldregression. Wie kann man das erklären?
Viele p-Werte sind nach Bonferroni-Korrektur gleich 1; Es ist normal?
Der Interquartilbereich überschreitet den Median
Gibbs-Sampler-Beispiele in R.
Kann ein Konfidenzintervall die Nullmarke überschreiten?
Was macht den mittleren quadratischen Fehler so gut?
T-Test-Paradoxon: Kann das Hinzufügen eines einzelnen Punkts, der sehr weit vom Nullwert entfernt ist, das Ergebnis von signifikant zu nicht signifikant ändern?
PCA findet, dass eine Variable zweimal die wichtigste ist
Skalieren Sie eine Zahl zwischen einem Bereich
Eine Frage zum Vorstellungsgespräch beim Münzwurf
Was ist zu schließen, wenn die meisten Ergebnisse statistisch signifikant sind, um die Nullhypothese nicht abzulehnen, aber nicht alle?
Kann ich Lasso verwenden, wenn es sich nicht um eine hochdimensionale Einstellung handelt?
Warum verwenden Leute $ \ mathcal {L} (\ theta | x) $ für die Wahrscheinlichkeit anstelle von $ P (x | \ theta) $?
Unterschied zwischen zufälligen Wäldern und Entscheidungsbaum
Geburtstagsproblem: Wie irre ich mich?
Warum verwenden wir separate oder gemeinsame Prioritäten?
Warum ist meine Regression unbedeutend, wenn ich Daten zusammenführe, die zwei signifikante Regressionen erzeugt haben?
Kann ein Datensatz geclustert werden oder müssen die Daten ein Muster enthalten?
Kosinusabstand als Ähnlichkeitsmaß in KMeans
Ein Ausfall verschlechtert die Leistung
Wie kann die Verschiebung zwischen zwei kumulativen Verteilungsfunktionen (CDFs) gemessen werden?
Wie erzeugt die Aktivierungsfunktion der Rectified Linear Unit (ReLU) eine nichtlineare Interaktion ihrer Eingänge?
Gibt es Parameter, bei denen ein voreingenommener Schätzer als "besser" als der unverzerrte Schätzer angesehen wird?
Warum unterscheidet sich der durchschnittliche Behandlungseffekt vom durchschnittlichen Behandlungseffekt bei den Behandelten?
Generieren einer multivariaten Gleichverteilung in R.
Wie ist ARIMA (0,1,0) zu interpretieren?
Was bedeutet es, wenn ich drei Standardabweichungen vom Mittelwert entfernt außerhalb des Minimal- oder Maximalwerts lande?
Mittelwert vs. getrimmter Mittelwert in der Normalverteilung
wenn 2 Zufallsvariablen genau den gleichen Mittelwert und die gleiche Varianz haben
Der Grund für die Überlegenheit von BFGS mit begrenztem Speicher gegenüber ADAM-Solver
Ableiten des KL-Divergenzverlusts für VAEs
Was bedeutet der Durchschnitt des word2vec-Vektors?
Wie lese ich die Ausgabe der wissenschaftlichen Notation (Zahlen, die "e" enthalten)?
theoretische Grundlage für die logistische Regression
Unterschied zwischen konvexen und konkaven Funktionen
Kostenfunktion wird nach einer bestimmten Anzahl von Iterationen zu Nan
Cross Entropy vs. Sparse Cross Entropy: Wann wird eine über die andere verwendet?
Was passiert, wenn ein Modell mehr Parameter als Trainingsmuster hat?
Die Steigung der unabhängigen Variablen ist größer, wenn ich die Stichprobe in Teilmengen teile
Warum verwenden wir das natürliche Exponential in der logistischen Regression?
Was bedeutet 1 mit einer Ungleichung im Index?
Was wird beim Lernen der Verstärkung vorhergesagt und kontrolliert?
Etymologie des "Adam" -Algorithmus für den Gradientenabstieg
Posteriore Verteilung und MCMC
Verlustfunktion Autoencoder gegen Variations-Autoencoder oder MSE-Verlust gegen binären Kreuzentropie-Verlust
Zeichnen von Binärdaten (Anwesenheit / Abwesenheit - 1/0) gegen kontinuierliche Variablen
Wie ist ein glatter l1-Verlust zu interpretieren?
Welche Auswirkungen hat die Skalierung der Funktionen auf xgboost?
Nicht parametrische Alternative zum einfachen T-Test
Was ist, wenn sowohl Nullhypothesen als auch alternative Hypothesen falsch sind?
Wie lautet die Formel zur Berechnung der Fläche unter der ROC-Kurve aus einer Kontingenztabelle?
Unabhängigkeit von $ X + Y $ und $ X-Y $
Was ist der Unterschied zwischen Kernel-, Bias- und Aktivitätsregulatoren und wann welche zu verwenden sind?
Warum logarithmische Transformation zur Normalverteilung für Entscheidungsbäume?
Völlig unterschiedliche Ergebnisse von lme () und lmer ()
Können zwei verschiedene Verteilungen den gleichen Wert für Mittelwert, Varianz, Schiefe und Kurtosis haben?
Bedingte Verteilung von $ \ exp (- | x | - | y | -a \ cdot | x-y |) $
Warum konvergiert dieses einfache gemischte Modell nicht?
Kann $ \ sin (x) $ als Aktivierung beim tiefen Lernen verwendet werden?
Wenn ich Priors machen kann, warum kann ich dann keine Posteriors machen?
Kann eine K-fache Kreuzvalidierung zu einer Überanpassung führen?
Wie generiere ich eine Verteilung positiver Zahlen nur mit min, max und mean?
Erwarteter Wert bis zum Erfolg?
Testen Sie, wann GLM über lineare Regression verwendet werden soll?
Wie finde ich alle geraden Momente (und ungeraden Momente) für $ f_X (x) = \ frac {1} {2} e ^ {- | x |} $?
Kann jemand die Intuition hinter Mean Absolute Error und dem Median geben?
Neuronales Netz gegen Regression in einer kleinen Stichprobe
Warum ändert sich der Achsenabschnitt in einer logistischen Regression, wenn alle Prädiktoren standardisiert sind?
Sollte ich bei statistischen Tests dem $ p $ -Wert vertrauen?
Gibt es einen Namen für das Phänomen der falsch positiven Ergebnisse, das die echten positiven Ergebnisse intuitiv übertrifft?
Warum verwenden wir den griechischen Buchstaben μ (Mu), um den Mittelwert der Bevölkerung oder den erwarteten Wert in Wahrscheinlichkeit und Statistik zu bezeichnen?
Warum sind Poisson-Regressionskoeffizienten verzerrt?
Warum sorgen wir uns um Überanpassung, auch wenn "alle Modelle falsch sind"?
Berühmte statistische Siege und Horrorgeschichten für Unterrichtszwecke
Wie teste ich, ob die Regressionssteigungen statistisch unterschiedlich sind?
Gegenintuitiver Bayes'scher Satz
Erwartung von $ \ ln (1 + e ^ x) $, wobei $ x $ normal verteilt ist
Interpretation von Residuen vs. angepassten Plots
Interviewfrage: Wenn Korrelation keine Kausalität impliziert, wie erkennen Sie die Kausalität?
So berechnen Sie die Anzahl der Sätze in Sigma Algebra
Wie kann man die Chance ausgleichen, die höchsten Würfel zu werfen? (Rätsel)
Wer ist Gail Gasram?
Wie kann ich eine Cauchy-Verteilung aus zwei Standardnormalverteilungen erhalten?
Zeigt dieser Code den zentralen Grenzwertsatz?
Wie teste ich, ob eine Korrelation gleich 1 ist?
Sind optimale Hyperparameter für eine tiefere neuronale Netzarchitektur noch optimal?
Ist bekannt, dass eine einmalige Kreuzvalidierung (LOOCV) Fehler systematisch überschätzt?
Erwartung von 500 Münzwürfen nach 500 Realisierungen
Verwirrt über den autoregressiven AR (1) -Prozess
Was ist das PDF für den minimalen Unterschied zwischen einer Zufallszahl und einer Reihe von Zufallszahlen?
Was ist der Vorteil von Wichtigkeitsstichproben?
Empfohlene Terminologie "statistisch signifikant"
Welche Regression / Schätzung ist keine MLE?
Mit welcher Metrik kann ich den Abstand zwischen Etiketten berechnen?
Warum nicht bei der Regression standardmäßig die Regularisierung verwenden?
Wie kann man zufällige ganze Zahlen zwischen 1 und 4 erzeugen, die einen bestimmten Mittelwert haben?
Eine maßtheoretische Formulierung des Bayes'schen Theorems
Variablenauswahl im logistischen Regressionsmodell
Dichotomisierung kontinuierlicher Variablen an ihrem optimalen Grenzwert für die klinische Interpretation
Kombination von PCA, Feature-Skalierung und Kreuzvalidierung ohne Verlust von Trainingstestdaten
Simpsons Paradoxon gegen Berksons Paradoxon
Realistisch macht das i.i.d. Annahme für die überwiegende Mehrheit der überwachten Lernaufgaben?
Wie tragen DAGs dazu bei, die Verzerrung der kausalen Inferenz zu verringern?
Was bedeutet es für einen statistischen Test, eine Potenz von 0,8 zu haben?
Die Anpassung des SIR-Modells an 2019-nCoV-Daten konvergiert nicht
Durchschnittliche Zeit Ameise muss in den Wald raus
Warum ziehen die Zahlen auf einem Ball in einem Lotto kategorisch nominal statt kategorisch ordinal?
Wird PCA immer empfohlen?
Bietet maschinelles Lernen Alternativen zur linearen Regression (d. H. OLS) zur Vorhersage kontinuierlicher Variablen?
Gibt es einen Klassifizierungsalgorithmus, der keine Wahrscheinlichkeit angibt?
Warum kümmern wir uns nicht mehr so sehr um die Vollständigkeit und die Genügsamkeit eines Schätzers?
Was bedeutet es, wenn PCA keine Verringerung der Dimensionalität bewirkt?
Produziert rnorm Nummern mit Ersatz / ohne Ersatz?
Visuell interessante Statistikkonzepte, die leicht zu erklären sind
Was sind die mathematisch strengen Datenerweiterungstechniken?
Fehler in der häufig auftretenden Folgerung
Ist die COVID-19-Pandemiekurve eine Gaußsche Kurve?
Wenn bei linearer Regression die Parameter nicht korreliert sind, verbessert dies das Modell? Wenn ja, warum?
Warum erkennt die Funktion `cooks.distance ()` keinen offensichtlichen Ausreißer?
Welcher Verteilung folgt der Mittelwert einer Zufallsstichprobe aus einer Gleichverteilung?
Was passiert in den Teilbereichen der KI? (ML, DL)
Wahrscheinlichkeit, einen Wettbewerb zu gewinnen K-Spiele Best of Series of N Games
Warum ist der komponentenweise Median in höheren Dimensionen nicht sinnvoll?
Wie berechne ich die Varianz einer rekursiven Zufallsvariablen analytisch?
Wahrscheinlichkeit, dass weniger als 24 Personen, die sich auf der Website anmelden, einen Kauf tätigen
Warum ist das Jackknife weniger rechenintensiv als der Bootstrap?
Kann ein Störfaktor einen möglichen Kausalzusammenhang verbergen? (im Gegensatz zu einem falschen zu finden)
Statistische Tests bei einer Stichprobengröße von 1
Ist der Mittelwert der Stichproben noch eine gültige Stichprobe?
Verlustfunktion beim maschinellen Lernen - wie kann man einschränken?
Kontinuierliche Zufallsvariablen - Wahrscheinlichkeit, dass ein Kind pünktlich zur Schule kommt
Warum ist kausale Folgerung kein einfaches spezialisiertes Regressionsproblem?
Welche Art von Verteilung hat dies?
R: Problem mit runif: Generierte Anzahl wiederholt sich (häufiger als erwartet) nach weniger als 100 000 Schritten
Produkt von 2 Einheitlichen Zufallsvariablen ist größer als eine Konstante mit Faltung
Ein Diagramm der täglichen Fälle von COVID-19 in einer russischen Region erscheint mir verdächtig - ist dies aus statistischer Sicht so?
Sei X, Y 2 r.v. Gibt es bei unendlichen Erwartungen Möglichkeiten, bei denen min (X, Y) endliche Erwartungen haben?
Kann jemand die Bedeutung der mittleren Stationarität in Zeitreihen erklären?
Warum ist die Verwendung des quadratischen Fehlers der Standard, wenn der absolute Fehler für die meisten Probleme relevanter ist?
Ermitteln Sie, ob eine Probe tatsächlich zwei Populationen enthält
Intuitive Erklärung des Kolmogorov-Smirnov-Tests
Wie hoch ist die Wahrscheinlichkeit, dass 4 Personen in einer Gruppe von 18 Personen denselben Geburtsmonat haben können?
Warum kann scikit-learn SVM nicht zwei konzentrische Kreise lösen?
Permutationstests und Austauschbarkeit
Es wird erwartet, dass die Würfel jede Zahl auf einem Würfel ungerade oft würfeln
Falsche CLT-Anweisung entlarven
Warum funktionieren neuronale Netze reibungslos?
(Warum) Ist absoluter Verlust keine richtige Bewertungsregel?
Gibt es eine umgangssprachliche Art, "klein aber bedeutsam" zu sagen?
Ist es im Allgemeinen hilfreich, dem Trainingsdatensatz "externe" Datensätze hinzuzufügen?
Wie entwerfe ich absichtlich ein überpassendes neuronales Netzwerk?
Wie kann das Quadrat einer asymptotisch normalen Variablen auch asympotisch normal sein?
Bücher ähnlich der Einführung in das statistische Lernen
Was sind die schlechtesten (allgemein angenommenen) Ideen / Prinzipien in der Statistik?
Sollte "Stadt" eine feste oder eine zufällige Effektvariable sein?
Ist es gültig, das Modell zu ändern, nachdem die Ergebnisse der Testdaten angezeigt wurden?
Ich kenne das 95% -Konfidenzintervall für ln (x). Kenne ich auch das 95% -Konfidenzintervall von x?
Warum ist es in Ordnung, Demografie als zufällige Effekte in Bayes'schen Mehrebenenmodellen zu modellieren?
Was ist ein strenger mathematischer Weg, um bei einem Konfidenzniveau das kürzeste Konfidenzintervall zu erhalten?
Sind alle Algorithmen für maschinelles Lernen in Klassifikation und Regression unterteilt, nicht nur überwachtes Lernen?
Lineare Regression mit "Stunde des Tages"
Benötigen wir Hypothesentests, wenn wir die gesamte Bevölkerung haben?
Beispiele für die Lösung von Simpsons Paradoxon durch Auswahl der aggregierten Daten
Ist es schlecht, Fehlerbalken mit einer Standardabweichung zu erstellen, die sich bis zur negativen Skala erstreckt, während die Variable selbst nicht negativ sein sollte?
R-Quadrat ist gleich 81% bedeutet was?
Wie hoch sind die Chancen, 6, 6-seitige Würfel zu würfeln, dass es eine 6 gibt?
Wenn Lehrer 30% der Varianz der Schülerleistungen ausmachen, kann ein Lehrer die Leistung um 30% steigern, indem er besser unterrichtet?
Hat eine Verteilung mit schweren Schwänzen im Vergleich zu einer Standard-Gaußschen Zufallsvariablen eine höhere Kurtosis?
Propensity Score Matching - Was ist das Problem?
Warum ist die Normalisierungskonstante in Bayesian keine marginale Verteilung?
Warum modellieren wir Rauschen in linearer Regression, aber nicht in logistischer Regression?
Zufällige Punkte gleichmäßig auf einer Festplatte generieren
Warum können Sie die Wahrscheinlichkeit eines bestimmten Wertes für die Normalverteilung nicht finden?
Inverse Transformationsabtastung - CDF ist nicht invertierbar
Bei zwei Stichproben mit demselben Mittelwert, derselben Standardabweichung und demselben N: Sind die Werte in jeder Stichprobe identisch?
Sind 95% in irgendeiner Weise spezifisch für das Konfidenzintervall?
Bestimmen Sie, wie gut eine AUC ist (Fläche unter der Kurve des ROC)
Warum sind Protokollwahrscheinlichkeiten nützlich?
Warum wird die Maßtheorie benötigt, um insbesondere kontinuierliche Zufallsvariablen und Wahrscheinlichkeitsdichtefunktionen zu verstehen?
Konditionieren einer Variablen auf sich selbst und eine andere Variable
Wenn wir Daten zeichnen und dann nichtlineare Transformationen in einem Regressionsmodell verwenden, schnüffeln wir dann Daten?
Ist das eine Ursache?
Wahrscheinlichkeit, dass die Anzahl der Köpfe die Summe der Würfelwürfe überschreitet
Warum hat die Summe der Poisson-verteilten Zufallsvariablen eine Poisson-Verteilung, der Durchschnitt der Variablen jedoch nicht?
Was sind die Unterschiede zwischen "Marginal Probability Distribution" und "Conditional Probability Distribution"?
Welche Verteilung hat ihr Maximum gleichmäßig verteilt?