Maximum likelihood estimation for mixed continuous and categorical data with missing values

doi:10.1093/BIOMET/72.3.497

Journal ArticleDOI

Maximum likelihood estimation for mixed continuous and categorical data with missing values

Roderick J. A. Little, +1 more

- 01 Dec 1985 -

Biometrika

- Vol. 72, Iss: 3, pp 497-512

Chats0

TLDR

In this paper, the general location model of Olkin & Tate (1961) and extensions introduced by Krzanowski (1980, 1982) form the basis for the maximum likelihood procedures for analyzing mixed continuous and categorical data with missing values.

Abstract:

SUMMARY Maximum likelihood procedures for analysing mixed continuous and categorical data with missing values are presented. The general location model of Olkin & Tate (1961) and extensions introduced by Krzanowski (1980, 1982) form the basis for our methods. Maximum likelihood estimation with incomplete data is achieved by an application of the EM algorithm (Dempster, Laird & Rubin, 1977). Special cases of the algorithm include Orchard & Woodbury's (1972) algorithm for incomplete normal samples, Fuchs's (1982) algorithms for log linear modelling of partially classified contingency tables, and Day's (1969) algorithm for multivariate normal mixtures. Applications include: (a) imputation of missing values, (b) logistic regression and discriminant analysis with missing predictors and unclassified observations, (c) linear regression with missing continuous and categorical predictors, and (d) parametric cluster analysis with incomplete data. Methods are illustrated using data from the St Louis Risk Research Project. Some key word8: Cluster analysis; Discriminant analysis; EM algorithm; Incomplete data; Linear regression; Logistic regression; Log linear model; Mixture model.

Maximum likelihood estimation for mixed continuous and categorical data with missing values

Citations

MissForest—non-parametric missing value imputation for mixed-type data

A multivariate technique for multiply imputing missing values using a sequence of regression models

Modeling the Drop-Out Mechanism in Repeated-Measures Studies

Regression with missing X’s: A review

Regression with Missing X's: A Review

References

Maximum likelihood from incomplete data via the EM algorithm

An Introduction to Multivariate Statistical Analysis

Inference and missing data

Introduction to Multivariate Statistical Analysis.

Discrete multivariate analysis: theory and practice

Related Papers (5)

Statistical Analysis with Missing Data

Inference and missing data

Multiple imputation for nonresponse in surveys

Maximum likelihood from incomplete data via the EM algorithm

Analysis of Incomplete Multivariate Data