NormLike <- function(mu, sigma, data)
  {
    out = prod(dnorm(x = data, mean = mu, sd = sigma))
    return(out)
  }

logNormLike <- function(mu, sigma, data)
  {
    out = sum(dnorm(
        x = data, mean = mu, sd = sigma,
        log = TRUE))
    return(out)
  }

set.seed(123)
data = rnorm(1000, mean=2, sd=1)
NormLike(mu = 1, sigma = 1, data=data) 
logNormLike(mu = 1, sigma = 1, data=data)


hist(c(294,262,196,79,191,677))


x <- c(294, 262, 196, 79, 191, 677)
mu = 260:300
sigma = 180:220

parMat <- expand.grid(mu, sigma)
muALL <- parMat[, 1]
sigmaALL <- parMat[, 2]

myLogLike <- matrix(NA, 1, length(sigma))
for(i in 1:length(sigmaALL))
{
  myLogLike[i] <- logNormLike(mu = muALL[i], sigma = sigmaALL[i], data = x)
}

persp(as.vector(mu), as.vector(sigma), 
      matrix(myLogLike, length(mu),), 
      theta = 90, phi = 30, expand = 0.5, 
      col = "lightblue", xlab = "mu", 
      ylab = "sigma", zlab = "log likelihood", 
      ticktype = "detailed")

filled.contour(as.vector(mu), as.vector(sigma), 
               matrix(myLogLike, length(mu),), 
               xlab = "mu", ylab = "sigma")


beta0 <- 1
beta1 <- 3
sigma <- 0.5

n <- 1000
x <- rnorm(n, 3, 1)

y <- beta0 +x*beta1 + rnorm(n, mean = 0, sd = sigma)
plot(x, y, col = "blue", pch = 20)


logNormLikelihood <- function(par, y, x)
    {
        beta0 <- par[1]
        beta1 <- par[2]
        sigma <- par[3]
        mean <- beta0 + x*beta1
        logDens <- dnorm(x = y, mean = mean, sd = sigma, log = TRUE)
        loglikelihood <- sum(logDens)
        return(loglikelihood)
    }

optimOut <- optim(c(0.2, 0.3, 0.5), logNormLikelihood,
                  control = list(fnscale = -1),
                  x = x, y = y)

beta0Hat <- optimOut$par[1]
beta1Hat <- optimOut$par[2]
sigmaHat <- optimOut$par[3]
yHat <- beta0Hat + beta1Hat*x

Warning message in dnorm(x = y, mean = mean, sd = sigma, log = TRUE):
“NaNs produced”
Warning message in dnorm(x = y, mean = mean, sd = sigma, log = TRUE):
“NaNs produced”
Warning message in dnorm(x = y, mean = mean, sd = sigma, log = TRUE):
“NaNs produced”


myLM <- lm(y~x)
myLMCoef <- myLM$coefficients
yHatOLS <- myLMCoef[1] + myLMCoef[2]*x

plot(x, y, pch = 20, col = "blue")
points(sort(x), yHat[order(x)], type = "l", col = "red", lwd = 5)
points(sort(x), yHatOLS[order(x)], type = "l", lty = "dashed",
       col = "yellow", lwd = 2, pch = 20)


loss <- function(par, y, x)
    {
        beta0 <- par[1]
        beta1 <- par[2]
        yHat <- beta0 + x*beta1
        out <- mean((y- yHat)^2)
        return(out)
    }

optimLossOut <- optim(c(0.2, 0.3), loss, x = x, y = y)

beta0Hat <- optimLossOut$par[1]
beta1Hat <- optimLossOut$par[2]
yHatLoss <- beta0Hat + beta1Hat*x


myLM <- lm(y~x)
myLMCoef <- myLM$coefficients
yHatOLS <- myLMCoef[1] + myLMCoef[2]*x

plot(x, y, pch = 20, col = "blue")
points(sort(x), yHatLoss[order(x)], type = "l", col = "red", lwd = 5)
points(sort(x), yHatOLS[order(x)], type = "l", lty = "dashed",
       col = "yellow", lwd = 2, pch = 20)

Likelihood Function and Loss Function¶

Likelihood Function¶

Walking APP example: How long do you walk every day?¶

The likelihood function¶

Conditional likelihood function¶

Likelihood function for linear regression¶

Loss function¶

Mean squared error loss¶

Discussion¶