다변량 예제

다변량 데이터와 관련된 특정 유형의 문제(예: 단순 선형 회귀 및 다중 회귀)는 일반적으로 분석이 (단변량)을 고려하여 처리되기 때문에 다변량 통계의 특별한 경우로 간주되지 않습니다. 다른 변수를 고려하여 단일 결과 변수의 조건부 분포를 지정합니다. 기본 데이터 집합의 크기와 복잡성으로 인해 다변량 분석에는 많은 계산 노력이 필요합니다. 전산 능력의 지속적인 극적인 성장과 함께, 다변량 방법론은 데이터 분석에서 점점 더 중요한 역할을하고, 다변량 기술은, 한 번만 이론의 영역에서, 이제 응용 프로그램에서 가치를 찾고 있다. 다변량 분석을 수행하는 방법에는 20가지 이상의 다양한 방법이 있습니다. 어떤 데이터를 선택하느냐에 따라 데이터 유형과 목표에 따라 달라집니다. 예를 들어, 단일 데이터 집합이 있는 경우 몇 가지 선택 사항이 있습니다: 위의 예에서, 우리는 섹스가 BMI와 WC 사이의 관계에 수반한다는 것을 보았습니다. 다변량 분석에서 우리는 “관계에 영향을 미치고/ 또는 관계를 일으키는 데 여러 요인이 어떻게 상호 작용합니까?” 동일한 예제를 사용하여 여러 선형 회귀 분석 방법을 적용하여 BMI가 성별효과를 제어한 후 WC의 변화를 예측하는 방법을 조사합니다. 전체 회귀 수식은 다음과 같습니다.

1. 일변량 데이터 – 이 유형의 데이터는 하나의 변수로만 구성됩니다. 따라서 정보가 변경되는 수량 하나만 다루기 때문에 단변선 데이터의 분석은 가장 간단한 분석 형태입니다. 원인이나 관계를 다루지 않으며 분석의 주요 목적은 데이터를 설명하고 그 안에 존재하는 패턴을 찾는 것입니다. 일변량 데이터의 예는 높이일 수 있습니다. 다변량 통계는 다변량 분석의 각 다른 형태의 다른 목표와 배경을 이해하고 서로 어떻게 관련되는지에 관한 것입니다. 특정 문제에 다변량 통계를 실질적으로 적용하려면 변수 간의 관계와 연구 중인 문제와의 관련성을 이해하기 위해 여러 유형의 단변량 및 다변량 분석이 포함될 수 있습니다. 역-위시아트 분포는 베이지안 추론에서 중요합니다(예: 베이지안 다변량 선형 회귀). 또한 Hotelling의 T 제곱 분포는 다변량 분포로 학생의 t 분포를 일반화하여 다변량 가설 테스트에 사용됩니다.