자주 나오는 면접 질문 통계에서 사용되는 부트스트랩(Bootstrap)의 의미는? 신뢰구간의 정의는? 신뢰구간이 95%인 경우, p-value가 0.03이 나오면 어떻게 해석할 것인가? 1. 부트스트랩 표본통계량이나 모델 파라미터의 표본분포를 추정하는 쉽고 효과적인 방법은, 표본에서 추가적으로 표본을 복원추출하고, 각 표본에 대한 통계량과 모델을 다시 계산하는 것이다. 이러한 절차를 부트스트랩이라고 한다. 개념적으로 부트스트랩은 원래 표본을 수천, 수백만번 복제하는 것이라고 생각할 수 있다. 그렇다고 표본을 실제로 엄청난 횟수로 반복 복제하는 것은 아니다. 대신 각각의 표본을 뽑은 후 각 관측치를 다시 원래 자리에 돌려놓는다. 즉, 복원추출 한다. 이런식으로 뽑을때마다 각 원소가 뽑힐 확률은 그대로 유지..