๋ฐ์ดํฐ ๊ณผํ์ ์ํ ํต๊ณ
Chapter 3. ํต๊ณ์ ์คํ๊ณผ ์ ์์ฑ ๊ฒ์ ์ ์ฝ๊ณ ์ ๋ฆฌํ ๋ด์ฉ์ ๋๋ค.
์์ : Practical Statistics for Data Scientists
์ค๋๋ฃจ ๋ธ๋ฃจ์ค, ํผํฐ ๊ฒ๋ฐํฌ ์ /ํ๋น๋ฏธ๋์ด
โถ ๋ชฉ์ฐจ ๐
๋๋ณด๊ธฐ
3.1 A/B ๊ฒ์
3.2 ๊ฐ์ค๊ฒ์
3.3 ์ฌํ๋ณธ์ถ์ถ
3.4 ํต๊ณ์ ์ ์์ฑ๊ณผ p ๊ฐ
3.5 t ๊ฒ์
3.6 ๋ค์ค๊ฒ์
3.7 ์์ ๋
3.8 ๋ถ์ฐ๋ถ์
3.9 ์นด์ด์ ๊ณฑ๊ฒ์
3.10 ๋ฉํฐ์๋ ๋ฐด๋ง ์๊ณ ๋ฆฌ์ฆ
3.11 ๊ฒ์ ๋ ฅ๊ณผ ํ๋ณธํฌ๊ธฐ
3.12 ๋ง์น๋ฉฐ
3.1 A/B ๊ฒ์
- A/B ๊ฒ์ ์ ์คํ๊ตฐ์ ๋ ๊ทธ๋ฃน์ผ๋ก ๋๋์ด ์ด๋ ์ชฝ์ด ๋ค๋ฅธ ์ชฝ๋ณด๋ค ๋ ์ฐ์ํ์ง ์ ์ฆ ํ๋ ์คํ
- ๋๊ฐ์ง ์ฒ๋ฆฌ๋ฒ ์ค ํ๋๋ ๊ธฐ์ค์ด ๋๋ ๊ธฐ์กด ๋ฐฉ๋ฒ์ด๋ ์๋ฌด๋ฐ ์ฒ๋ฆฌ๋ ํ์ง ์๋๋ค. ์ด๋ฅผ ๋์กฐ๊ตฐ์ด๋ผ ํจ
- ์ฃผ๋ก ์น๋์์ธ์ด๋ ๋ง์ผํ ์ ์ฌ์ฉ
- ์ด ์คํ์ ํต์ฌ์ ํผํ์๊ฐ ์ด๋ค ํน์ ์ฒ๋ฆฌ์ ๋ ธ์ถ๋๋ ๊ฒ
- ์ธก์ ์งํ๊ฐ ์ฐ์ํ๋ณ์, ํ์๋ฅผ ๋ํ๋ด๋ ๋ณ์์ ๋ฐ๋ผ ๊ฒฐ๊ณผ๊ฐ ๋ค๋ฅด๊ฒ ํ์๋ ์ ์์.
3.1.1 ๋์กฐ๊ตฐ์ ์ ํ์ํ ๊น?
- ๋์กฐ๊ตฐ์ด ์๋ค๋ฉด ๋ค๋ฅธ ๊ฒ๋ค์ ๋์ผํ๋ค๋ ๋ณด์ฅ์ด ์๋ค. / ์ด๋ค ์ฐจ์ด๊ฐ ์ด๋ค ์ฒ๋ฆฌ ๋๋ฌธ์ธ์ง ํ์ ํ ์ ์๋ค.
- ๋์์ ์ผ๋ฐ์ ์ผ๋ก ์น ๋ฐฉ๋ฌธ์์ด๋ฉฐ, ์ธก์ ํ๊ณ ์ ํ๋ ๊ฒฐ๊ณผ๋ ํด๋ฆญ ์, ๊ตฌ๋งค ์, ๋ฐฉ๋ฌธ ๊ธฐ๊ฐ, ๋ฐฉ๋ฌธํ ํ์ด์ง ์, ํน์ ํ์ด์ง ๋ฐฉ๋ฌธ์ฌ๋ถ ๋ฑ
- A/B ๊ฒ์ ์คํ์์๋ ๋ฏธ๋ฆฌ ํ๋์ ์ธก์ ์งํ๋ฅผ ๊ฒฐ์ ํด์ผ ํจ.
3.2 ๊ฐ์ค ๊ฒ์
- ๊ฐ์ค ๊ฒ์ , ์ ์์ฑ ๊ฒ์ ์ ์ ํต์ ์ธ ํต๊ณ๋ถ์ ๋ฐฉ๋ฒ.
- ๋ชฉ์ : ๊ด์ฐฐ๋ ํจ๊ณผ๊ฐ ์ฐ์ฐ์ ์ํ ๊ฒ์ธ์ง ์ฌ๋ถ๋ฅผ ์์๋.
- ํต๊ณ์ ๊ฐ์ค ๊ฒ์ ์ ์ฐ๊ตฌ์๊ฐ ๋๋คํ๊ฒ ์ฐ์ฐํ ์ผ์ด๋ ์ผ์ ์์ง ์๋๋ก ๋ณดํธํ๊ธฐ ์ํ ๋ฐฉ๋ฒ
3.2.1 ๊ท๋ฌด๊ฐ์ค
- ์ฐ์ฐ ๋๋ฌธ์ด๋ผ๋ ๊ฐ์ค. ์ค์ ๋ก ์ฐ์ฐํ ์ผ์ด๋ ์ผ์ด์ง๋ง ํํ์ง ์๋ค.
- ๊ทธ๋ฃน๊ฐ์ ์ฐจ์ด๋ ์ฐ์ฐ์ ์ํ ๊ฒฐ๊ณผ ์ด๋ค. ์ฆ, ์๋๋ ์ฐจ์ด๊ฐ ์๋ค.
- ๊ท๋ฌด๊ฐ์ค์ด ํ๋ ธ๋ค๋ ๊ฒ์ ์ฆ๋ช ํจ.
3.2.2 ๋๋ฆฝ๊ฐ์ค
- ๊ท๋ฌด๊ฐ์ค๊ณผ์ ๋์กฐ (์ฆ๋ช ํ๊ณ ์ ํ๋ ๊ฐ์ค)
- ๊ท๋ฌด ๊ฐ์ค๊ณผ ๋๋ฆฝ๊ฐ์ค์ ๋ชจ๋ ๊ฐ์ค์ ๋ํด ์ค๋ช
- ๊ท๋ฌด๊ฐ์ค : A ≤ B / ๋๋ฆฝ๊ฐ์ค : A > B
3.2.3 ์ผ์/์ด์ ๊ฐ์ค ๊ฒ์
- ์ผ์๊ฒ์ (one-way test) : ํ ๋ฐฉํฅ์ผ๋ก๋ง ์ฐ์ฐํ ์ผ์ด๋ ํ๋ฅ ์ ๊ณ์ฐํ๋ ๊ฐ์ค๊ฒ์
- ์ฐ์ฐ์ ์ํ ๊ทน๋จ์ ์ธ ๊ฒฐ๊ณผ์ ๋ํด ํ ๋ฐฉํฅ๋ง์ ๊ณ ๋ คํ์ฌ p๊ฐ ๊ณ์ฐ
- B๋ A๋ณด๋ค ๋ซ๋ค.
- ์ด์๊ฒ์ (two-way test) : ์๋ฐฉํฅ์ผ๋ก ์ฐ์ฐํ ์ผ์ด๋ ํ๋ฅ ์ ๊ณ์ฐํ๋ ๊ฐ์ค๊ฒ์
- A๋ B์ ๋ค๋ฅด๋ฉฐ ๋ ํฌ๊ฑฐ๋ ์์ ์ ์์.
3.3 ์ฌํ๋ณธ์ถ์ถ
- ์ฌํ๋ณธ ์ถ์ถ
- ๋ชฉํ : ๋๋คํ ๋ณ๋์ฑ์ ์์๋ณด์
- ์๋ฏธ
- ๊ด์ฐฐ๋ ๋ฐ์ดํฐ์ ๊ฐ์์ ํ๋ณธ์ ๋ฐ๋ณต์ ์ผ๋ก ์ถ์ถํ๋ ๊ฒ
- ๋ํ, ์ผ๋ถ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ ํ์ฑ์ ํ๊ฐํ๊ณ ํฅ์์ํค๋๋ฐ์๋ ์ ์ฉ
- ๋ถํธ์คํธ๋จ ๋ฐ์ดํฐ ์งํฉ์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ ๊ฐ๊ฐ์ ์์ฌ ๊ฒฐ์ ํธ๋ฆฌ ๋ชจ๋ธ๋ก ๋ถํฐ ๋์จ ์์ธก๋ค๋ก ๋ถํฐ ๋ฐฐ๊น ์ด๋ผ๋ ์ ์ฐจ๋ฅผ ํตํด ํ๊ท ์์ธก๊ฐ์ ๊ตฌํ ์ ์๋ค.
- ์ ํ
- ๋ถํธ์คํธ๋ฉ : ์ถ์ ์ ์ ๋ขฐ์ฑ ํ๊ฐ
- ์์ด ๊ฒ์ : ๋๊ฐ ์ด์์ ๊ทธ๋ฃน๊ณผ ๊ด๋ จ๋ ๊ฐ์ค์ ๊ฒ์ฆ
3.3.1 ์์ด ๊ฒ์
- ๋ ๊ฐ ์ด์์ ํ๋ณธ์ ํจ๊ป ๊ฒฐํฉํ์ฌ ๊ด์ธก๊ฐ๋ค์ ๋ฌด์์๋ก ์ฌํ๋ณธ์ผ๋ก ์ถ์ถํ๋ ๊ณผ์ .
- ํต์์ ์ผ๋ก A/B ๋๋ ๊ธฐํ ๊ฐ์ค๊ฒ์ ์ ์ํด ์ฌ์ฉ๋๋ ๊ทธ๋ฃน๋ค
- ์์ด ๊ฒ์ ์ ์ ์ฐจ
- ์ฌ๋ฌ ๊ทธ๋ฃน์ ๊ฒฐ๊ณผ๋ฅผ ๋จ์ผ ๋ฐ์ดํฐ ์งํฉ์ผ๋ก ๊ฒฐํฉ
- ๊ฒฐํฉ๋ ๋ฐ์ดํฐ๋ฅผ ์ ์์ ํ, ๊ทธ๋ฃน A์ ๋์ผํ ํฌ๊ธฐ์ ํ๋ณธ์ ๋ฌด์์๋ก (๋น๋ณต์) ์ถ์ถํจ.
- ๋๋จธ์ง ๋ฐ์ดํฐ์์ ๊ทธ๋ฃน B์ ๋์ผํ ํฌ๊ธฐ์ ์ํ์ ๋ฌด์์๋ก (๋น๋ณต์) ์ถ์ถ
- C,D ๋ฑ์ ๊ทธ๋ฃน ๋ฑ์์๋ ๋์ผํ ์์ ์ํ
- ์๋ ์ํ์ ํต๊ณ๋(๋๋ ์ถ์ ์น)๊ณผ ์ง๊ธ ์ถ์ถํ ์ฌํ๋ณธ์ ๋ํ ๋ค์ ๊ณ์ฐํ๊ณ ๊ธฐ๋ก.
- 1~5๋จ๊ณ R ๋ฒ ๋ฐ๋ณตํ์ฌ ๊ฒ์ ํต๊ณ๋์ ์์ด ๋ถํฌ๋ฅผ ์ป์
- ๊ทธ๋ฃน๊ฐ์ ์ฐจ์ด์ ์ ๊ด์ฐฐ
- ๊ด์ฐฐ๋ ์ฐจ์ด๊ฐ ์์ด๋ก ๋ณด์ด๋ ์ฐจ์ด์ ์งํฉ์ ๋ค์ด๊ฐ ์๋ค๋ฉด ์ฐ์ฐํ ์ผ์ด๋ ์ ์๋ ๋ฒ์ ์์ ์๋ ๊ฒ
- → ์ด๋ ํ ๊ฒ๋ ์ฆ๋ช ํ ์ ์์
- ๊ด์ฐฐ๋ ์ฐจ์ด๊ฐ ์์ด ๋ฐ์ ์๋ค๋ฉด, ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ๋ค.(์ฐ์ฐํ ์ผ์ด๋ ์ ์๋ค.)
3.3.3 ์ ์ฒด ๋ฐ ๋ถํธ์คํธ๋ฉ ์์ด ๊ฒ์
- ์ ์ฒด ์์ด๊ฒ์
- ๋ฐ์ดํฐ๋ฅผ ๋ฌด์์๋ก ์๊ณ ๋๋๋ ๋์ ์ค์ ๋ก ๋๋ ์ ์๋ ๋ชจ๋ ๊ฐ๋ฅํ ์กฐํฉ์ ์ฐพ๋๋ค.
- ๋ฐ์ดํฐ ์๊ฐ ์ ์ ๋ ์ ๋ฆฌํจ
- ๋ถํธ์คํธ๋ฉ ์์ด๊ฒ์
- ์์ด ๊ฒ์ ์ ๋น๋ณต์ ์ถ์ถ ๊ณผ์ ์ ๋ณต์ ์ถ์ถ๋ก ์งํ
- ๋ฆฌ์ํ๋ง ๊ณผ์ ์์ ๋ชจ์ง๋จ์์ ๊ฐ์ฒด๋ฅผ ์ ํํ ๋ ์์์ฑ์ ๋ณด์ฅํ๋ค.
3.4 ํต๊ณ์ ์ ์์ฑ๊ณผ p ๊ฐ
- ํต๊ณ์ ์ ์์ฑ์ด๋ ๊ฒฐ๊ณผ๊ฐ ์ฐ์ฐํ ์ผ์ด๋ ๊ฒ์ธ์ง, ์ฐ์ฐํ ์ผ์ด๋ ์ ์๋ ๊ทน๋จ์ ์ธ ๊ฒ์ธ์ง๋ฅผ ํ๋จํ๋ ๋ฐฉ๋ฒ.
- ์ฐ์ฐ์ ๋ณ๋์ฑ ๋ฐ๊นฅ์ ์กด์ฌํ๋ฉด ํต๊ณ์ ์ผ๋ก ์ ์ํ๋ค
3.4.1 P ๊ฐ
- P ๊ฐ : ํต๊ณ์ ์ ์์ฑ์ ์ ํํ ์ธก์ ํ๊ธฐ ์ํ ์งํ.
- ํ๋ฅ ๋ชจํ์ด ๊ด์ธก๋ ๊ฒฐ๊ณผ๋ณด๋ค ๋ ๊ทน๋จ์ ์ธ ๊ฐ์ ์์ฑํ ๋น๋
- ๊ด์ฐฐ๋ ์ฐจ์ด์ ๊ฐ๊ฑฐ๋ค ๋ ํฐ ์ฐจ์ด๋ฅผ ๋ณด์ด๋ ๊ฒฝ์ฐ์ ๋น์จ๋ก p๊ฐ์ ์ถ์ ํ ์ ์๋ค.
- p ๊ฐ 0.308์ด๋ผ๋ฉด ์ฐ์ฐํ ์ป์ ๊ฒฐ๊ณผ์ 30% ์ ๋๊ฐ ๊ด์ฐฐํ ๊ฒ๋งํผ ๊ทน๋จ์ ์ด๊ฑฐ๋ ๊ทธ ์ด์์ ๊ทน๋จ์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ๊ฒ์ผ๋ก ๊ธฐ๋๋จ.
3.4.2 ์ ์์์ค
- p ๊ฐ์ ์๋ฏธ
- ๋๋ฌด ๋ง์ ์ฐ๊ตฌ์๊ฐ ์ด๋ ดํ์ด ์๋ p ๊ฐ ๊ฐ๋ ์ผ๋ก ์ ์๋ฏธํ p ๊ฐ์ด ๋์ฌ ๋๊น์ง ์จ๊ฐ ๊ฐ์ค๊ฒ์ ์ ์ํ.
- ์ค์ p ๊ฐ์ด ๋ํ๋ด๋ ๊ฒ : ๋๋ค ๋ชจ๋ธ์ด ์ฃผ์ด์ก์ ๋, ๊ทธ ๊ฒฐ๊ณผ๊ฐ ๊ด์ฐฐ๋ ๊ฒฐ๊ณผ๋ณด๋ค ๋ ๊ทน๋จ์ ์ผ ํ๋ฅ
- ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ๋ค๋ ๊ทผ๊ฑฐ๋ฅผ ๊ฐ์ง๊ธฐ์ ์ฝํ๋ค.
3.4.3 ์ 1์ข ๊ณผ ์ 2์ข ์ค๋ฅ
- 1์ข
์ค๋ฅ : ์ฐธ์ ๊ฑฐ์ง์ผ๋ก ํ๋จ
- ๋ณดํต์ 1์ข ์ค๋ฅ๋ฅผ ์ต์ํํ๋๋ก ๊ฐ์ค์ ์ค๊ณํ๋ค.
- 2์ข
์ค๋ฅ : ๊ฑฐ์ง์ ์ฐธ์ผ๋ก ํ๋จ
- ํ๋ณธ์ ํฌ๊ธฐ๊ฐ ๋๋ฌด ์์์ ํจ๊ณผ๋ฅผ ์์๋ผ ์ ์๋ค๊ณ ํ๋จํ๋ ๊ฒ๊ณผ ๊ฐ๋ค.
- = ์์ง ํจ๊ณผ๊ฐ ์ ์ฆ๋์ง ์์๋ค.
3.4.4 ๋ฐ์ดํฐ ๊ณผํ๊ณผ p ๊ฐ
- p ๊ฐ์ ๋ง๋ฅ์ด ์๋๋ค.
- p๊ฐ ๋๋ ํต๊ณ์ ์ ์์ฑ์ ํจ๊ณผ์ ํฌ๊ธฐ๋ ๊ฒฐ๊ณผ์ ์ค์์ฑ์ ์๋ฏธํ์ง๋ ์๋๋ค.
- p๊ฐ ๊ทธ ์์ฒด๋ ๋ชจ๋ธ์ด๋ ๊ฐ์ค์ ๋ํ ์ฆ๊ฑฐ๋ฅผ ์ธก์ ํ๊ธฐ ์ํ ์ข์ ์งํ๊ฐ ์๋๋ค.
- ์คํ์์ ์์ฌ๊ฒฐ์ ์ ์ข์ฐํ๋ ๋๊ตฌ๋ก์ ์ฌ์ฉ๋์ ์๋๋ค.
- ๊ฒฐ์ ์ ๊ด๋ จ๋ ์ ๋ณด์ผ ๋ฟ.
3.5 t ๊ฒ์
- ๋ ์ง๋จ๊ฐ์ ํ๊ท ์ด ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ ์ฐจ์ด๋ฅผ ๋ณด์ด๊ณ ์๋์ง์ ์ฌ๋ถ๋ฅผ ๊ฒ์ฆํ ๋ ์ฌ์ฉ๋๋ ๋ถ์๋ฐฉ๋ฒ.
- ๋ฐ์ดํฐ๊ฐ ํ์๋ ์ธก์ ๊ฐ์ ํฌํจํ๋์ง, ํ๋ณธ์ด ์ผ๋ง๋ ํฐ์ง, ์ธก์ ๋์์ด ๋ฌด์์ธ์ง์ ๋ฐ๋ผ ๋ค์ํ ์ ํ์ ์ ์์ฑ ๊ฒ์ ๋ฐฉ๋ฒ ์ค ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉ๋๋ ๊ฒ.
- ์ ์์ฑ ๊ฒ์ ๋ฐฉ๋ฒ ์ค ๊ฐ์ฅ ์์ฃผ ์ฌ์ฉ๋๋ t ๊ฒ์ (t-test)
- ์ ์์ฑ ๊ฒ์ : ๊ด์ฌ์๋ ํจ๊ณผ๋ฅผ ์ธก์ ํ๊ธฐ ์ํ ๊ฒ์ ํต๊ณ๋์ ์ง์ , ๊ด์ฐฐ๋ ํจ๊ณผ๊ฐ ์ ์์ ์ธ ๋๋ค ๋ณ์ด์ ๋ฒ์ ๋ด์ ์๋์ง ์ฌ๋ถ๋ฅผ ํ๋จํ๋๋ฐ ๋์์ ์ค
- ๋ฐ์ดํฐ๊ฐ ์์นํ์ธ ์์ฃผ ์ผ๋ฐ์ ์ธ 2ํ๋ณธ ๋น๊ต(A/B ๊ฒ์ )์ ์ฃผ๋ก ์ฌ์ฉํ๋ค.
- ๊ฒ์ ํต๊ณ๋(test statistic) : ๊ด์ฌ์ ์ฐจ์ด ๋๋ ํจ๊ณผ์ ๋ํ ์ธก์ ์งํ
- ํ์ค์ ์ผ๋ก ๋ชจ์ง๋จ ์ ์ฒด๋ฅผ ์กฐ์ฌํ๊ธฐ ํ๋ค๋ค. ํด์ ํ๋ณธ์ ๋ฝ์ ํ๋ณธํต๊ณ๋์ผ๋ก ๊ณ์ฐํ๋๋ฐ, ์ด ํ๋ณธํต๊ณ๋์ ๊ฐ์ค๊ฒ์ ์์ ๊ฒ์ ํต๊ณ๋์ด๋ผ๊ณ ํ๋ค.
- t ํต๊ณ๋(t-statistic) : ํ์คํ๋ ํํ์ ๊ฒ์ ํต๊ณ๋
- t ๋ถํฌ(t-distribution) : ๊ด์ธก๋ t ํต๊ณ๋์ ๋น๊ตํ ์ ์๋, ๊ธฐ์ค๋ถํฌ
์ ๋ฆฌ
- ์ปดํจํฐ๊ฐ ๋๋ฆฌ ๋ณด๊ธ๋๊ธฐ ์ ์, ์ฌํ๋ณธ ๊ฒ์ ์ ์ค์ฉ์ ์ด์ง ์์์ผ๋ฉฐ, ๋์ ํต๊ณํ์๋ค์ ํ์ค์ ์ธ ๋ถํฌ๋ฅผ ์ฐธ๊ณ ํ๋ค.
- ์ด๋ ๊ฒ ํ๋ฉด ๊ฒ์ ํต๊ณ๋์ด ํ์คํ๋์ด ์ฐธ๊ณ ํ ๋ถํฌ์ ๋น๊ตํ ์ ์๋ค.
- ๋๋ฆฌ ์ฌ์ฉ๋๋ ํ์คํ๋ ํต๊ณ๋ ์ค ํ๋๊ฐ t ํต๊ณ๋์ด๋ค.
3.6 ๋ค์ค๊ฒ์
- ํต๊ณํ์์๋ ๋ค์ํ ๊ด์ ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋ณด๊ณ ์ถฉ๋ถํ ์ง๋ฌธ์ ๋์ง๋ค ๋ณด๋ฉด ๊ฑฐ์ ํญ์ ํต๊ณ์ ์ ์ ์ํ ๊ฒฐ๊ณผ๊ฐ ๋์ด.
- ํ์ง๋ง ๋ณ์๊ฐ ๋ง์์ง๊ฑฐ๋ ๋ค์ํ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ค๋ณด๋ฉด ์ฐ์ฐ์ ์ํ ์ ์๋ฏธํ ๊ฒฐ๊ณผ๊ฐ ๋ํ๋ ํ๋ฅ ์ด ๋์์ง.
- → ์ 1์ข ์ค๋ฅ : ์ด๋ค ํจ๊ณผ๊ฐ ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ๋ค๊ณ ์๋ชป๋ ๊ฒฐ๋ก ์ ๋ด๋ฆฌ๊ฒ ๋จ
- ์ง๋ ํ์ต์์๋ ์ด๋ฐ ์ํ์ ๋ฎ์ถ๊ธฐ ์ํด, ํ๋์์ ์ธํธ๋ฅผ ์ฌ์ฉํจ
- ๊ต์ฐจ๊ฒ์ฆ๋ฐฉ๋ฒ์ ์ฌ๋ฌ๊ฐ์ง ์์ ex ) Holdout method, k-fold cross validation, Leave-p-out cross validation ๋ฑ
- → ์ด์ ์ ๋ณด์ง ๋ชปํ๋ ๋ฐ์ดํฐ๋ฅผ ํตํด ๋ชจ๋ธ์ ํ๊ฐํ ์ ์์
- ๋ค์ค๊ฒ์ ์์ ์ฐ์ฐ์ ์์ ๊ธฐํ๋ ๋ ์ฆ๊ฐํ๋ค. ๋จ์ผ ๊ฒ์ ์์ A์ ๋ํด 1or0์ผ๋ก ๊ฐ์ค์ ์ธ์ ๋ค๋ฉด, ๋ค์ค๊ฒ์ ์์ 2๋ฒ, A์ C๊ฐ ์๋ก ๋ค๋ฅธ๊ฐ?๊ฐ์ด ๋ค์ํ ์ง๋ฌธ์ด ์๊ธด๋ค.
- ์ํ : ์ ์์์ค. ์๊ณ๊ฐ์ ๋ฏธ๋ฆฌ ์ค์ ํด๋์ด์ ์ฐ์ฐ์ธ ์ฌ๊ฑด์ ๋ฐฉ์งํจ. ๋ง์ด ์ฌ์ฉ๋๋ ๊ฐ์ 5%๋ 1%์ด๋ค.
- ์ฆ, ๋จ์ผ๊ฒ์ ์ ํ ๋๋ณด๋ค ํต๊ณ์ ์ ์์ฑ์ ๋ํ ๊ธฐ์ค์ ๋ ์๊ฒฉํ๊ฒ ์ค์ ํ๊ฒ ๋๋ค. ๋ ์์ ์ํ๋ฅผ.
- 3๋ฒ, B์ C๊ฐ ์๋ก ๋ค๋ฅธ๊ฐ?
- 1๋ฒ, A์ B๊ฐ ์๋ก ๋ค๋ฅธ๊ฐ?
- ๋ค์ค๊ฒ์ ์์ ๋ง์ ๊ฒ์ ๋ฐ๊ฒฌํ ์ ์๋ ๊ธฐํ:
- ์ฌ๋ฌ ๊ทธ๋ฃน ๊ฐ์ ์๋ณ ์ฐจ์ด๋ฅผ ์กฐ์ฌ
- ์ฌ๋ฌ ๋ถ๋ถ๊ตฐ์์์ ๊ฒฐ๊ณผ๋ฅผ ์์๋ณด๋ ๊ฒ(ex. ์ ์ฒด์ฐ๋ น์ด ์๋๋ผ 20๋(๋ถ๋ถ๊ตฐ)์์ ๋ฐ๊ฒฌ)
- ์ฌ๋ฌ ๊ฐ์ง ํต๊ณ ๋ชจํ์ ์ ์ฉ
- ๋ชจ๋ธ์์ ๋ง์ ๋ณ์๋ค์ ์ฌ์ฉํ๋ ๊ฒ
- ์๋ง์ ์๋ก ๋ค๋ฅธ ์ง๋ฌธ๋ค์ ๋ฌป๋ ๊ฒ
- ํ์ง๋ง, ์ค๋ณต๋๊ฐ์ ์ผ๋ฐ์ ์ธ ๋ฌธ์ ๋ฅผ ํฌํจํ์ฌ ์ฌ๋ฌ ๊ฐ์ง ์ด์ ๋ก ๋ ๋ง์ ์ฐ๊ตฌ๊ฐ ๋ฐ๋์ ๋์ ์ฐ๊ตฌ๋ฅผ ์๋ฏธํ๋ ๊ฒ์ ์๋.
3.7 ์์ ๋ d.f.(degrees of freedom)
- ์์ ๋ : ํ๋ณธ ๋ฐ์ดํฐ์์ ๊ณ์ฐ๋ ํต๊ณ๋์ ์ ์ฉ๋๋ฉฐ ๋ณํ๊ฐ ๊ฐ๋ฅํ ๊ฐ๋ค์ ๊ฐ์๋ฅผ ๋ํ๋ธ๋ค.
- ex. 9๊ฐ์ ๊ฐ, ํ๊ท ์ ์๊ณ ์๋ค๋ฉด 10๋ฒ์งธ ๊ฐ๋ ์์๊ฐ๋ฅ
- ํ๋ณธํฌ๊ธฐ n : ํด๋น ๋ฐ์ดํฐ์์ ๊ด์ธก๊ฐ์ ๊ฐ์(ํ ํน์ ๊ธฐ๋ก๊ฐ์ ๊ฐ์์ ๊ฐ์ ์๋ฏธ)
- ์์ ๋๊ฐ ์ค์ํ ์ด์ ?
- ํ๋ณธ์ ํตํด ๋ชจ์ง๋จ์ ๋ถ์ฐ์ ์ถ์ ํ๊ณ ์ ํ ๋ ๋ถ๋ชจ์ n์ ์ฌ์ฉํ๋ฉด ์ถ์ ์น๊ฐ ์ด์ง ์๋์ชฝ์ผ๋ก ํธํฅ๋ ๊ฒ.
- n-1๋ก ํ์ฌ ํธํฅ์ด ๋ฐ์ํ์ง ์๋๋ค
- ํ๋ณธ์ ๋ถ์ฐ์ ๋ชจ์ง๋จ์ ๋ถ์ฐ์ ๊ทผ์ฌํด์ง๊ฒ ํ๋ ๋น์จ์ ์ฐพ์๋๋ฐ ๊ทธ๊ฒ์ด ๋ฐ๋ก n/(n-1).
- ์ด๋ฅผ ํ๋ณธ์ ๋ถ์ฐ์ n/(n-1)๋งํผ ๊ณฑํ๋ฉด ๋ชจ์ง๋จ์ ๋ถ์ฐ์ ๊ทผ์ฌํ๊ฒ ๋๋ค.
- ์์ ๋๋ ํ์คํ๋ ๋ฐ์ดํฐ๊ฐ ๊ทธ์ ์ ํฉํ ๊ธฐ์ค ๋ถํฌ(t๋ถํฌ, F๋ถํฌ ๋ฑ)์ ๋ง๋๋ก ํ๊ธฐ ์ํ ํ์คํ ๊ณ์ฐ์ ์ผ๋ถ.
- ํ์ง๋ง ๋ฐ์ดํฐ ๊ณผํ์์๋ ์ ์์ฑ ๊ฒ์ ์ธก๋ฉด์์ ์ค์ํ์ง ์๋ค.
- cf) ์์ ํ ๋ถํ์ํ ์์ธก๋ณ์๋ค์ด ์๋ ๊ฒฝ์ฐ ํ๊ท ์๊ณ ๋ฆฌ์ฆ ์ฌ์ฉํ๊ธฐ ์ด๋ ต๋ค.
- ex) ์ผ์ฃผ์ผ์ 7์ผ์ด ์์ง๋ง ์์ผ์ ์ง์ ํ ๋ ์์ ๋๋ 6์ผ์ด๋ค.
- cf) ์์ ํ ๋ถํ์ํ ์์ธก๋ณ์๋ค์ด ์๋ ๊ฒฝ์ฐ ํ๊ท ์๊ณ ๋ฆฌ์ฆ ์ฌ์ฉํ๊ธฐ ์ด๋ ต๋ค.
3.8 ๋ถ์ฐ๋ถ์
- ๋ถ์ฐ ๋ถ์ (analysis of variance, ANOVA) : ์ฌ๋ฌ ๊ทธ๋ฃน๊ฐ์ ํต๊ณ์ ์ ์๋ฏธํ ์ฐจ์ด๋ฅผ ๊ฒ์ ํ๋ ํต๊ณ์ ์ ์ฐจ.
- ์ฌ๋ฌ๊ทธ๋ฃน(ex : A-B-C-D)์ ์์น๋ฅผ ์๋ก ๋น๊ต
- ex. 4๊ฐ์ ํ์ด์ง๋ก ์ด๋ฃจ์ด์ง ์นํ์ด์ง์ 5๋ช ์ ์ฌ์ฉ์๊ฐ ๋ฐฉ๋ฌธํ ํ์ด์ง
- ํ ์์ฉ ๋น๊ตํ๊ฒ ๋๋ฉด ์ฐ์ฐํ ์ผ์ด๋ ์ผ์ ์์ ๊ฐ๋ฅ์ฑ์ด ์ปค์ง
- '’์๋ 4๊ฐ ํ์ด์ง์ ํ ๋น๋ ์ธ์ ์๊ฐ์ด ๋ฌด์์๋ก ํ ๋น๋ ๊ฒ์ธ๊ฐ?”๋ผ๋ ์ง๋ฌธ์ ๋ค๋ฃจ๋ ์ด๊ด๊ฒ์ ํ์
- ์๋ณ๋น๊ต(pairwise comparison) : ์ฌ๋ฌ ๊ทธ๋ฃน ์ค ๋ ๊ทธ๋ฃน ๊ฐ์ ๊ฐ์ค๊ฒ์
- ์ด๊ด๊ฒ์ (omnibus test) : ์ฌ๋ฌ ๊ทธ๋ฃน ํ๊ท ๋ค์ ์ ์ฒด ๋ถ์ฐ์ ๊ดํ ๋จ์ผ ๊ฐ์ค๊ฒ์
- ๋ถ์ฐ๋ถํด(decomposition of variance) : ๊ตฌ์ฑ ์์ ๋ถ๋ฆฌ. ์๋ฅผ ๋ค๋ฉด ์ ์ฒด ํ๊ท , ์ฒ๋ฆฌ ํ๊ท , ์์ฐจ ์ค์ฐจ๋ก๋ถํฐ ๊ฐ๋ณ๊ฐ๋ค์ ๋ํ ๊ธฐ์ฌ๋ฅผ ๋ปํจ
- SS(sum of squares) : ์ด๋ค ํ๊ท ์ผ๋ก๋ถํฐ์ ํธ์ฐจ๋ค์ ์ ๊ณฑํฉ
- ANOVA ๊ธฐ๋ฐ์ ์ฌ์ถ์ถ ๊ณผ์
- ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ํ ์์์ ๋ด์ ๋์.
- 5๊ฐ์ ๊ฐ์ ๊ฐ๋ 4๊ฐ์ ์ฌํ๋ณธ์ ์์ด์ ์ถ์ถ
- ๊ฐ ๊ทธ๋ฃน์ ํ๊ท ์ ๊ธฐ๋ก
- ๋ค๊ทธ๋ฃน ํ๊ท ์ฌ์ด์ ๋ถ์ฐ์ ๊ธฐ๋ก
- 2~4๋จ๊ณ ์ฌ๋ฌ๋ฒ ๋ฐ๋ณต
3.8.1 F ํต๊ณ๋
- F ํต๊ณ๋(F-statistic) : ๊ทธ๋ฃน ํ๊ท ๊ฐ์ ์ฐจ์ด๊ฐ ๋๋ค ๋ชจ๋ธ์์ ์์๋๋ ๊ฒ๋ณด๋ค ๋ฒ์ด๋๋ ์ ๋๋ฅผ ์ธก์ ํ๋ ํ์คํ๋ ํต๊ณ๋
- ๋น์จ์ด ๋์์๋ก ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธ
- ์์ฐจ ์ค์ฐจ๋ก ์ธํ ๋ถ์ฐ๊ณผ ๊ทธ๋ฃน ํ๊ท (์ฒ๋ฆฌ ํจ๊ณผ)์ ๋ถ์ฐ์ ๋ํ ๋น์จ์ ๊ธฐ์ด๋กํจ.
- Fํต๊ณ๋์๊ธฐ๋ฐ์ผ๋ก ํ ANOVA ํต๊ณ ๊ฒ์ ๋ ์์
3.8.2 ์ด์ ๋ถ์ฐ๋ถ์
- ์์ ์ฌ๋ก A-B-C-D ๊ฒ์ ์ ๋ณํ๋ ์์(๊ทธ๋ฃน)๊ฐ ํ๋์ธ ์ผ์ANOVA ์ด๋ค.
- ex) A vs B, C vs D
- ๋๊ฐ์ง ์์๋ฅผ ๊ณ ๋ คํ์ฌ ๋ถ์ํ๊ธฐ ์ํด์ ์ด์ ANOVA ๊ฐ ํ์ํจ
- A(์ฃผ๋ง-ํ ์์ผ, ์ผ์์ผ) vs B(ํ์ผ-์,ํ,์,๋ชฉ,๊ธ)
์ ๋ฆฌ
- ANOVA๋ ์ฌ๋ฌ ๊ทธ๋ฃน์ ์คํ ๊ฒฐ๊ณผ๋ฅผ ๋ถ์ํ๊ธฐ ์ํ ํต๊ณ์ ์ ์ฐจ
- A/B ๊ฒ์ ๊ณผ ๋น์ทํ ์ ์ฐจ๋ฅผ ํ์ฅํ์ฌ ๊ทธ๋ฃน ๊ฐ ์ ์ฒด์ ์ธ ํธ์ฐจ๊ฐ ์ฐ์ฐํ ๋ฐ์ํ ์ ์๋ ๋ฒ์ ๋ด์ ์๋์ง๋ฅผ ํํ๊ธฐ ์ํด ์ฌ์ฉํ๋ค.
- ANOVA์ ๊ฒฐ๊ณผ ์ค ์ ์ฉํ ์ ์ค ํ๋๋ ๊ทธ๋ฃน ์ฒ๋ฆฌ, ์ํธ์์ฉ ํจ๊ณผ, ์ค์ฐจ์ ๊ด๋ จ๋ ๋ถ์ฐ์ ๊ตฌ์ฑ ์์๋ค์ ๊ตฌ๋ถํ๋ ๋ฐ ์๋ค.
3.9 ์นด์ด์ ๊ณฑ๊ฒ์
- ์นด์ด์ ๊ณฑ ๊ฒ์ (chi-square test) : ํ์ ๊ด๋ จ ๋ฐ์ดํฐ์ ์ฃผ๋ก ์ฌ์ฉ, ์์๋๋ ๋ถํฌ์ ์ผ๋ง๋ ์ ๋ง๋์ง ๊ฒ์ .
- ๋จ์ A/B ๊ฒ์ ์ ๋์ด ๋์์ ์ฌ๋ฌ ๊ฐ์ง ์ฒ๋ฆฌ๋ฅผ ํ ๋ฒ์ ํ ์คํธํ ํ์๊ฐ ์๋ค.
- ex. ์น ํ ์คํธ์
- ์ผ๋ฐ์ ์ผ๋ก ๋ณ์ ๊ฐ ๋
๋ฆฝ์ฑ์ ๋ํ ๊ท๋ฌด๊ฐ์ค์ด ํ๋นํ์ง ํ๊ฐํ๊ธฐ ์ํด r*c ๋ถํ ํ ํจ๊ป ์ฌ์ฉ
- r๊ณผ c๋ ๊ฐ๊ฐ ํ๊ณผ ์ด์ ์ ์๋ฏธ
3.9.1 ์นด์ด์ ๊ณฑ๊ฒ์ : ์ฌํ๋ณธ์ถ์ถ ๋ฐฉ๋ฒ
- ํผ์ด์จ ์์ฐจ, R : ์ค์ ํ์์ ๊ธฐ๋ํ ํ์ ์ฌ์ด์ ์ฐจ์ด๋ฅผ ๋ํ๋.
- ์นด์ด์ ๊ณฑํต๊ณ๋ : ํผ์ด์จ ์์ฐจ๋ค์ ์ ๊ณฑํฉ
3.9.2 ์นด์ด์ ๊ณฑ๊ฒ์ : ํต๊ณ์ ์ด๋ก
- ์ ๊ทผ์ ํต๊ณ ์ด๋ก ์ ์นด์ด์ ๊ณฑํต๊ณ๋์ ๋ถํฌ๊ฐ ์นด์ด์ ๊ณฑ๋ถํฌ๋ก ๊ทผ์ฌํ๋ ์ ์์์ ๋ณด์ฌ์ค.
- ์ ์ ํ ํ์ค ์นด์ด์ ๊ณฑ๋ถํฌ๋ ์์ ๋์ ์ํด ๊ฒฐ์
- ์์ ๋ = (r-1) * (c-1)
- ์นด์ด์ ๊ณฑ๋ถํฌ๋ ์ผ๋ฐ์ ์ผ๋ก ํ์ชฝ์ผ๋ก ๊ธฐ์ธ์ด์ ธ ์๊ณ , ์ค๋ฅธ์ชฝ ๊ธด ๊ผฌ๋ฆฌ๊ฐ ์๋ค.
3.9.3 ํผ์ ์ ์ ํ๊ฒ์
- ๋๋ถ๋ถ์ ํต๊ณ ์ํํธ์จ์ด๋ ๋ฐ์ํ ์ ์๋ ๋ชจ๋ ์กฐํฉ์ ์ค์ ๋ก ์ด๊ฑฐํ๊ณ , ๋น๋๋ฅผ ์ง๊ณํ๊ณ , ๊ด์ฐฐ๋ ๊ฒฐ๊ณผ๊ฐ ์ผ๋ง๋ ๊ทน๋จ์ ์ผ๋ก ๋ฐ์ํ ์ ์๋์ง๋ฅผ ๊ฒฐ์ ํ๋ ์ ์ฐจ๋ฅผ ์ ๊ณตํ๋ค.
- ์ด๋ฅผ ํผ์ ์ ์ ํ๊ฒ์ ์ด๋ผํ๋ค.
3.9.4 ๋ฐ์ดํฐ ๊ณผํ๊ณผ์ ๊ด๋ จ์ฑ
- ์นด์ด์ ๊ณฑ๊ฒ์ ์ด๋ ํผ์ ์ ์ ํ๊ฒ์ ์ ํต๊ณ์ ์ ์์ฑ์ ์กฐ์ฌํ๋ ๊ฒ์ผ๋ก ๋ฐ์ดํฐ๊ณผํ๊ณผ์ ์ง์ ์ ์ธ ์ฐ๊ด์ฑ์ ์ฐพ๊ธฐ๊ฐ ์ด๋ ต๋ค. ๋ฐ๋ผ์ ์ต์ ์ ์ฒ๋ฆฌ ๋ฐฉ๋ฒ์ ์ฐพ๋ ๋ฉํฐ์๋ ๋ฐด๋ง ๋ฐฉ๋ฒ์ด ๋ ์ ํํ ํด๊ฒฐ์ฑ ์ด๋ผ ํ ์ ์๊ฒ ๋ค.
- ๋ฐ์ดํฐ๊ณผํ ์์ฉ ๋ถ์ผ์์ , ์นด์ด์ ๊ณฑ ๊ฒ์ ์ด๋ ์ฌํ๋ณธ์ถ์ถ ์๋ฎฌ๋ ์ด์ ์ ํํฐ๋ก ์ฌ์ฉ.
- → ์ฆ, ์ด๋ค ํจ๊ณผ๋ ํน์ง์ ๋ํด ๊ธฐ๋ณธ์ ์ธ ์ ์์ฑ ๊ฒ์ ์ ๋์ด ๋ ์ฌ์ธต์ ์ธ ๋ถ์์ด ํ์ํ ์ง ์ฌ๋ถ๋ฅผ ๊ฒฐ์ ํ๋ค.
- ๋จธ์ ๋ฌ๋์์๋ ์๋์ผ๋ก ํน์ง์ ์ ํํ๊ธฐ ์ํด ์ฌ์ฉํ๋ค.
3.10 ๋ฉํฐ์๋ ๋ฐด๋ง ์๊ณ ๋ฆฌ์ฆ
- ๋ฉํฐ์๋ ๋ฐด๋ง(multi-armed bandit) : ๊ณ ๊ฐ์ด ์ ํํ ์ ์๋ ์์ก์ด๊ฐ ์ฌ๋ฌ ๊ฐ์ธ ๊ฐ์์ ์ฌ๋กฏ๋จธ์ ์ ๋งํ๋ฉฐ, ๊ฐ ์์ก์ด๋ ๊ฐ๊ธฐ ๋ค๋ฅธ ์์ต์ ๊ฐ์ ธ๋ค์ค๋ค. ๋ค์ค ์ฒ๋ฆฌ ์คํ์ ๋ํ ๋น์ ๋ผ๊ณ ์๊ฐํ ์ ์๋ค.
- ์์ก์ด(arm) : ์คํ์์ ์ด๋ค ํ๋์ ์ฒ๋ฆฌ๋ฅผ ๋งํ๋ค.
- ์๊ธ(์์ต) : ์ฌ๋กฏ๋จธ์ ์ผ๋ก ๋ด ์๊ธ์ ๋ํ ์คํ์ ๋น์
- ์ ํต์ ์ธ ํต๊ณ์ ์ ๊ทผ ๋ฐฉ์๋ณด๋ค ๋ช
์์ ์ธ ์ต์ ํ์ ์ข ๋ ๋น ๋ฅธ ์์ฌ ๊ฒฐ์ ์ด ๋ชฉํ
- ํนํ ์นํ ์คํธ์ ์ฌ์ฉ
- ๋ฐด๋ง ์๊ณ ๋ฆฌ์ฆ์ ํ์ด๋ธ๋ฆฌ๋ ์ ๊ทผ ๋ฐฉ์์ ์ทจํ๋ค.
- ์์์์ก์ด B: 50๋ฒ ์ค 2๋ฒ ์น๋ฆฌA๋ฅผ ๋ ์์ฃผ ์ก์๋น๊ธฐ๋ ๊ฑธ๋ก ์์ํ์ง๋ง B์ C๋ฅผ ํฌ๊ธฐํ์ง ์๋๋ค. A์ ์ฑ๊ณผ๊ฐ ๊พธ์คํ ์ฐ์ํ๋ค๋ฉด A์ ๊ธฐํ๋ฅผ ๋ ๋ง์ด ์ฃผ๊ฒ ์ง๋ง, ๋ง์ผ C๊ฐ ๋ ์ข์์ง๋ค๋ฉด C์ ๊ธฐํ๋ฅผ ๋ ๋๋ฆฌ๋ ์์ผ๋ก ๋ฐ๊พผ๋ค.
- → A์ ์ฐ์๋ฅผ ํ์ฉํ๊ธฐ ์ํด ๊ฒ์ฆํ๊ณ ๋๋จธ์ง B, C๋ ํฌ๊ธฐํ์ง ์๋๋ค.
- ์์ก์ด C: 50๋ฒ ์ค 4๋ฒ ์น๋ฆฌ
- ์์ก์ด A: 50๋ฒ ์ค 10๋ฒ ์น๋ฆฌ
- ์ ์ฉ ์๊ณ ๋ฆฌ์ฆ
- ์ฑ์ค๋ก -๊ทธ๋ฆฌ๋ ์๊ณ ๋ฆฌ์ฆ
- ์ฑ์ค๋ก : ์๊ณ ๋ฆฌ์ฆ์ ์ ์ดํ๋ ๋จ์ผ ํ๋ผ๋ฏธํฐ
- ์ฑ์ค๋ก ์ด 1์ด๋ฉด ํ์ค A/B ๊ฒ์
- ์ฑ์ค๋ก ์ด 0์ด๋ฉด ํ์ ์๊ณ ๋ฆฌ์ฆ
- ์ฑ์ค๋ก : ์๊ณ ๋ฆฌ์ฆ์ ์ ์ดํ๋ ๋จ์ผ ํ๋ผ๋ฏธํฐ
- ํฐ์จ์ ์ํ๋ง
- ๋ฒ ์ด์ง์ธ ๋ฐฉ์ ์ฌ์ฉ
- ๋ฒ ํ๋ถํฌ(์ฌ์ ์ ๋ณด)๋ฅผ ์ฌ์ฉํ์ฌ ์์ต์ ์ผ๋ถ ์ฌ์ ๋ถํฌ๋ฅผ ๊ฐ์ ํจ.
- ์ฑ์ค๋ก -๊ทธ๋ฆฌ๋ ์๊ณ ๋ฆฌ์ฆ
- ์ ํต์ A/B ๊ฒ์ ์ ์์ํ์ง ๊ณผ์ ์ ๊ธฐ๋ณธ์ผ๋ก ํ๊ธฐ ๋๋ฌธ์ ์์ต์ด ๋ฎ์ ๊ฒ์ ๋๋ฌด ๋ง์ด ์๋ํ๊ฒ ๋๋ค.
- ์ด์ ๋ฌ๋ฆฌ MAB๋ ์คํ ๋์ค์ ์ป์ ์ ๋ณด๋ฅผ ํตํฉํ๊ณ ์์ต์ด ๋ฎ์ ๊ฒ์ ๋น๋๋ฅด ์ค์ด๋ ์ชฝ์ผ๋ก ํ๋ณธ ์ถ์ถ๊ณผ์ ์ ๋ณ๊ฒฝํ๋ค.
- ๋ํ ๋ ๊ฐ์ง ์ด์์ ์ฒ๋ฆฌ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ๋ค๋ฃฐ ์ ์๋ค.
- ์ถ์ถ ํ๋ฅ ์ ์์ต์ด ๋ฎ์ ์ฒ๋ฆฌ์์ ์์ต์ด ๋์ผ๋ฆฌ๋ผ ์ถ์ ๋๋ ์ชฝ์ผ๋ก ์ด๋์ํค๊ธฐ ์ํ ๋ค์ํ ์๊ณ ๋ฆฌ์ฆ์ด ์กด์ฌํ๋ค.
โถ ์ ์ค๋ก -๊ทธ๋ฆฌ๋ ์๊ณ ๋ฆฌ์ฆ, ํฐ์จ ์ํ๋ง์ ๋ํด ์ฐธ๊ณ ํ๋ฉด ์ข์ ๋งํฌ
๋๋ณด๊ธฐ
- ์
์ค๋ก -๊ทธ๋ฆฌ๋ ์๊ณ ๋ฆฌ์ฆ : https://brunch.co.kr/@chris-song/62
→ ํฌ์คํ ์ค๋ฐ๋ถํฐ ์ ์ค๋ก -๊ทธ๋ฆฌ๋ ์๊ณ ๋ฆฌ์ฆ ๊ด๋ จ ์ค๋ช ์ด ๋์์๋ค. - ํฐ์จ ์ํ๋ง : https://brunch.co.kr/@chris-song/66
3.11 ๊ฒ์ ๋ ฅ๊ณผ ํ๋ณธ ํฌ๊ธฐ
- ์คํ ์งํ์ ํ๋ณธํฌ๊ธฐ์ ๋ํ ๊ณ ๋ ค๊ฐ ์ค์ํ๋ค.
- ํ๋ณธ ํฌ๊ธฐ์ ๋ํ ๊ณ ๋ ค๋ ์ค์ ๋ก A์ B์ ์ฐจ์ด๋ฅผ ๋ฐํ๋ผ ์ ์์์ง์ ๋ํ ์ง๋ฌธ๊ณผ ์ฐ๊ฒฐ๋๋ค.
- p๊ฐ(๊ฐ์ค๊ฒ์ ์ ๊ฒฐ๊ณผ)์ A์ B์ ์ฐจ์ด์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋ค.
- A,B ์ ์ฐจ์ด๊ฐ ์์ ์๋ก ๋ ๋ง์ ๋ฐ์ดํฐ๊ฐ ํ์ํ๋ค.
- ๊ฒ์ ๋ ฅ : ํน์ ํ๋ณธ ์กฐ๊ฑด(ํฌ๊ธฐ์ ๋ณ์ด)์์ ํน์ ํ ํจ๊ณผํฌ๊ธฐ๋ฅผ ์์๋ผ ์ ์์ ํ๋ฅ ์ ์๋ฏธ
3.11.1 ํ๋ณธํฌ๊ธฐ
- ๊ฒ์ ๋ ฅ ๊ณ์ฐ์ ์ฃผ๋ ์ฉ๋๋ ํ๋ณธํฌ๊ธฐ๊ฐ ์ด๋ ์ ๋๊ฐ ํ์ํ๊ฐ๋ฅผ ์ถ์ ํ๋ ๊ฒ
- ์์ ์ฐจ์ด์๋ ๊ด์ฌ์ด ์๋ค๋ฉด ํจ์ฌ ํฐ ํ๋ณธ์ด ํ์ํจ.
- ํจ๊ณผํฌ๊ธฐ๊ฐ ํ๋ณธํฌ๊ธฐ๋ฅผ ์ข์ฐํจ.
- ํจ๊ณผํฌ๊ธฐ(effect size) : ํต๊ณ ๊ฒ์ ์ ํตํด ํ๋จํ ์ ์๋ ํจ๊ณผ์ ์ต์
- ex. 3ํ 3ํผ ํ์vs 2ํ ํ์๋ผ๋ฉด 0.33-0.2=0.13์ด ํจ๊ณผํฌ๊ธฐ
- ๊ฒ์ ๋ ฅ ํน์ ํ๋ณธํฌ๊ธฐ์ ๊ณ์ฐ๊ณผ ๊ด๋ จ๋ ๋ค์ 4๊ฐ์ง ์ค์ํ ์์
- ํ๋ณธํฌ๊ธฐ
- ํ์งํ๊ณ ์ ํ๋ ํจ๊ณผํฌ๊ธฐ
- ๊ฐ์ค๊ฒ์ ์ ์ํ ์ ์์์ค
- ๊ฒ์ ๋ ฅ
- ์์ 3๊ฐ์ง๋ฅผ ์ ํ๋ฉด ๋๋จธ์ง ํ๋๋ฅผ ์ ์ ์๋ค.
- R์ฝ๋์์๋ pwr ํจํค์ง ์ฌ์ฉ
์ ๋ฆฌ
- ํต๊ณ ๊ฒ์ ์ ์ํํ๊ธฐ ์์, ์ด๋์ ๋์ ํ๋ณธํฌ๊ธฐ๊ฐ ํ์ํ์ง ๋ฏธ๋ฆฌ ์๊ฐํ ํ์๊ฐ ์๋ค.
- ์์๋ด๊ณ ์ ํ๋ ํจ๊ณผ์ ์ต์ ํฌ๊ธฐ๋ฅผ ์ง์ ํด์ผ ํ๋ค.
- ๋ํ ํจ๊ณผํฌ๊ธฐ๋ฅผ ์์๋ด๊ธฐ ์ํด ์๊ตฌ๋๋ ํ๋ฅ (๊ฒ์ ๋ ฅ)์ ์ง์ ํด์ผ ํ๋ค.
- ๋ง์ง๋ง์ผ๋ก, ์ํํ ๊ฐ์ค๊ฒ์ ์ ํ์ํ ์ ์์์ค์ ์ ํด์ผ ํ๋ค.