Learning archive/Data Science

[κΈ°μ΄ˆν†΅κ³„ν•™ 1κ°•] λͺ¨μ§‘단과 ν‘œλ³Έ

saaan 2020. 8. 30. 18:10

* 이 글은 KOCWμ—μ„œ μ œκ³΅μ€‘μΈ μ—¬μΈκΆŒ κ΅μˆ˜λ‹˜μ˜ 'κΈ°μ΄ˆν†΅κ³„ν•™' κ°•μ˜ ν•™μŠ΅λ‚΄μš©μž…λ‹ˆλ‹€. 

 

 

κΈ°μ΄ˆν†΅κ³„ν•™1 

 

- ν†΅κ³„ν•™μ΄λž€?

- κΈ°μˆ ν†΅κ³„

- ν™•λ₯ 

- ν™•λ₯ λ³€μˆ˜μ™€ ν™•λ₯ λΆ„포

- ν‘œμ§‘λΆ„ν¬ 

 

ν†΅κ³„ν•™μ΄λž€ λͺ¨μ§‘λ‹¨μ˜ νŠΉμ„±μ„ νŒŒμ•…ν•˜κΈ° μœ„ν•΄ ν‘œλ³Έμ„ μˆ˜μ§‘, κ·Έ νŠΉμ„±μ„ νŒŒμ•…ν•˜κ³  λͺ¨μ§‘단을 μΆ”λ‘ ν•˜λŠ” 원리와 방법을 μ œκ³΅ν•˜λŠ” ν•™λ¬Έ 

 

톡계학을 이해할 수 μžˆλŠ” μ˜ˆμ‹œ 

톡계λ₯Ό μž˜ν•˜λ €λ©΄? λͺ¨μ§‘단과 ν‘œλ³Έμ„ 잘 이해해야 ν•œλ‹€. 

λΉ„νŠΈλ°•μŠ€ 잘 ν•˜λ €λ©΄ 뢁치기, λ°•μΉ˜κΈ°λ₯Ό μ•Œμ•„μ•Ό ν•˜κ³ , 톡계λ₯Ό μž˜ν•˜λ €λ©΄ λͺ¨μ§‘단과 ν‘œλ³Έμ„ 잘 이해해야 함. 

(μœ„) μ‘°μ„  μ‹œλŒ€ μž„κΈˆ 수λͺ…은 μ „μˆ˜ 쑰사가 κ°€λŠ₯ν•˜λ‹€. (λͺ¨λ“  데이터λ₯Ό 얻을 수 μžˆλ‹€.)

κ·ΈλŸ¬λ‚˜ λ‚΄μ‹œμ˜ 평균 수λͺ…을 μ•Œλ €λ©΄ μ–΄λ–»κ²Œ ν•΄μ• ν• κΉŒ? 이 경우 μ „μˆ˜μ‘°μ‚¬κ°€ λΆˆκ°€ν•˜λ‹€. 

문제점 : 전체 λ‚΄μ‹œμ˜ 수λͺ…을 81λͺ… λ°μ΄ν„°λ‘œ λŒ€ν‘œν•  수 μžˆμ„κΉŒ?  Q/P = question/problem 

 

이 경우, λ‚˜μ˜ 관심은 "전체 λ‚΄μ‹œ 수λͺ…"에 있고, (λͺ¨μ§‘단)

λ‚΄κ°€ κ°€μ§„ λ°μ΄ν„°λŠ” "81λͺ… λ‚΄μ‹œμ˜ 수λͺ… 데이터"뿐이닀. (ν‘œλ³Έ)

 

Q/P(Question/Problem) κ³Όμ—° 81λͺ…μ˜ 전체 λ‚΄μ‹œλ₯Ό λŒ€ν‘œν•  수 μžˆμ„κΉŒ?

전체λ₯Ό λŒ€ν‘œν•  수 μžˆλŠ” ν‘œλ³Έμ€ μ–΄λ–»κ²Œ λ½‘μ•„μ•Όν• κΉŒ? 

 

λͺ¨μ§‘λ‹¨μ˜ κ°œλ… : 연ꡬ λŒ€μƒ/연ꡬ λŒ€μƒμ˜ '속성'을 λͺ¨λ‘ λͺ¨μ€ 것

1) ν†΅κ³„ν•™μ—λŠ” 항상 연ꡬ λͺ©μ μ΄ μžˆμ–΄μš”. (ex. μ €λŠ” λ‚΄μ‹œμ˜ 평균 수λͺ…에 관심 μžˆμ–΄μš”!)

2) 연ꡬ λŒ€μƒμ„ λ‹€ λͺ¨μ•„놓은 것이 λͺ¨μ§‘λ‹¨μž…λ‹ˆλ‹€. (ex. λͺ¨μ§‘단은 '전체 λ‚΄μ‹œμ˜ 수λͺ…'μž…λ‹ˆλ‹€.) 

μ—¬κΈ°μ„œ λ¬Έμ œλŠ”, λŒ€λΆ€λΆ„μ˜ λͺ¨μ§‘단이 맀우 ν¬λ‹€λŠ” 점! 

 

λͺ¨μ§‘단을 전체 μ‘°μ‚¬ν•˜λŠ” 'μ „μˆ˜μ‘°μ‚¬' 

λŒ€λΆ€λΆ„ λΆˆκ°€λŠ₯ν•˜κ±°λ‚˜ μ• λ§€ν•˜λ‹€. 

μ „μˆ˜μ‘°μ‚¬μ˜ κ°œλ… = λͺ¨μ§‘단 전체λ₯Ό λŒ€μƒμœΌλ‘œ ν•˜λŠ” 쑰사

 

μ „μˆ˜μ‘°μ‚¬κ°€ νž˜λ“€ λ•Œ, μš°λ¦¬λŠ” 'ν‘œλ³Έ(Sample)'을 λ½‘μŠ΅λ‹ˆλ‹€. 

우리의 ꢁ극적인 관심은 λͺ¨μ§‘λ‹¨μ˜ 속성에 있고,

μš°λ¦¬μ—κ²Œ 얻은 λ°μ΄ν„°λŠ” ν‘œλ³Έ(의 속성)에 μžˆλ‹€. 

 

우리의 관심은 λͺ¨μ§‘단에, 우리의 λ°μ΄ν„°λŠ” ν‘œλ³Έμ— 
ν‘œλ³Έμ˜ κ°œλ… : λͺ¨μ§‘λ‹¨μœΌλ‘œλΆ€ν„° μ„ νƒλœ 일뢀 개체 

 

Q. λͺ¨μ§‘단을 λŒ€ν‘œν•  수 μžˆλŠ” ν‘œλ³Έμ„ μ–΄λ–»κ²Œ μˆ˜μ§‘ν• κΉŒ? 

 

ν‘œλ³Έμ„ 잘 λ½‘λŠ”κ²Œ μ€‘μš”ν•œ 이유!

 

λ½‘νž ν™•λ₯ μ„ 미리 μ„€μ •ν•  수 μžˆλŠλƒ μ—†λŠλƒμ— 따라 ν™•λ₯ μΆ”μΆœλ²• / λΉ„ν™•λ₯ μΆ”μΆœλ²•μœΌλ‘œ λ‚˜λ‰œλ‹€.

ν‘œλ³Έλ²•μ€ <κΈ°μ΄ˆν†΅κ³„ν•™1>μ—μ„œλŠ” 닀루지 μ•Šκ³ , ν‘œλ³Έμ΄ 이미 λ½‘ν˜€μžˆλŠ” μƒνƒœλ₯Ό κ°€μ •ν•˜κ³  ν•™μŠ΅ν•œλ‹€. 

이후 ν‘œλ³Έλ‘ μ—μ„œ 배우게 λ˜λŠ” λ‚΄μš© / ν™•λ₯ ν‘œλ³ΈμΆ”μΆœλ²• = λ½‘νž ν™•λ₯ μ΄ λ™μΌν•˜κ²Œ ν‘œλ³Έμ„ μΆ”μΆœν•˜λŠ” 방법! 
ν‘œλ³Έμ˜ ν•œκ³„ : μ–΄λ–€ ν‘œλ³ΈμΈκ°€μ— 따라 차이 λ°œμƒ (λͺ¨μ§‘단을 μ™„λ²½ν•˜κ²Œ νŒŒμ•…ν•˜λŠ” 것 λΆˆκ°€λŠ₯) 

 

이 μˆ˜μ—…μ—μ„œλŠ” 이미 ν‘œλ³Έμ΄ 잘 λ½‘ν˜€μžˆλŠ” 사둀듀을 닀룬닀.

(ν‘œλ³Έμ„ μ–΄λ–»κ²Œ 잘 뽑을 수 μžˆλŠ”μ§€μ— λŒ€ν•œ 뢀뢄은 이후 ν‘œλ³Έλ²•μ—μ„œ λ‹€λ£° 것.)

 

ν‘œλ³Έμ˜ ν•œκ³„ : ν‘œλ³Έμ€ λͺ¨μ§‘단을 λͺ¨λ‘ μ„€λͺ…ν•  수 μ—†λ‹€ 

ν‘œλ³Έμ˜ μ •λ³΄λŠ” 전체 λͺ¨μ§‘λ‹¨μ˜ 정보라고 ν•  수  μ—†λ‹€. μ˜€μ°¨μ™€ 였λ₯˜μ—μ„œ λ²—μ–΄λ‚˜κΈ° νž˜λ“€λ‹€.

λ°”λ€” 수 μžˆλ‹€ == 이런 λΆ€λΆ„μ—μ„œ 톡계가 ν™•λ₯ κ³Ό 연계가 λœλ‹€.

 

κ·Έλž˜μ„œ μš°λ¦¬λŠ” "ν™•λ₯ μ μœΌλ‘œ μΆ”λ‘ "ν•œλ‹€. 

이 μžμ„Έν•œ λ‚΄μš©μ€ κΈ°μ΄ˆν†΅κ³„2μ—μ„œ λ°°μš΄λ‹€. 

 

 

λ‚˜μ˜ 관심은 λͺ¨μ§‘단에, λ°μ΄ν„°λŠ” ν‘œλ³Έμ— μžˆλ‹€ 

 

 

ν†΅κ³„ν•™μ΄λž€?

1) 연ꡬ λŒ€μƒμ΄ λ˜λŠ” λͺ¨μ§‘λ‹¨μ˜ νŠΉμ„±μ„ νŒŒμ•…ν•˜κΈ° μœ„ν•΄

2) 일뢀 ν‘œλ³Έμ„ μˆ˜μ§‘ν•˜κ³ 

3) ν‘œλ³Έμ„ 정리, μš”μ•½, λΆ„μ„ν•˜μ—¬ ν‘œλ³Έμ˜ νŠΉμ„±μ„ νŒŒμ•…ν•œ ν›„

4) ν‘œλ³Έμ˜ νŠΉμ„±μ„ μ΄μš©ν•΄ λͺ¨μ§‘λ‹¨μ˜ νŠΉμ„±μ— λŒ€ν•΄ 'ν™•λ₯ μ μœΌλ‘œ' μΆ”λ‘ ν•˜λŠ” 원리와 방법을 μ œκ³΅ν•œλ‹€. 

 

 

 


 

 

 

좜처 

 

 

http://www.kocw.net/home/search/kemView.do?kemId=1052562

 

κΈ°μ΄ˆν†΅κ³„ν•™

이 κ³Όλͺ©μ—μ„œλŠ” 톡계학을 κ³΅λΆ€ν•˜λŠ”λ° μžˆμ–΄ ν•„μš”ν•œ κΈ°λ³Έ κ°œλ…κ³Ό 원리λ₯Ό μ†Œκ°œν•œλ‹€. λͺ¨μ§‘단과 ν‘œλ³Έμ— λŒ€ν•œ κ°œλ…κ³Ό 각쒅 κΈ°μˆ ν†΅κ³„λ°©λ²•μ„ 배우고 톡계학 좔둠을 κ³΅λΆ€ν•˜λŠ”λ° ν•„μš”ν•œ 기본적인 ν™•λ₯ μ΄οΏ½οΏ½

www.kocw.net