Learning archive/Data Science(20)
-
๐ [DataCamp] Intermediate Python : Basic plots with Matplotlib, Pandas series & dataframe (loc,iloc)
๐ Gapminder World Map ๐ How to use Matplotlib plot function tells python what to show, how to show! ๐Scatter plot : doesn't connect the dots, more honest way ๐Practice : ๋์ ์ฒซ ๊ทธ๋ํ Histogram e.g. population pyramid : Histogram_practice Build a histogram(3) : compare customizaiton : how to customize plots different plot types * (colors, shapes, .. etc. ) customizations * Data * story + add axis lab..
2020.09.01 -
[๊ธฐ์ดํต๊ณํ 3๊ฐ] ๊ธฐ์ ํต๊ณ-์์น์ ํด์
๐ ํ๋ณธ ๋น์จ๋ ์ผ์ข ์ ํ๋ณธ ํ๊ท ์ ๋๋ค! (์ค์) ์ด์์ (Outlier) ๋ฐ์ ๋์ฌ์ ธ์๋, ๋ฉ๋ฆฌ ๋จ์ด์ ธ์๋ ๋ช ๊ฐ์ ์ ! ํ ๋๊ฐ๊ฐ ์ ๋ฐ์ ์๋ค? ์ค์ฌ ์์น๊ฐ ์ค์ฑ ์ฌ๋ผ์จ๋ค! ํ๊ท ๊ฐ์ ์ด์์ (Outlier)์ ๋ก๋ฒ์คํธ(robust)ํ์ง ์๋๋ค! 8๋ช ์ ํ๊ท ์ ๊ตฌํ๋ฉด, ํ๊ท ์ด 227.5๊ฐ ๋์ค๋๋ฐ ์ด ๊ฒฝ์ฐ 6๋ช ์ด ํ๊ท ์ดํ๊ฐ ๋๋ค?? -> ํ๊ท ์ด ์ค์ฌ์์น๋ก ๊ณผ์ฐ ์ ์ ํ๊ฐ์ ๋ํ ์๋ฌธ์ ํ๊ฒ ๋จ. ๐ ์ด์์ (outlier)์ ๋ก๋ฒ์คํธ(robust)ํ 'ํ๋ณธ์ค์๊ฐ' but ์๋ฃ์ ์ ๋ณด๋ฅผ ์ ๋ถ ํ์ฉํ์ง ๋ชปํ๋ค๋ ๋จ์ ์ด ์๋ค ๋ง์ด ๋ฐ๋ ๊ทธ๋ฃน ์ฌ๋ ์๊ฐ ๋ง์์ ธ์ ๋ง์ด ๋ฐ๋ ๊ฒ์ฒ๋ผ ๋ณด์ผ ๋ฟ.. ์ ์ฒด์ ๊ฒฐ๊ณผ์ ๋ถ๋ถ์ ๊ฒฐ๊ณผ๊ฐ ์๋ฐ๋๋ค? = ์ฌ์จ์ ์ญ์ค ์ ์ด๋ฐ์ผ์ด ๋ฐ์ํ์๊น? ๐ ์๋ผ๋ด๋ ํ๊ท , ์ ์ฌํ๊ท ์์๋ผ์ด์ด ์ํฅ..
2020.08.31 -
[๊ธฐ์ดํต๊ณํ 2๊ฐ] ๊ธฐ์ ํต๊ณ(Descriptive Statistics)
*์ด ๊ธ์ KOCW์์ ์ ๊ณตํ๋ ์ฌ์ธ๊ถ ๊ต์๋์ ๊ธฐ์ดํต๊ณํ ๊ฐ์ข๋ฅผ ์๊ฐํ๋ฉฐ ํ์ตํ ๋ด์ฉ์ ๋๋ค. ์ค๋์ ํ์ต ๋ด์ฉ : (๋ชจ์ง๋จ์์ ์ ์ ํ ํ๋ณธ์ ์ป์์ ๋) ์ด ํ๋ณธ์ ์ด๋ป๊ฒ ํ์ ํ๊ณ ์ ๋ฆฌํ ๊ฒ์ธ๊ฐ? ํต๊ณ๋ถ์์ ํ ๋, ํ๋ณธ์ ์์ฑ๊ณผ ๋ถ์ํ๊ณ ์ ํ๋ ๋ชฉ์ ์ ๋ง๊ฒ ๋ถ์ ๋ฐฉ๋ฒ์ ํํด์ผ ํ๋ค. ๋ฒ์ฃผํ ์๋ฃ: ์ ์ ์๋ ์๋ฃ (๋จ์/์ฌ์ ๋ฑ) ์์นํ ์๋ฃ: ์๋ก ํํ๋๋ ์๋ฃ (๋น)๋์๋ถํฌํ : ๊ทธ ๋ฒ์ฃผ์ ๊ด์ธก๊ฐ์ฒด๊ฐ ๋ช ๊ฐ๊ฐ ์์ต๋๊น? ํ๋ก ๋ณด์ฌ์ฃผ๋ฉด ๋ค ์กธ์์ ๊ทธ๋์ ๊ทธ๋ฆผ์ ๊ทธ๋ฆฝ๋๋ค. ์ฑ 1000ํ์ด์ง๋ณด๋ค ํ๋์ ๊ทธ๋ฆผ์ด ๋์ ๋๊ฐ ์๋ค ์๋๋์ * 360 = ํด๋น ๋ฒ์ฃผ์ ๊ฐ๋ ๋จ์ ) ํ์ด์ ํฌ๊ธฐ๊ฐ ํ ๋์ ํ ๋ค์ด์ค์ง ์๋๋ค! ์์๋๊น ์ฌ์ฉํ๋ค. ๋น๊ตํ ๋๋ ์ ์ ์ด๋ค. ๋ถ์์ด ์๋๋ผ ์ง๋ณ์ด ๋ ๋ง์ ์ฌ๋ง์ ..
2020.08.30 -
[๊ธฐ์ดํต๊ณํ 1๊ฐ] ๋ชจ์ง๋จ๊ณผ ํ๋ณธ
* ์ด ๊ธ์ KOCW์์ ์ ๊ณต์ค์ธ ์ฌ์ธ๊ถ ๊ต์๋์ '๊ธฐ์ดํต๊ณํ' ๊ฐ์ ํ์ต๋ด์ฉ์ ๋๋ค. ๊ธฐ์ดํต๊ณํ1 - ํต๊ณํ์ด๋? - ๊ธฐ์ ํต๊ณ - ํ๋ฅ - ํ๋ฅ ๋ณ์์ ํ๋ฅ ๋ถํฌ - ํ์ง๋ถํฌ ํต๊ณ๋ฅผ ์ํ๋ ค๋ฉด? ๋ชจ์ง๋จ๊ณผ ํ๋ณธ์ ์ ์ดํดํด์ผ ํ๋ค. ๋นํธ๋ฐ์ค ์ ํ๋ ค๋ฉด ๋ถ์น๊ธฐ, ๋ฐ์น๊ธฐ๋ฅผ ์์์ผ ํ๊ณ , ํต๊ณ๋ฅผ ์ํ๋ ค๋ฉด ๋ชจ์ง๋จ๊ณผ ํ๋ณธ์ ์ ์ดํดํด์ผ ํจ. (์) ์กฐ์ ์๋ ์๊ธ ์๋ช ์ ์ ์ ์กฐ์ฌ๊ฐ ๊ฐ๋ฅํ๋ค. (๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ์ป์ ์ ์๋ค.) ๊ทธ๋ฌ๋ ๋ด์์ ํ๊ท ์๋ช ์ ์๋ ค๋ฉด ์ด๋ป๊ฒ ํด์ ํ ๊น? ์ด ๊ฒฝ์ฐ ์ ์์กฐ์ฌ๊ฐ ๋ถ๊ฐํ๋ค. ์ด ๊ฒฝ์ฐ, ๋์ ๊ด์ฌ์ "์ ์ฒด ๋ด์ ์๋ช "์ ์๊ณ , (๋ชจ์ง๋จ) ๋ด๊ฐ ๊ฐ์ง ๋ฐ์ดํฐ๋ "81๋ช ๋ด์์ ์๋ช ๋ฐ์ดํฐ"๋ฟ์ด๋ค. (ํ๋ณธ) Q/P(Question/Problem) ๊ณผ์ฐ 81๋ช ์ ์ ์ฒด ๋ด์๋ฅผ ๋ํํ ์ ์์๊น? ..
2020.08.30