Learning archive/Data Science(20)
-
์ง์ญํํ ๋ฐ์ดํฐ ์๊ฐํ
๋ณดํธ๋์ด ์๋ ๊ธ์ ๋๋ค.
2020.12.21 -
๐ R ๊ธฐ์ด | ๋ฒกํฐ ๋ง๋ค๊ธฐ, ๋ค์ด๋ฐ, ๋ฒกํฐ ์ฐ์ฐ, ํน์ ์์ ์ ํํ๊ธฐ
๐R์ ๋ฐ์ดํฐ ๊ตฌ์กฐ R์์ ์ ๊ณตํ๋ ๋ฐ์ดํฐ ๊ตฌ์กฐ๋ ๋ฒกํฐ, ๋งคํธ๋ฆญ์ค, ๋ฐฐ์ด, ๋ฐ์ดํฐํ๋ ์, ๋ฆฌ์คํธ๊ฐ ์๋ค. ๐ ๋ฒกํฐ ๋ง๋ค๊ธฐ #๋ฒกํฐ๋, ํ๋ ํน์ ํ๋์ด์์ ์์๋ฅผ ๊ฐ์ง ์ ์๋ ๋ฐ์ดํฐ ๊ตฌ์กฐ ํํ์ด๋ค. #ํ๋์ ๋ฒกํฐ๋ ๋์ผํ ์๋ฃํ์ ์ ๊ฐ์ ธ์ผ ํ๋ค. vector
2020.09.12 -
๐Matplotlib ์๊ณ์ด ๋ฐ์ดํฐ ์๊ฐํ ๊ธฐ์ด Plotting time-series data
Image credits : datacamp.com CONTENTS 1. ์๊ณ์ด ๋ฐ์ดํฐ ์๊ฐํ (Plotting time-series data) 2. ์๊ณ์ด ์ ์๋ก ๋ค๋ฅธ ๋ณ์ ์๊ฐํ (Plotting time-series data with different variables) 3. ๊ทธ๋ํ์ ํน์ ๋ถ๋ถ ๊ฐ์กฐํ๊ธฐ : ํ ์คํธ, ํ์ดํ Annotating time-series data ๐ ์ค๋์ ๋ชฉํ ๊ทธ๋ํ! ๐์๊ณ์ด ๋ฐ์ดํฐ Time series data ๐์์ ์ฐ์ต : Read data with a time index To designate the index as a DateTimeIndex, you will use the parse_dates and index_col key-word arguments bot..
2020.09.12 -
๐ Matplotlib ๋ฐ์ดํฐ ์๊ฐํ | ๊ทธ๋ํ ๋ง์ปค, ๋ผ์ธ์คํ์ผ, ์ปฌ๋ฌ ์ง์ | Small multiples : ๋ค์์ ๊ทธ๋ํ ๊ทธ๋ฆฌ๊ธฐ
๐๋ฐ์ดํฐ ์๊ฐํ, Matplotlib ๋ฐ์ดํฐ ์๊ฐํ๋ ๋ฐ์ดํฐ ๋ถ์ ๊ณผ์ ์์ ๋งค์ฐ ์ค์ํ ๋ถ๋ถ์ด๋ค. ํ๋ก์ ํธ ์ด๊ธฐ ๋จ๊ณ ๋๋ ๋ฆฌํฌํ ๋จ๊ณ์์ ํ์์ ๋ฐ์ดํฐ ๋ถ์(EDA)์ ์ผํ์ผ๋ก์, ๊ฒฐ๊ณผ๋ฅผ ๋ค๋ฅธ ์ฌ๋๊ณผ ๊ณต์ ํ ๋ ์ ์ฉํ๋ค. ๋ํ ๋ฐ์ดํฐ๋ฅผ ์๊ฐํํ๋ฉด ๋ณ์ ๊ฐ์ ๋ถํฌ๋ ๋ณ์ ์ฌ์ด์ ๊ด๊ณ๋ฅผ ํ์ธํ๊ณ ๋ชจ๋ธ๋ง์ ์ํ ๊ฐ์ค์ ๋์ถํ๋ ๋ฐ์๋ ๋์์ด ๋๋ค. Matplotlib์ ๊ณ ํ์ง์ ๊ทธ๋ํ๋ฅผ ๋ง๋ค๊ธฐ ์ํ ๋ชฉ์ ์ ํจํค์ง์ด๋ค. ๋ง๋ ๊ทธ๋ํ, ์์๊ทธ๋ฆผ, ์ ๊ทธ๋ํ, ์ฐ์ ๋, ํ์คํ ๊ทธ๋จ ๋ฑ ๊ธฐ๋ณธ์ ์ธ ํต๊ณ ๊ทธ๋ํ๋ฅผ ๋ง๋ค ์ ์๊ณ , ๋ฐ์ดํฐ๋ฅผ ์ง๋์ ๋งคํํ๋ basemap ๋ฐ cartopy, ๊ทธ๋ฆฌ๊ณ 3D ๊ทธ๋ํ๋ฅผ ๋ง๋๋ mplot3d๊ฐ์ ๋๊ตฌ๋ ์ ๊ณตํ๋ค. ์ถ์ฒ : 279p. Adding data to axes : plotti..
2020.09.10 -
๐[DataCamp] .merge_ordered() | .merge_asof() | .melt() Course -Joining data with pandas- wrap up
.query() Reshaping data with .melt() arguments : id_vars ๋ณํํ์ง ์์ ์ปฌ๋ผ value_vars ๋ณํ์ ๊ฐํ ์ปฌ๋ผ ๐Practice melting melt()๋ฅผ ํตํด unpivotํด์ผํ๋ ์ด์ : In general, data is often provided (especially by governments) in a format that is easily read by people but not by machines. The .melt() method is a handy tool for reshaping data into a useful form. In the .melt() method, the arguments value_name sets the name f..
2020.09.08 -
๐[DataCamp] Filtering join : semi-join, anti-join
๐ Steps ๐Semi-join ๐anti join example
2020.09.07 -
๐[DataCamp] Pandasํ๋ค์ค : Left Join, Other Joins, Merging a table to itself, Merging on indexes
Right Table์๋ ์์ง๋ง left Table์ ์๋ Row์ Cell์ ํฉ์น์ง ์๊ณ , ๋๋ฝ๋๋ค! ๐Left Join vs. Inner join example ๐How to count number of rows that are missing .isnull().sum() ๐ Right Join Left Join ๐ left_on="", right_on="" ๐ Outer Join ๐Merging a table to itself Merging on indexes
2020.09.07 -
๐[DataCamp] Inner join : Merging tables together
๐Inner join One to many relationships ๐ Merging multiple DataFrames Great job putting your new skills into action. You merged multiple tables with varying relationships and added suffixes to make your column names clearer. Using your skills, you were able t Left join
2020.09.06