๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค 100๋ฒˆ์˜ ๋…ธํฌ(๊ตฌ์กฐํ™” ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌํŽธ) โ€“ R Part 1 (Q1 to Q20)

๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค
์„ค๋ช…:

head(df_receipt, n = 10)์ด๋ผ๋Š” ์ฝ”๋“œ๋Š” df_receipt๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ํ‘œ์‹œํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค.

R์—์„œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์€ ๊ฐ ์—ด์ด ์ˆซ์ž, ๋ฌธ์ž, ์ธ์ž ๋“ฑ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ ํƒ€์ž…์„ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๋Š” ํ‘œ์™€ ๊ฐ™์€ ๊ตฌ์กฐ์ž…๋‹ˆ๋‹ค. ๊ตฌ์กฐํ™”๋œ ํ˜•ํƒœ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๊ณ  ์กฐ์ž‘ํ•˜๊ธฐ ์œ„ํ•ด ์ž์ฃผ ์‚ฌ์šฉ๋œ๋‹ค.

R์˜ head() ํ•จ์ˆ˜๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒซ ๋ช‡ ์ค„์„ ํ‘œ์‹œํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค. ๊ธฐ๋ณธ์ ์œผ๋กœ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 6ํ–‰์ด ํ‘œ์‹œ๋ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ n ์ธ์ˆ˜๋กœ ํ‘œ์‹œํ•  ํ–‰ ์ˆ˜๋ฅผ ์ง€์ •ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด ๊ฒฝ์šฐ n = 10์€ df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10 ์ค„์„ ํ‘œ์‹œํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ ์ด ์ฝ”๋“œ๊ฐ€ ์‹คํ–‰๋˜๋ฉด ์ถœ๋ ฅ์— df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10ํ–‰์ด ํ‘œ์‹œ๋ฉ๋‹ˆ๋‹ค.
ย 
์„ค๋ช…:

head(df_receipt[c("sales_ymd", "customer_id", "product_cd", "amount")], n = 10)์ด๋ผ๋Š” ์ฝ”๋“œ๋Š” df_receipt๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ํ‘œ์‹œํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜์ง€๋งŒ, "sales_ymd", "customer_id", "product_cd", "amount" ์—ด๋งŒ ํ‘œ์‹œํ•ฉ๋‹ˆ๋‹ค. ymd", "customer_id", "product_cd", "amount" ์—ด๋งŒ ํ‘œ์‹œํ•œ๋‹ค.

R์—์„œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์€ ๊ฐ ์—ด์ด ์ˆซ์ž, ๋ฌธ์ž, ์ธ์ž ๋“ฑ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ ํƒ€์ž…์„ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๋Š” ํ…Œ์ด๋ธ”๊ณผ ๊ฐ™์€ ๊ตฌ์กฐ๋‹ค. ๊ตฌ์กฐํ™”๋œ ํ˜•ํƒœ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๊ณ  ์กฐ์ž‘ํ•˜๊ธฐ ์œ„ํ•ด ์ž์ฃผ ์‚ฌ์šฉ๋œ๋‹ค.

R์˜ head() ํ•จ์ˆ˜๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒซ ๋ช‡ ์ค„์„ ํ‘œ์‹œํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ๊ธฐ๋ณธ์ ์œผ๋กœ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 6ํ–‰์ด ํ‘œ์‹œ๋ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ n ์ธ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ‘œ์‹œํ•  ํ–‰ ์ˆ˜๋ฅผ ์ง€์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ด ๊ฒฝ์šฐ df_receipt[c("sales_ymd", "customer_id", "product_cd", "amount")]๋Š” df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•˜์œ„ ์ง‘ํ•ฉ์œผ๋กœ ๋งŒ๋“ค์–ด "sales_ymd", "customer_id", "product _cd", "amount" ์—ด๋งŒ ์„ ํƒํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋ฉฐ, c() ํ•จ์ˆ˜๋Š” ์—ด ์ด๋ฆ„์„ ๋ฒกํ„ฐ๋กœ ์—ฐ๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋œ๋‹ค.

๋”ฐ๋ผ์„œ ์ด ์ฝ”๋“œ๋ฅผ ์‹คํ–‰ํ•˜๋ฉด df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10ํ–‰์ด ์ถœ๋ ฅ๋˜์ง€๋งŒ "sales_ymd", "customer_id", "product_cd", "amount" ์—ด๋งŒ ํ‘œ์‹œ๋œ๋‹ค. ์ด๋Š” ํฐ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ๋‹ค๋ฃฐ ๋•Œ ์—ด์˜ ํ•˜์œ„ ์ง‘ํ•ฉ์—๋งŒ ์ง‘์ค‘ํ•ด์•ผ ํ•  ๋•Œ ์œ ์šฉํ•˜๋‹ค.

ย 

์„ค๋ช…:

head(rename(df_receipt[c("sales_ymd", "customer_id", "product_cd", "amount")], sales_date = sales_ymd), n = 10)์ด๋ผ๋Š” ์ฝ”๋“œ๋Š” df_receipt๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ํ‘œ์‹œํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉํ•˜๋Š”๋ฐ, "sales_ymd", "customer_id", "product_cd", "amount" ์—ด๋งŒ ๋ณด์—ฌ์ฃผ๊ณ  "sales_ymd" ์—ด์„ "sales_date"๋กœ ์ด๋ฆ„์„ ๋ฐ”๊พธ๊ณ  ์žˆ๋‹ค.

R์—์„œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์€ ๊ฐ ์—ด์ด ์ˆซ์ž, ๋ฌธ์ž, ์ธ์ž ๋“ฑ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ ํƒ€์ž…์„ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๋Š” ํ…Œ์ด๋ธ”๊ณผ ๊ฐ™์€ ๊ตฌ์กฐ๋‹ค. ๊ตฌ์กฐํ™”๋œ ํ˜•ํƒœ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๊ณ  ์กฐ์ž‘ํ•˜๊ธฐ ์œ„ํ•ด ์ž์ฃผ ์‚ฌ์šฉ๋œ๋‹ค.

R์˜ head() ํ•จ์ˆ˜๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ ๋ช‡ ์ค„์„ ํ‘œ์‹œํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค. ๊ธฐ๋ณธ์ ์œผ๋กœ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 6ํ–‰์ด ํ‘œ์‹œ๋ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ธ์ˆ˜ n์œผ๋กœ ํ‘œ์‹œํ•  ํ–‰ ์ˆ˜๋ฅผ ์ง€์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

R์˜ rename() ํ•จ์ˆ˜๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์—ด ์ด๋ฆ„์„ ๋ณ€๊ฒฝํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ์ด ๊ฒฝ์šฐ "sales_ymd"๋ผ๋Š” ์—ด์˜ ์ด๋ฆ„์„ "sales_date"๋กœ ๋ฐ”๊พธ๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

์ด ์ฝ”๋“œ์—์„œ๋Š” df_receipt[c("sales_ymd", "customer_id", "product_cd", "amount")]๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์„œ๋ธŒ์…‹ํ•˜์—ฌ "sales_ymd", "customer_id", " product_cd", "amount" ์—ด๋งŒ ์„ ํƒํ•œ๋‹ค. c() ํ•จ์ˆ˜๋Š” ์—ด ์ด๋ฆ„์„ ๋ฒกํ„ฐ๋กœ ์—ฐ๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋œ๋‹ค.

๋‹ค์Œ์œผ๋กœ rename(data_frame, new_column_name = old_column_name)์ด๋ผ๋Š” ๊ตฌ๋ฌธ์œผ๋กœ, ํ•˜์œ„ ์ง‘ํ•ฉ๋œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์— rename() ํ•จ์ˆ˜๊ฐ€ ์ ์šฉ๋œ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ df_receipt[c("sales_ymd", "customer_id", "product_cd", "amount")]์™€ ๋™์ผํ•œ ํ–‰๊ณผ ์—ด์„ ๊ฐ€์ง„ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ด ๋˜์ง€๋งŒ, "sales_ymd" ์—ด์€ "sales_date"๋กœ ์ด๋ฆ„์ด ๋ณ€๊ฒฝ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ ์ด๋ฆ„์„ ๋ฐ”๊พผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์— head() ํ•จ์ˆ˜๋ฅผ ์ ์šฉํ•˜์—ฌ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ํ‘œ์‹œํ•ฉ๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ ์ด ์ฝ”๋“œ๋ฅผ ์‹คํ–‰ํ•˜๋ฉด ์ถœ๋ ฅ์— df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10ํ–‰์ด ํ‘œ์‹œ๋˜์ง€๋งŒ "sales_date", "customer_id", "product_cd", "amount" ์—ด๋งŒ ํ‘œ์‹œ๋˜๊ณ  "sales_ymd" ์—ด์€ "sales _date"๋กœ ๋ณ€๊ฒฝ๋ฉ๋‹ˆ๋‹ค.

ย 

์„ค๋ช…:

df_receipt[c("sales_ymd", "customer_id", "product_cd", "amount")] %>% filter(customer_id == "CS018205000001")๋ผ๋Š” ์ฝ”๋“œ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์˜ ํ•˜์œ„ ์ง‘ํ•ฉ์œผ๋กœ "sales_ymd" ์—ด๋งŒ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค." "customer_id", "product_cd", "amount"์˜ ์„ธ ๊ฐœ์˜ ์ปฌ๋Ÿผ์„ ๊ฐ€์ง„ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ๋งŒ๋“ค๊ณ  "customer_id" ์ปฌ๋Ÿผ์ด "CS018205000001"๊ณผ ๊ฐ™์€ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•„ํ„ฐ๋งํ•ฉ๋‹ˆ๋‹ค.

R์—์„œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์€ ํ…Œ์ด๋ธ”๊ณผ ๊ฐ™์€ ๊ตฌ์กฐ๋กœ, ๊ฐ ์ปฌ๋Ÿผ์€ ์ˆซ์ž, ๋ฌธ์ž, ์ธ์ž ๋“ฑ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ํƒ€์ž…์„ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๋‹ค. ๊ตฌ์กฐํ™”๋œ ํ˜•ํƒœ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๊ณ  ์กฐ์ž‘ํ•˜๊ธฐ ์œ„ํ•ด ์ž์ฃผ ์‚ฌ์šฉ๋œ๋‹ค.

R์˜ %>% ์—ฐ์‚ฐ์ž๋ฅผ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž๋ผ๊ณ  ํ•˜๋Š”๋ฐ, ์—ฌ๋Ÿฌ ํ•จ์ˆ˜๋ฅผ ์—ฐ์‡„์ ์œผ๋กœ ์—ฐ๊ฒฐํ•˜์—ฌ ํ•˜๋‚˜์˜ ์ˆ˜์‹์œผ๋กœ ๋งŒ๋“œ๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค. ์ด ์˜ˆ์ œ์—์„œ๋Š” df_receipt[c("sales_ymd", "customer_id", "product_cd", "amount")]์˜ ์ถœ๋ ฅ์„ filter() ํ•จ์ˆ˜์— ์ „๋‹ฌํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋œ๋‹ค.

R์˜ filter() ํ•จ์ˆ˜๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ ํŠน์ • ์กฐ๊ฑด์„ ๋งŒ์กฑํ•˜๋Š” ํ–‰์„ ์„ ํƒํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋œ๋‹ค. ์ด ๊ฒฝ์šฐ "customer_id" ์ปฌ๋Ÿผ์ด "CS018205000001"๊ณผ ๊ฐ™์€ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ ์ด ์ฝ”๋“œ๋ฅผ ์‹คํ–‰ํ•˜๋ฉด "sales_ymd", "customer_id", "product_cd", "amount" ์ปฌ๋Ÿผ๋งŒ ํฌํ•จํ•˜๊ณ  "customer_id" ์ปฌ๋Ÿผ์ด "CS018205000001"๊ณผ ๋™์ผํ•œ ํ–‰๋งŒ ํฌํ•จํ•˜๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ๋กœ ์ถœ๋ ฅํ•œ๋‹ค. ์ด๋Š” ํฐ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ๋ถ„์„ํ•  ๋•Œ ํŠน์ • ์กฐ๊ฑด์„ ์ถฉ์กฑํ•˜๋Š” ํ–‰์˜ ํ•˜์œ„ ์ง‘ํ•ฉ์—๋งŒ ์ง‘์ค‘ํ•ด์•ผ ํ•  ๋•Œ ์œ ์šฉํ•˜๋‹ค.
ย 
์„ค๋ช…:

df_receipt[c("sales_ymd", "customer_id", "product_cd", "amount")] %>% filter(customer_id == "CS018205000001" & amount >= 1000) ๋ผ๋Š” ์ฝ”๋“œ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_receipt receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ๋ถ€๋ถ„ ์ง‘ํ•ฉํ™”ํ•˜์—ฌ "sales_ymd" ์—ด๋งŒ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค." customer_id", "product_cd", "amount" ์„ธ ๊ฐœ์˜ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ๋งŒ๋“ค๊ณ  "customer_id" ์—ด์ด "CS018205000001", "amount" ์—ด์ด 1000๊ฐœ ์ด์ƒ์˜ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•„ํ„ฐ๋งํ•œ๋‹ค.

R์—์„œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์€ ํ…Œ์ด๋ธ”๊ณผ ๊ฐ™์€ ๊ตฌ์กฐ๋กœ, ๊ฐ ์—ด์€ ์ˆซ์ž, ๋ฌธ์ž, ์ธ์ž ๋“ฑ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ํƒ€์ž…์„ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๋‹ค. ๊ตฌ์กฐํ™”๋œ ํ˜•ํƒœ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๊ณ  ์กฐ์ž‘ํ•˜๋Š” ๋ฐ ์ž์ฃผ ์‚ฌ์šฉ๋œ๋‹ค.

R์˜ %>% ์—ฐ์‚ฐ์ž๋ฅผ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž๋ผ๊ณ  ํ•˜๋Š”๋ฐ, ์—ฌ๋Ÿฌ ํ•จ์ˆ˜๋ฅผ ์—ฐ์‡„์ ์œผ๋กœ ์—ฐ๊ฒฐํ•˜์—ฌ ํ•˜๋‚˜์˜ ์ˆ˜์‹์œผ๋กœ ๋งŒ๋“œ๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค. ์ด ์˜ˆ์ œ์—์„œ๋Š” df_receipt[c("sales_ymd", "customer_id", "product_cd", "amount")]์˜ ์ถœ๋ ฅ์„ filter() ํ•จ์ˆ˜์— ์ „๋‹ฌํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉํ•˜๊ณ  ์žˆ๋‹ค.

R์˜ filter() ํ•จ์ˆ˜๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ ํŠน์ • ์กฐ๊ฑด์„ ๋งŒ์กฑํ•˜๋Š” ํ–‰์„ ์„ ํƒํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋œ๋‹ค. ์ด ๊ฒฝ์šฐ "customer_id" ์—ด์ด "CS018205000001"๊ณผ ๊ฐ™๊ณ  "amount" ์—ด์ด 1000๊ฐœ ์ด์ƒ์˜ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋ฉฐ, ๋‘ ์กฐ๊ฑด์„ ๊ฒฐํ•ฉํ•˜๊ธฐ ์œ„ํ•ด & ์—ฐ์‚ฐ์ž๊ฐ€ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ ์ด ์ฝ”๋“œ๋ฅผ ์‹คํ–‰ํ•˜๋ฉด "sales_ymd", "customer_id", "product_cd", "amount" ์—ด๋งŒ ํฌํ•จ๋œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ด ์ถœ๋ ฅ๋˜๋ฉฐ, "customer_id" ์—ด์ด "CS018205000001"๊ณผ ๊ฐ™๊ณ  "CS018205000001", "amount" ์—ด์ด 1000๊ฐœ ์ด์ƒ์˜ ํ–‰์„ ํฌํ•จํ•˜๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ด ์ถœ๋ ฅ๋œ๋‹ค. amount" ์ปฌ๋Ÿผ์ด 1000๊ฐœ ์ด์ƒ์ธ ํ–‰๋งŒ ํฌํ•จ๋œ๋‹ค. ์ด๋Š” ํฐ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ๋ถ„์„ํ•  ๋•Œ ํŠน์ • ์กฐ๊ฑด์„ ์ถฉ์กฑํ•˜๋Š” ํ–‰์˜ ํ•˜์œ„ ์ง‘ํ•ฉ์—๋งŒ ์ง‘์ค‘ํ•ด์•ผ ํ•  ๋•Œ ์œ ์šฉํ•˜๋‹ค.
ย 
์„ค๋ช…:

df_receipt[c("sales_ymd", "customer_id", "product_cd", "quantity", "amount")] %>% filter(customer_id == "CS018205000001" & (amount >= 1000 | quantity >= 5))๋ผ๋Š” ์ฝ”๋“œ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ๋ถ€๋ถ„ ์ง‘ํ•ฉํ™”ํ•˜์—ฌ "sales_ymd", "customer_id", "product_cd" ์—ด๋งŒ ์„ ํƒํ•œ๋‹ค." "quantity", "amount", "customer_id" ์—ด์ด "CS018205000001"๊ณผ ๊ฐ™๊ณ  "amount" ์—ด์ด 1000 ์ด์ƒ์ด๊ฑฐ๋‚˜ "quantity" ์—ด์ด 5 ์ด์ƒ์ธ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•„ํ„ฐ๋งํ•ฉ๋‹ˆ๋‹ค.

R์—์„œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์€ ๊ฐ ์—ด์ด ์ˆซ์ž, ๋ฌธ์ž, ์ธ์ž ๋“ฑ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ ํƒ€์ž…์„ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๋Š” ํ‘œ์™€ ๊ฐ™์€ ๊ตฌ์กฐ์ด๋‹ค. ๊ตฌ์กฐํ™”๋œ ํ˜•์‹์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๊ณ  ์กฐ์ž‘ํ•˜๊ธฐ ์œ„ํ•ด ์ž์ฃผ ์‚ฌ์šฉ๋œ๋‹ค.

R์˜ %>% ์—ฐ์‚ฐ์ž๋ฅผ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž๋ผ๊ณ  ํ•˜๋Š”๋ฐ, ์—ฌ๋Ÿฌ ํ•จ์ˆ˜๋ฅผ ์—ฐ์‡„์ ์œผ๋กœ ์—ฐ๊ฒฐํ•˜์—ฌ ํ•˜๋‚˜์˜ ์ˆ˜์‹์œผ๋กœ ๋งŒ๋“œ๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค. ์ด ์˜ˆ์ œ์—์„œ๋Š” df_receipt[c("sales_ymd", "customer_id", "product_cd", "quantity", "amount")]์˜ ์ถœ๋ ฅ์„ filter() ํ•จ์ˆ˜์— ์ „๋‹ฌํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋œ๋‹ค.

R์˜ filter() ํ•จ์ˆ˜๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ ํŠน์ • ์กฐ๊ฑด์„ ๋งŒ์กฑํ•˜๋Š” ํ–‰์„ ์„ ํƒํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋œ๋‹ค. ์ด ๊ฒฝ์šฐ "customer_id" ์ปฌ๋Ÿผ์ด "CS018205000001"๊ณผ ๊ฐ™๊ณ  "amount" ์ปฌ๋Ÿผ์ด 1000 ์ด์ƒ ๋˜๋Š” "quantity" ์ปฌ๋Ÿผ์ด 5 ์ด์ƒ์ธ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค. ์—๋Š” & ์—ฐ์‚ฐ์ž๊ฐ€, OR ์กฐ๊ฑด์„ ์ง€์ •ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” | ์—ฐ์‚ฐ์ž๊ฐ€ ์‚ฌ์šฉ๋œ๋‹ค.

๋”ฐ๋ผ์„œ ์ด ์ฝ”๋“œ๋ฅผ ์‹คํ–‰ํ•˜๋ฉด 'sales_ymd', 'customer_id', 'product_cd', 'quantity', 'amount' ์—ด๋งŒ ํฌํ•จ๋œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ด ์ถœ๋ ฅ๋˜๋ฉฐ, 'customer_id' ์—ด์ด 'CS018205000001'๊ณผ ๊ฐ™๊ณ  'cs018205000001', 'product_cd', 'quantity', 'amount' ์—ด์ด umount' ์—ด์ด 1000๊ฐœ ์ด์ƒ ๋˜๋Š” 'quantity' ์—ด์ด 5๊ฐœ ์ด์ƒ์ธ ํ–‰๋งŒ ํฌํ•จ๋œ๋‹ค. ์ด๋Š” ํฐ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ๋ถ„์„ํ•  ๋•Œ ํŠน์ • ์กฐ๊ฑด์„ ์ถฉ์กฑํ•˜๋Š” ํ–‰์˜ ํ•˜์œ„ ์ง‘ํ•ฉ์—๋งŒ ์ง‘์ค‘ํ•ด์•ผ ํ•  ๋•Œ ์œ ์šฉํ•˜๋‹ค.
ย 
์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” R์˜ dplyr ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_receipt๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์กฐ์ž‘ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” ์ฝ”๋“œ์˜ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.

df_receipt[c("sales_ymd", "customer_id", "product_cd", "amount")]: df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ "sales_ymd", "customer_id", "product_cd", " amount" ์ปฌ๋Ÿผ๋งŒ ํฌํ•จํ•˜๋„๋ก ์„œ๋ธŒ์…‹์„ ์„ค์ •ํ•œ๋‹ค.

%>%: dplyr์˜ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž๋กœ, ์—ฌ๋Ÿฌ ๋ฐ์ดํ„ฐ ์กฐ์ž‘ ํ•จ์ˆ˜๋ฅผ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

filter(customer_id == "CS018205000001" & between(amount, 1000, 2000)): ๊ณ ๊ฐ ID๊ฐ€ "CS018205000001"์ด๊ณ  ๊ธˆ์•ก์ด 1000์—์„œ 2000 ์‚ฌ์ด์˜ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•ฉ๋‹ˆ๋‹ค. ํ•„ํ„ฐ๋งํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ฆ‰, ์ด ์ฝ”๋“œ๋Š” df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์„œ๋ธŒ์…‹ํ•˜์—ฌ "sales_ymd", "customer_id", "product_cd", "amount" ์—ด๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•˜๊ณ , ์–ป์–ด์ง„ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ๊ณ ๊ฐ ID๊ฐ€ "CS018205000001"์ด๊ณ  ๊ธˆ์•ก์ด 1000์—์„œ 2000๊นŒ์ง€์˜ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•„ํ„ฐ๋งํ•œ ๊ฒƒ์ด๋‹ค.
ย 
์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” R์˜ dplyr ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_receipt๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์กฐ์ž‘ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” ์ฝ”๋“œ์˜ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.

df_receipt[c("sales_ymd", "customer_id", "product_cd", "amount")]: df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ "sales_ymd", "customer_id", "product_cd", " amount" ์ปฌ๋Ÿผ๋งŒ ํฌํ•จํ•˜๋„๋ก ์„œ๋ธŒ์…‹์„ ์„ค์ •ํ•œ๋‹ค.

%>%: dplyr์˜ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž๋กœ, ์—ฌ๋Ÿฌ ๋ฐ์ดํ„ฐ ์กฐ์ž‘ ํ•จ์ˆ˜๋ฅผ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

filter(customer_id == "CS018205000001" & product_cd ! = "P071401019"): ๊ณ ๊ฐ ID๊ฐ€ "CS018205000001"์ด๊ณ  ์ƒํ’ˆ ์ฝ”๋“œ๊ฐ€ "P0714019"์™€ ๊ฐ™์ง€ ์•Š์€ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜๊ณ  ์žˆ๋‹ค.

์ฆ‰, ์ด ์ฝ”๋“œ๋Š” df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•˜์œ„ ์ง‘ํ•ฉํ™”ํ•˜์—ฌ "sales_ymd", "customer_id", "product_cd", "amount" ์—ด๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•„ํ„ฐ๋งํ•˜์—ฌ ์–ป์€ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ๊ณ ๊ฐ ID๊ฐ€ "CS0182050001"์ด๊ณ  ์ƒํ’ˆ ์ฝ”๋“œ๊ฐ€ "P0714019"์ธ ์ƒํ’ˆ ์ฝ”๋“œ๊ฐ€ "P0714019"์™€ ๊ฐ™์ง€ ์•Š์€ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•„ํ„ฐ๋งํ•˜๋Š” ๊ฒƒ์ด๋‹ค.
ย 
์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” R์˜ dplyr ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_store๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์กฐ์ž‘ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” ์ฝ”๋“œ์˜ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.

%>%: dplyr์˜ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž๋กœ ์—ฌ๋Ÿฌ ๋ฐ์ดํ„ฐ ์กฐ์ž‘ ํ•จ์ˆ˜๋ฅผ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

filter(prefecture_cd ! = "13" & floor_area <= 900): ํ˜„ ์ฝ”๋“œ๊ฐ€ "13"์ด ์•„๋‹ˆ๊ณ  ๋ฐ”๋‹ฅ ๋ฉด์ ์ด 900 ์ดํ•˜์ธ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜๊ณ  ์žˆ๋‹ค.

์ฆ‰, ์ด ์ฝ”๋“œ๋Š” df_store ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜์—ฌ ๋„๋„๋ถ€ํ˜„ ์ฝ”๋“œ๊ฐ€ "13"์ด ์•„๋‹Œ ๋ฐ”๋‹ฅ ๋ฉด์ ์ด 900 ์ดํ•˜์ธ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•„ํ„ฐ๋งํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
ย 
์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” R์˜ dplyr ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_store๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์กฐ์ž‘ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” ์ฝ”๋“œ์˜ ๋‚ด์šฉ์„ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.

df_store์ž…๋‹ˆ๋‹ค. ์ด๊ฒƒ์€ ์‚ฌ์šฉ ์ค‘์ธ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ž…๋‹ˆ๋‹ค.

%>%: dplyr์˜ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž๋กœ ์—ฌ๋Ÿฌ ๋ฐ์ดํ„ฐ ์กฐ์ž‘ ํ•จ์ˆ˜๋ฅผ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

filter(startsWith(store_cd, "S14")): store_cd ์—ด์ด "S14"๋กœ ์‹œ์ž‘ํ•˜๋Š” ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜๊ณ  ์žˆ๋‹ค.

head(. , n = 10): head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ฆ‰, ์ด ์ฝ”๋“œ๋Š” df_store ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜์—ฌ store_cd ์—ด์ด "S14"๋กœ ์‹œ์ž‘ํ•˜๋Š” ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•„ํ„ฐ๋งํ•˜๊ณ  head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

ย 

์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” R์˜ dplyr ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_customer๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์กฐ์ž‘ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” ์ฝ”๋“œ์˜ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.

df_customer: df_customer: ์‚ฌ์šฉ ์ค‘์ธ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ž…๋‹ˆ๋‹ค.

dplyr: dplyr์˜ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž์ด๋ฉฐ, ์—ฌ๋Ÿฌ ๋ฐ์ดํ„ฐ ์กฐ์ž‘ ํ•จ์ˆ˜๋ฅผ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

filter(endsWith(customer_id, "1")): customer_id ์—ด์˜ ๋์ด "1"์ธ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•œ๋‹ค.

head(. , n = 10): head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ฆ‰, ์ด ์ฝ”๋“œ๋Š” df_customer ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜์—ฌ customer_id ์ปฌ๋Ÿผ์ด "1"๋กœ ๋๋‚˜๋Š” ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•„ํ„ฐ๋งํ•˜๊ณ , head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.
ย 
์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” R์˜ dplyr ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_store๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์กฐ์ž‘ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” ์ฝ”๋“œ์˜ ๋‚ด์šฉ์„ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.

df_store์ž…๋‹ˆ๋‹ค. ์ด๊ฒƒ์€ ์‚ฌ์šฉ ์ค‘์ธ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ž…๋‹ˆ๋‹ค.

%>%: dplyr์˜ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž๋กœ ์—ฌ๋Ÿฌ ๋ฐ์ดํ„ฐ ์กฐ์ž‘ ํ•จ์ˆ˜๋ฅผ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

filter(grepl("์š”์ฝ”ํ•˜๋งˆ์‹œ", address)): ์ฃผ์†Œ๋ž€์— '์š”์ฝ”ํ•˜๋งˆ์‹œ'๋ผ๋Š” ๋ฌธ์ž์—ด์ด ํฌํ•จ๋œ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, grepl() ํ•จ์ˆ˜๋Š” address ์—ด์˜ ๊ฐ ์š”์†Œ์— '์š”์ฝ”ํ•˜๋งˆ์‹œ'๋ผ๋Š” ํŒจํ„ด์ด ์žˆ๋Š”์ง€ ์—ฌ๋ถ€๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๋…ผ๋ฆฌ ๋ฒกํ„ฐ๋ฅผ ๋ฐ˜ํ™˜ํ•ฉ๋‹ˆ๋‹ค.

์ฆ‰, ์ด ์ฝ”๋“œ๋Š” df_store ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜์—ฌ ์ฃผ์†Œ ์—ด์— "์š”์ฝ”ํ•˜๋งˆ์‹œ"๋ผ๋Š” ๋ฌธ์ž์—ด์ด ํฌํ•จ๋œ ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.
ย 
์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” R์˜ dplyr ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_customer๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์กฐ์ž‘ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” ์ฝ”๋“œ์˜ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.

df_customer: df_customer: ์‚ฌ์šฉ ์ค‘์ธ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ž…๋‹ˆ๋‹ค.

%>%: dplyr์˜ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž์ด๋ฉฐ, ์—ฌ๋Ÿฌ ๋ฐ์ดํ„ฐ ์กฐ์ž‘ ํ•จ์ˆ˜๋ฅผ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

filter(grepl("^[A-F]", status_cd)): status_cd ์—ด์ด A, B, C, D, E, F ๋ฌธ์ž๋กœ ์‹œ์ž‘ํ•˜๋Š” ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜๊ณ , grepl() ํ•จ์ˆ˜๋Š” ์ •๊ทœ์‹ "^[A-F]"๊ฐ€ status_cd ์—ด์˜ ๊ฐ ์š”์†Œ์™€ ์ผ์น˜ํ•˜๋Š”์ง€ ์—ฌ๋ถ€๋ฅผ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. ์˜ ๊ฐ ์š”์†Œ์™€ ์ผ์น˜ํ•˜๋Š”์ง€ ์—ฌ๋ถ€๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๋…ผ๋ฆฌ ๋ฒกํ„ฐ๋ฅผ ๋ฐ˜ํ™˜ํ•œ๋‹ค. ์ •๊ทœ ํ‘œํ˜„์‹ "^[A-F]"๋Š” A, B, C, D, E ๋˜๋Š” F๋กœ ์‹œ์ž‘ํ•˜๋Š” ๋ชจ๋“  ๋ฌธ์ž์—ด๊ณผ ์ผ์น˜ํ•œ๋‹ค.

head(. , n = 10): ์ด๊ฒƒ์€ head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10 ์ค„์„ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค.

์ฆ‰, ์ด ์ฝ”๋“œ๋Š” df_customer ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜์—ฌ status_cd ์—ด์ด A, B, C, D, E, F๋กœ ์‹œ์ž‘ํ•˜๋Š” ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•˜๊ณ  head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•œ๋‹ค.
ย 
์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” R์˜ dplyr ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_customer๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์กฐ์ž‘ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” ์ฝ”๋“œ์˜ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.

df_customer: ์‚ฌ์šฉ ์ค‘์ธ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ž…๋‹ˆ๋‹ค.

%>%: dplyr์˜ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž๋กœ ์—ฌ๋Ÿฌ ๋ฐ์ดํ„ฐ ์กฐ์ž‘ ํ•จ์ˆ˜๋ฅผ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

filter(grepl("[1-9]$", status_cd)): status_cd ์—ด์˜ ๋์ด 1-9 ์ˆซ์ž๋กœ ๋๋‚˜๋Š” ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜๊ณ , grepl() ํ•จ์ˆ˜๋Š” ์ •๊ทœ ํ‘œํ˜„์‹ "[1-9]$"๊ฐ€ status_cd ์—ด์˜ ๊ฐ ์š”์†Œ์™€ ์ผ์น˜ํ•˜๋Š”์ง€ ์—ฌ๋ถ€๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๋…ผ๋ฆฌ ๋ฒกํ„ฐ๋ฅผ ๋ฐ˜ํ™˜ํ•œ๋‹ค. ์ •๊ทœ ํ‘œํ˜„์‹ "[1-9]$"๋Š” 1~9๋กœ ๋๋‚˜๋Š” ๋ฌธ์ž์—ด๊ณผ ์ผ์น˜ํ•œ๋‹ค.

head(. , n = 10)์„ ์‚ฌ์šฉํ•œ๋‹ค. ์ด๊ฒƒ์€ head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10์ค„์„ ์„ ํƒํ•˜๊ณ  ์žˆ๋‹ค.

์ฆ‰, ์ด ์ฝ”๋“œ๋Š” df_customer ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜์—ฌ status_cd ์—ด์˜ ๋์ด 1-9 ์ˆซ์ž๋กœ ๋๋‚˜๋Š” ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•˜๊ณ  head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ์ด๋‹ค.
ย 
์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” R์˜ dplyr ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_customer๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์กฐ์ž‘ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” ์ฝ”๋“œ์˜ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.

df_customer: ์‚ฌ์šฉ ์ค‘์ธ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ž…๋‹ˆ๋‹ค.

%>%: dplyr์˜ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž๋กœ ์—ฌ๋Ÿฌ ๋ฐ์ดํ„ฐ ์กฐ์ž‘ ํ•จ์ˆ˜๋ฅผ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

filter(grepl("^[A-F]. *[1-9]$", status_cd)): status_cd ์—ด์ด A, B, C, D, E, F ์ค‘ ํ•˜๋‚˜์˜ ๋ฌธ์ž๋กœ ์‹œ์ž‘ํ•˜๊ณ  1-9์˜ ์ˆซ์ž๋กœ ๋๋‚˜๋Š” ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜๋Š” ํ•จ์ˆ˜๋กœ, grepl() ํ•จ์ˆ˜๋Š” ์ •๊ทœ์‹ "^[A-F]. [1-9]$"๊ฐ€ status_cd ์—ด์˜ ๊ฐ ์š”์†Œ์™€ ์ผ์น˜ํ•˜๋Š”์ง€ ์—ฌ๋ถ€๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๋…ผ๋ฆฌ ๋ฒกํ„ฐ๋ฅผ ๋ฐ˜ํ™˜ํ•œ๋‹ค. ์ •๊ทœ ํ‘œํ˜„์‹ "^[A-F]. [1-9]$"๋Š” ๋ฌธ์ž A, B, C, D, E, F๋กœ ์‹œ์ž‘ํ•˜๊ณ  0 ์ด์ƒ์˜ ์ž„์˜์˜ ์œ ํ˜•์ด ์ด์–ด์ง€๋ฉฐ 1๋ถ€ํ„ฐ 9๊นŒ์ง€์˜ ์ˆซ์ž๋กœ ๋๋‚˜๋Š” ๋ฌธ์ž์—ด๊ณผ ์ผ์น˜ํ•œ๋‹ค.

head(. , n = 10): ์ด๊ฒƒ์€ head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10 ์ค„์„ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค.

์ฆ‰, ์ด ์ฝ”๋“œ๋Š” df_customer ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜์—ฌ status_cd ์—ด์ด A, B, C, D, D, E ๋˜๋Š” F ๋ฌธ์ž๋กœ ์‹œ์ž‘ํ•˜๊ณ  1-9 ์ˆซ์ž๋กœ ๋๋‚˜๋Š” ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•„ํ„ฐ๋งํ•˜๊ณ  head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•œ๋‹ค. ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.
ย 
์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” R์˜ dplyr ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ df_store๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์กฐ์ž‘ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” ์ฝ”๋“œ์˜ ๋‚ด์šฉ์„ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.

df_store : ์‚ฌ์šฉ ์ค‘์ธ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ž…๋‹ˆ๋‹ค.

%>% : dplyr์˜ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž์ด๋ฉฐ, ์—ฌ๋Ÿฌ ๋ฐ์ดํ„ฐ ์กฐ์ž‘ ํ•จ์ˆ˜๋ฅผ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

filter(grepl("^[0-9]{3}-[0-9]{3}-[0-9]{3}-[0-9]{4}$", tel_no)): tel_no ์—ด์ด ํŠน์ • ์ „ํ™”๋ฒˆํ˜ธ ํ˜•์‹๊ณผ ์ผ์น˜ํ•˜๋Š” ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜๋Š” ํ•จ์ˆ˜์ž…๋‹ˆ๋‹ค. -9]{3}-[0-9]{3}-[0-9]{3}-[0-9]{4}$"๊ฐ€ tel_no ์—ด์˜ ๊ฐ ์š”์†Œ์™€ ์ผ์น˜ํ•˜๋Š”์ง€ ์—ฌ๋ถ€๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๋…ผ๋ฆฌ ๋ฒกํ„ฐ๋ฅผ ๋ฐ˜ํ™˜ํ•œ๋‹ค. ์ •๊ทœ์‹ "^[0-9]{3}-[0-9]{3}-[0-9]{3}-[0-9]{4}$"๋Š” 3์ž๋ฆฌ, ํ•˜์ดํ”ˆ, 3์ž๋ฆฌ, ํ•˜์ดํ”ˆ, ๋งˆ์ง€๋ง‰์œผ๋กœ 4์ž๋ฆฌ๋กœ ๊ตฌ์„ฑ๋œ ๋ฌธ์ž์—ด๊ณผ ์ผ์น˜ํ•œ๋‹ค.

head(.) : ์ด๊ฒƒ์€ head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 6์ค„์„ ์„ ํƒํ•˜๊ณ  ์žˆ๋‹ค.

์ฆ‰, ์ด ์ฝ”๋“œ๋Š” df_store ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜์—ฌ tel_no ์—ด์ด ํŠน์ • ์ „ํ™” ๋ฒˆํ˜ธ ํ˜•์‹๊ณผ ์ผ์น˜ํ•˜๋Š” ํ–‰๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•˜๊ณ  head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒซ ๋ฒˆ์งธ 6ํ–‰๋งŒ ์„ ํƒํ•œ๋‹ค.
ย 
์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” df_customer ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ birth_day ์—ด๋กœ ์˜ค๋ฆ„์ฐจ์ˆœ์œผ๋กœ ์ •๋ ฌํ•˜๊ณ  head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” ์ฝ”๋“œ์˜ ๋‚ด์šฉ์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

df_customer: ์‚ฌ์šฉ ์ค‘์ธ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ž…๋‹ˆ๋‹ค.

[order(df_customer$birth_day),] : df_customer ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์„œ๋ธŒ์…‹ํ•˜์—ฌ ๋ชจ๋“  ์—ด์„ ํฌํ•จํ•˜๋„๋ก ํ•˜๊ณ , birth_day ์—ด์˜ ์˜ค๋ฆ„์ฐจ์ˆœ์œผ๋กœ ํ–‰์„ ์ •๋ ฌํ•ฉ๋‹ˆ๋‹ค. order() ํ•จ์ˆ˜๋Š” birth_day ์—ด์„ ์˜ค๋ฆ„์ฐจ์ˆœ์œผ๋กœ ์ •๋ ฌํ•˜๋Š” ์ธ๋ฑ์Šค ๋ฒกํ„ฐ๋ฅผ ๋ฐ˜ํ™˜ํ•ฉ๋‹ˆ๋‹ค. ์ด ์ธ๋ฑ์Šค๋ฅผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ํ–‰์— ์—ฐ์‚ฐ์ž๋กœ ์ ์šฉํ•˜๋ฉด ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์€ ์ƒ์ผ ์—ด์„ ๊ธฐ์ค€์œผ๋กœ ์ •๋ ฌ๋ฉ๋‹ˆ๋‹ค.

head(. , n = 10): head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์™„์„ฑ๋œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ฆ‰, ์ด ์ฝ”๋“œ๋Š” df_customer ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ birth_day ์—ด๋กœ ์˜ค๋ฆ„์ฐจ์ˆœ์œผ๋กœ ์ •๋ ฌํ•˜๊ณ , head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒซ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ์ด๋‹ค. ์ด ์ฝ”๋“œ๋Š” df_customer ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ ๊ฐ€์žฅ ์˜ค๋ž˜๋œ ๊ณ ๊ฐ์„ ๋น ๋ฅด๊ฒŒ ํ™•์ธํ•˜๊ณ  ์‹ถ์„ ๋•Œ ์œ ์šฉํ•˜๋‹ค.
ย 
์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” df_customer ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ birth_day ์—ด๋กœ ๋‚ด๋ฆผ์ฐจ์ˆœ์œผ๋กœ ์ •๋ ฌํ•˜๊ณ  head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” ์ฝ”๋“œ์˜ ๋‚ด์šฉ์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

df_customer: ์‚ฌ์šฉ ์ค‘์ธ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ž…๋‹ˆ๋‹ค.

[order(df_customer$birth_day, decreasing = TRUE), ]: df_customer ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•˜์œ„ ์ง‘ํ•ฉํ™”ํ•˜์—ฌ ๋ชจ๋“  ์—ด์„ ํฌํ•จํ•˜๋˜, birth_day ์—ด์„ ๊ธฐ์ค€์œผ๋กœ ๋‚ด๋ฆผ์ฐจ์ˆœ์œผ๋กœ ํ–‰์„ ์ •๋ ฌํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋Š” ๊ธฐ๋ณธ์ ์œผ๋กœ birth_day ์—ด์„ ์˜ค๋ฆ„์ฐจ์ˆœ์œผ๋กœ ์ •๋ ฌํ•˜๋Š” ์ธ๋ฑ์Šค ๋ฒกํ„ฐ๋ฅผ ๋ฐ˜ํ™˜ํ•˜์ง€๋งŒ, decreasing = TRUE๋ฅผ ์„ค์ •ํ•˜์—ฌ ๋‚ด๋ฆผ์ฐจ์ˆœ์œผ๋กœ ์ •๋ ฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ์ธ๋ฑ์Šค๋ฅผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ํ–‰์— ์—ฐ์‚ฐ์ž๋กœ ์ ์šฉํ•˜๋ฉด ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์€ birth_day ์—ด์˜ ๋‚ด๋ฆผ์ฐจ์ˆœ์œผ๋กœ ์ •๋ ฌ๋ฉ๋‹ˆ๋‹ค.

head(. , n = 10): head() : ์™„์„ฑ๋œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•˜๋Š” ๋ถ€๋ถ„์ด๋‹ค.

์ฆ‰, ์ด ์ฝ”๋“œ๋Š” df_customer ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ birth_day ์—ด๋กœ ๋‚ด๋ฆผ์ฐจ์ˆœ์œผ๋กœ ์ •๋ ฌํ•˜๊ณ , head() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒซ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ์ด๋‹ค. ์ด ์ฝ”๋“œ๋Š” df_customer ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ ๊ฐ€์žฅ ์–ด๋ฆฐ ๊ณ ๊ฐ์„ ๋น ๋ฅด๊ฒŒ ํ™•์ธํ•˜๊ณ  ์‹ถ์„ ๋•Œ ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค.
ย 
์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ customer_id์™€ amount๋ผ๋Š” ์—ด์„ ์„ ํƒํ•˜๊ณ , ranking์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ์—ด์„ ์ถ”๊ฐ€ํ•˜์—ฌ ๊ฑฐ๋ž˜ ๊ธˆ์•ก์— ๋”ฐ๋ฅธ ๊ฐ ๊ณ ๊ฐ์˜ ์ˆœ์œ„๋ฅผ ํ‘œ์‹œํ•ฉ๋‹ˆ๋‹ค(๊ฐ€์žฅ ๋†’์€ ๊ธˆ์•ก์„ 1์ˆœ์œ„๋กœ ์„ค์ •). ์•„๋ž˜๋Š” ์ฝ”๋“œ์˜ ๋‚ด์šฉ์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

df_receipt[c("customer_id", "amount")]: df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์„œ๋ธŒ์…‹ํ•˜์—ฌ customer_id์™€ amount ์ปฌ๋Ÿผ๋งŒ ํฌํ•จํ•˜๋„๋ก ํ•œ ๊ฒƒ์ด๋‹ค.

%>%: ์ด์ „ ์—ฐ์‚ฐ์˜ ์ถœ๋ ฅ์„ ๋‹ค์Œ ์—ฐ์‚ฐ์˜ ์ž…๋ ฅ์œผ๋กœ ์ „๋‹ฌํ•˜๋Š” ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž์ด๋‹ค.

mutate(ranking = min_rank(desc(amount))): ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์— ranking์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ์ปฌ๋Ÿผ์„ ์ถ”๊ฐ€ํ•˜๋Š” ๊ฒƒ์œผ๋กœ, ๊ฑฐ๋ž˜ ๊ธˆ์•ก์— ๋”ฐ๋ฅธ ๊ฐ ๊ณ ๊ฐ์˜ ์ˆœ์œ„๋ฅผ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. ์ˆœ์œ„๋ฅผ ๊ณ„์‚ฐํ•˜๊ณ , ๋™์ ์€ ์ž„์˜๋กœ ํ•ด์†Œํ•œ๋‹ค. ์ด ํ•จ์ˆ˜๋ฅผ ๋งˆ์ด๋„ˆ์Šค(desc() ํ•จ์ˆ˜)๋ฅผ ์ทจํ•œ ํ›„ ๊ธˆ์•ก ์—ด์— ๋Œ€ํ•ด ๊ฐ€์žฅ ๋†’์€ ๊ฐ’์˜ ์ˆœ์œ„๊ฐ€ 1์ด ๋˜๋„๋ก ์ ์šฉํ•˜๋ฉด ๊ฑฐ๋ž˜ ๊ธˆ์•ก์— ๋”ฐ๋ฅธ ๊ณ ๊ฐ ์ˆœ์œ„๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค.

arrange(ranking) : ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ๋žญํ‚น ์—ด์—์„œ ์˜ค๋ฆ„์ฐจ์ˆœ์œผ๋กœ ์ •๋ ฌํ•ฉ๋‹ˆ๋‹ค.

slice(1:10) : slice() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ƒ์œ„ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ฆ‰, ์ด ์ฝ”๋“œ๋Š” df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ customer_id์™€ amount ์—ด์„ ์„ ํƒํ•˜๊ณ , ranking์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ์—ด์„ ์ถ”๊ฐ€ํ•˜์—ฌ ๊ฑฐ๋ž˜ ๊ธˆ์•ก์— ๋”ฐ๋ฅธ ๊ฐ ๊ณ ๊ฐ์˜ ์ˆœ์œ„๋ฅผ ํ‘œ์‹œํ•˜๊ณ , ranking ์—ด์„ ๊ธฐ์ค€์œผ๋กœ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์ •๋ ฌํ•˜๊ณ , ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ƒ์œ„ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ์ฝ”๋“œ๋Š” df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ๊ฑฐ๋ž˜ ๊ธˆ์•ก๋ณ„ ์ƒ์œ„ 10๋ช…์˜ ๊ณ ๊ฐ์„ ๋น ๋ฅด๊ฒŒ ํ™•์ธํ•˜๊ณ  ์‹ถ์„ ๋•Œ ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค.
ย 
์„ค๋ช…:

์ด ์ฝ”๋“œ๋Š” "customer_id"์™€ "amount" ์—ด์„ ํฌํ•จํ•˜๋Š” df_receipt๋ผ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์— ๋Œ€ํ•ด ์ผ๋ จ์˜ ์ฒ˜๋ฆฌ๋ฅผ ์ˆ˜ํ–‰ํ•œ๋‹ค.

๋‹ค์Œ์€ ์ด ์ฝ”๋“œ๊ฐ€ ์ˆ˜ํ–‰ํ•˜๋Š” ์ž‘์—…์„ ๋‹จ๊ณ„๋ณ„๋กœ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.

df_receipt[c("customer_id", "amount")] : df_receipt ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ "customer_id"์™€ "amount" ์ปฌ๋Ÿผ๋งŒ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—๋Š” ์ด ๋‘ ์ปฌ๋Ÿผ๋งŒ ํฌํ•จ๋ฉ๋‹ˆ๋‹ค.

%>%: R์˜ ํŒŒ์ดํ”„ ์—ฐ์‚ฐ์ž๋กœ, ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์— ๋Œ€ํ•œ ์—ฌ๋Ÿฌ ์—ฐ์‚ฐ์„ ์—ฐ๊ฒฐํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค. ํ•œ ์—ฐ์‚ฐ์˜ ์ถœ๋ ฅ์€ ๋‹ค์Œ ์—ฐ์‚ฐ์˜ ์ž…๋ ฅ์œผ๋กœ ์ „๋‹ฌ๋œ๋‹ค.

mutate(ranking = row_number(desc(amount))): mutate ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์— "ranking"์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ์—ด์„ ์ƒ์„ฑํ•˜๊ณ , "ranking" ์—ด์€ "amount" ์—ด์„ ๊ธฐ์ค€์œผ๋กœ "amount"์˜ ๊ฐ€์žฅ ๋†’์€ ๊ฐ’์„ "1", ๋‘ ๋ฒˆ์งธ๋กœ ๋†’์€ ๊ฐ’์„ "2"๋กœ ์„ค์ •ํ•œ๋‹ค. ์— ๊ฐ€์žฅ ๋†’์€ ๊ฐ’์„ "2", ๋‘ ๋ฒˆ์งธ๋กœ ๋†’์€ ๊ฐ’์„ "2"๋กœ ์ˆœ์œ„๋ฅผ ๋งค๊ธฐ๊ณ , desc ํ•จ์ˆ˜๋Š” "amount" ์ปฌ๋Ÿผ์„ ๋‚ด๋ฆผ์ฐจ์ˆœ์œผ๋กœ ์ •๋ ฌํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค.

arrange(ranking) : ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ "ranking" ์ปฌ๋Ÿผ์—์„œ ์˜ค๋ฆ„์ฐจ์ˆœ(1~n)์œผ๋กœ ์ •๋ ฌํ•œ๋‹ค.

slice(1:10) : ์ •๋ ฌ๋œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์ฒ˜์Œ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•œ๋‹ค(์ฆ‰, "amount" ๊ฐ’๊ณผ ํ•ด๋‹น "customer_id" ๊ฐ’์ด ๊ฐ€์žฅ ํฐ 10๊ฐœ์˜ ํ–‰์„ ์„ ํƒํ•œ๋‹ค). slice ํ•จ์ˆ˜๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ ํ–‰์„ ๋ถ€๋ถ„ ์ง‘ํ•ฉ์œผ๋กœ ๋งŒ๋“œ๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค.

์š”์•ฝํ•˜๋ฉด, ์ด ์ฝ”๋“œ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ "customer_id"์™€ "amount"์—ด์„ ์„ ํƒํ•˜๊ณ , "amount"๊ฐ’์„ ๋‚ด๋ฆผ์ฐจ์ˆœ์œผ๋กœ ์ˆœ์œ„๋ฅผ ๋งค๊ธฐ๊ณ , ์ˆœ์œ„์— ๋”ฐ๋ผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์ •๋ ฌํ•˜๊ณ , ์ƒ์œ„ 10๊ฐœ์˜ ํ–‰(์ฆ‰, "amount"๊ฐ’์ด ๊ฐ€์žฅ ๋†’์€ 10๋ช…์˜ ๊ณ ๊ฐ)์„ ์„ ํƒํ•œ๋‹ค.

ย 

Comment