K-์ตœ๊ทผ์ ‘ ์ด์›ƒ ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ์ฃผ๋ณ€์˜ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด K๊ฐœ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณด๊ณ  ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ํŒ๋‹จํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋งํ•œ๋‹ค.

N๊ฐœ์˜ ํŠน์„ฑ(feature)์„ ๊ฐ€์ง„ ๋ฐ์ดํ„ฐ๋Š” n์ฐจ์›์˜ ๊ณต๊ฐ„์— ์ ์œผ๋กœ ํ‘œํ˜„๋˜๋Š”๋ฐ, ์œ ์‚ฌํ•œ ๋ฐ์ดํ„ฐ๋ผ๋ฆฌ๋Š” ๊ฑฐ๋ฆฌ๊ฐ€ ๊ฐ€๊น๋‹ค.

์ด๋•Œ, ๋‹ค์–‘ํ•œ ๊ฑฐ๋ฆฌํ•จ์ˆ˜๋ฅผ ํ†ตํ•ด ๋ฐ์ดํ„ฐ ๊ฐ„์˜ ๊ฑฐ๋ฆฌ๋ฅผ ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค.

์ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๋ชจ๋ธ์˜ ํšจ๊ณผ๋ฅผ ๋†’์ด๊ธฐ ์œ„ํ•ด ํŒŒ๋ผ๋ฏธํ„ฐ์ธ K๋ฅผ ์กฐ์ •ํ•œ๋‹ค.

 

K-์ตœ๊ทผ์ ‘ ์ด์›ƒ ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ KNN ๋ถ„๋ฅ˜์™€ KNN ํšŒ๊ท€์— ๋ชจ๋‘ ์ ์šฉ ๊ฐ€๋Šฅํ•œ๋ฐ, KNN ํšŒ๊ท€์—๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ ์šฉ๋œ๋‹ค.

 

1. ๋‹ค์–‘ํ•œ ๊ฑฐ๋ฆฌ ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•ด ๊ฐ€๊นŒ์šด k๊ฐœ์˜ ์ด์›ƒ์„ ์ฐพ๋Š”๋‹ค. (์œ ํด๋ฆฌ๋“œ ๊ฑฐ๋ฆฌ, ๋งจํ•ดํŠผ ๊ฑฐ๋ฆฌ, ํ•ด๋ฐ ๊ฑฐ๋ฆฌ ๋“ฑ)

2. ์ด์›ƒ ์ƒ˜ํ”Œ์˜ ํƒ€๊นƒ๊ฐ’์„ ํ‰๊ท ํ•˜์—ฌ ์˜ˆ์ธกํ•˜๊ณ ์ž ํ•˜๋Š” ๋ฐ์ดํ„ฐ์˜ ์˜ˆ์ธก๊ฐ’์œผ๋กœ ์‚ฌ์šฉํ•œ๋‹ค.

3. ๋‹ค์–‘ํ•œ ํšŒ๊ท€ ๋ชจ๋ธ์˜ ํ‰๊ฐ€์ง€ํ‘œ๋ฅผ ์ด์šฉํ•ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ์ธก์ •ํ•œ๋‹ค. (๊ฒฐ์ •๊ณ„์ˆ˜ R^2, MSE, RMSE, MAE, MAPE, MPE ๋“ฑ)

4. ํ›ˆ๋ จ ์„ธํŠธ, ํ…Œ์ŠคํŠธ ์„ธํŠธ์— ๋Œ€ํ•œ ํ‰๊ฐ€ ์ ์ˆ˜๋ฅผ ํ†ตํ•ด ๊ณผ๋Œ€์ ํ•ฉ/๊ณผ์†Œ์ ํ•ฉ/์ ์ • ์„ ํŒ๋‹จํ•œ๋‹ค.

* ํ›ˆ๋ จ์„ธํŠธ ์ ์ˆ˜ < ํ…Œ์ŠคํŠธ ์„ธํŠธ ์ ์ˆ˜์ด๋ฉด ๊ณผ์†Œ์ ํ•ฉ

ํ›ˆ๋ จ์„ธํŠธ ์ ์ˆ˜ > ํ…Œ์ŠคํŠธ ์„ธํŠธ ์ ์ˆ˜์ด๋ฉด ๊ณผ๋Œ€์ ํ•ฉ์ด๋‹ค.

 

์ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ๋…ธ์ด์ฆˆ์— ํฌ๊ฒŒ ์˜ํ–ฅ์„ ๋ฐ›์ง€ ์•Š๊ณ , ํ›ˆ๋ จ ๋‹จ๊ณ„๊ฐ€ ๋น ๋ฅด๋ฉฐ ์ด์ƒ์น˜์˜ ์˜ํ–ฅ์„ ๋œ ๋ฐ›์•„์„œ ๋ฐ์ดํ„ฐ์˜ ๋ถ„์‚ฐ๊นŒ์ง€ ๊ณ ๋ คํ•˜๋ฉด ์ƒ๋‹นํžˆ ๋กœ๋ฒ„์ŠคํŠธํ•˜๋‹ค๋Š” ์žฅ์ ์ด ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋ชจ๋ธ์„ ์ƒ์„ฑํ•˜์ง€ ์•Š์•„์„œ ํŠน์ง•๊ณผ ํด๋ž˜์Šค ๊ฐ„ ๊ด€๊ณ„๋ฅผ ์ดํ•ดํ•˜๋Š”๋ฐ ์ œํ•œ์ ์ด๋ฉฐ ์ตœ์  ์ด์›ƒ์˜ ์ˆ˜์™€ ์‚ฌ์šฉํ•  ๊ฑฐ๋ฆฌ ์ฒ™๋„๋ฅผ ๋ฐ์ดํ„ฐ ๊ฐ๊ฐ์˜ ํŠน์„ฑ์— ๋งž๊ฒŒ ์—ฐ๊ตฌ์ž๊ฐ€ ์ž„์˜๋กœ ์„ค์ •ํ•ด์•ผํ•œ๋‹ค๋Š” ๋‹จ์ ์ด ์žˆ๋‹ค. (*์ฃผ๋กœ ์ตœ์  ์ด์›ƒ ์ˆ˜๋Š” ํ™€์ˆ˜์ด๋‹ค)

๊ฑฐ๋ฆฌํ•จ์ˆ˜์˜ ์ข…๋ฅ˜์—๋Š” ์œ ํด๋ฆฌ๋“œ ๊ฑฐ๋ฆฌํ•จ์ˆ˜, ๋งจํ•ดํŠผ ๊ฑฐ๋ฆฌํ•จ์ˆ˜, ํ•ด๋ฐ ๊ฑฐ๋ฆฌํ•จ์ˆ˜๊ฐ€ ์žˆ๋‹ค.

์ด์ค‘ ์œ ํด๋ฆฌ๋“œ ๊ฑฐ๋ฆฌํ•จ์ˆ˜๋Š” 

๊ฐ ์ฐจ์›์˜ ์ฐจ๋ฅผ ์ œ๊ณฑํ•ด์„œ ๋ชจ๋‘ ๋”ํ•œ ๊ฐ’์˜ ์ œ๊ณฑ๊ทผ์œผ๋กœ, 2์ฐจ์›์—์„œ๋Š” ํ”ผํƒ€๊ณ ๋ผ์Šค ์ •๋ฆฌ์™€ ๊ฐ™๋‹ค.

์ด๋•Œ, k๊ฐ’์„ ์ •ํ•ด์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— x์™€ y ๋ฒกํ„ฐ๋ฅผ ์ •๊ทœํ™” ํ›„ ๊ฑฐ๋ฆฌํ•จ์ˆ˜๋ฅผ ๊ณ„์‚ฐํ•ด์ค€๋‹ค.

 

๋งจํ•ดํŠผ ๊ฑฐ๋ฆฌํ•จ์ˆ˜๋Š” 

๋‹ค์Œ๊ณผ ๊ฐ™์ด ๊ฐ ์ฐจ์›์˜ ์ฐจ์˜ ์ ˆ๋Œ“๊ฐ’์„ ๋ฐ”๋กœ ํ•ฉ์‚ฐํ•ด์ค€๋‹ค.

 

ํ•ด๋ฐ ๊ฑฐ๋ฆฌํ•จ์ˆ˜๋Š” ๊ฐ ์ฐจ์›๋งˆ๋‹ค ์ฐจ์ด๋ฅผ ์ฐพ๋Š”๊ฒŒ ์•„๋‹Œ '์ •ํ™•ํžˆ ๊ฐ™์€์ง€'์˜ ์—ฌ๋ถ€๋งŒ ๊ณ ๋ คํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ฃผ๋กœ ๋‘๊ฐœ์˜ ์ด์ง„ ๋ฐ์ดํ„ฐ

๋ฌธ์ž์—ด์„ ๋น„๊ตํ•˜๊ธฐ ์œ„ํ•œ ์ง€ํ‘œ๋กœ ์‚ฌ์šฉ๋œ๋‹ค. (*๋น„ํŠธ ํ•˜๋‚˜๊ฐ€ ๋‹ค๋ฅผ ๋•Œ๋งˆ๋‹ค ํ•ด๋ฐ๊ฑฐ๋ฆฌ๊ฐ€ ์ฆ๊ฐ€ํ•œ๋‹ค)

 

 

์ตœ์ ์˜ k๊ฐ’์€ ๋ฐ์ดํ„ฐ์— ์˜์กด์ ์ด๋ฉฐ ๋‹ค์–‘ํ•œ ๋ฐœ๊ฒฌ์  ๊ธฐ๋ฒ•์œผ๋กœ ์„ ํƒ๋œ๋‹ค. -> Trial & Error (python ๋ฐ˜๋ณต๋ฌธ ์‚ฌ์šฉ)

์—๋Ÿฌ์œจ์ด ๊ฐ€์žฅ ์ž‘์€ k๋ฅผ ์„ ํƒํ•˜๊ฒŒ ๋˜๋Š”๋ฐ, K๊ฐ€ ๋„ˆ๋ฌด ์ž‘์œผ๋ฉด ๊ณผ๋Œ€์ ํ•ฉ๋˜์–ด ๋ฐ์ดํ„ฐ์˜ ์ง€์—ญ์  ํŠน์„ฑ์„ ์ง€๋‚˜์น˜๊ฒŒ ๋ฐ˜์˜ํ•˜๊ฒŒ ๋˜๊ณ , K๊ฐ€ ๋„ˆ๋ฌด ํฌ๋ฉด ๊ณผ์†Œ์ ํ•ฉ๋˜์–ด ๋ชจ๋ธ์ด ๊ณผํ•˜๊ฒŒ ์ •๊ทœํ™”๋œ๋‹ค.

์ข…์† ๋ณ€์ˆ˜๊ฐ€ ์—ฐ์†ํ˜•์ธ ๊ฒฝ์šฐ ๊ฑฐ๋ฆฌ๊ฐ€ ๊ฐ€๊นŒ์šด ๊ด€์ธก์น˜๋“ค์—๊ฒŒ ๊ฐ€์ค‘์น˜(weight)๋ฅผ ๋ถ€๊ณผํ•ด ๊ฐ€์ค‘ํ‰๊ท ์œผ๋กœ ๊ตฌํ•˜๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•˜๋ฉฐ Inverse distance weighted average๊ฐ€ ๊ณ ๋ ค ๊ฐ€๋Šฅํ•˜๋‹ค.

์ข…์† ๋ณ€์ˆ˜๊ฐ€ ๋ฒ”์ฃผํ˜•์ผ ๊ฒฝ์šฐ Tie ๋ฌธ์ œ๋ฅผ ๋ง‰๊ธฐ ์œ„ํ•ด k๋Š” ํ™€์ˆ˜๊ฐ€ ๊ถŒ์žฅ๋œ๋‹ค.

๋น„์šฉํ•จ์ˆ˜๋ผ๊ณ ๋„ ๋ถˆ๋ฆฌ๋Š” ํšŒ๊ท€ ๋ชจ๋ธ์˜ ํ‰๊ฐ€ ์ง€ํ‘œ๋Š” ์›๋ž˜์˜ ๊ฐ’๊ณผ ๊ฐ€์žฅ ์˜ค์ฐจ๊ฐ€ ์ž‘์€ ๊ฐ€์„คํ•จ์ˆ˜ ๋ฅผ ๋„์ถœํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋Š” ํ•จ์ˆ˜์ด๋‹ค. 

๊ฐ€์žฅ ํ”ํžˆ ์“ฐ์ด๋Š” ๊ฒฐ์ •๊ณ„์ˆ˜ R^2์€ ํ†ต๊ณ„ํ•™ ํšŒ๊ท€ ๋ถ„์„์—์„œ ์ž์ฃผ ์“ฐ์ด๋ฉฐ ๋ชจ๋ธ์ด ๋ฐ์ดํ„ฐ๋ฅผ

์–ผ๋งˆ๋‚˜ ์ž˜ ์˜ˆ์ธกํ•˜๋Š”์ง€์— ๋Œ€ํ•œ ์ง€ํ‘œ์ด๋‹ค.

ํ‰๊ท ์œผ๋กœ ์˜ˆ์ธกํ–ˆ์„ ๋•Œ๋ณด๋‹ค ๋ชจ๋ธ์„ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ

์–ผ๋งˆ๋‚˜ ๋” ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‚ด๋Š”์ง€์— ๋Œ€ํ•œ ๋น„์œจ๋กœ ๋‚˜ํƒ€๋‚ธ ๊ฐ’์„ ์˜๋ฏธํ•œ๋‹ค.

์‹ค์ œ ๊ฐ’๊ณ„์˜ ๋ถ„์‚ฐ ๋Œ€๋น„ ์˜ˆ์ธก๊ฐ’์˜ ๋ถ„์‚ฐ ๋น„์œจ

 

 

 

์˜ค์ฐจ ์ œ๊ณฑ ํ‰๊ท ์ธ MSE (Mean Squared Error)๋Š” ์˜ˆ์ธก๊ฐ’๊ณผ ์‹ค์ œ๊ฐ’์˜ ์ฐจ์ด์— ๋Œ€ํ•œ ์ œ๊ณฑ์— ๋Œ€ํ•˜์—ฌ ํ‰๊ท ์„ ๋‚ธ ๊ฐ’์œผ๋กœ,

๊ฐ€์žฅ ๋งŽ์ด ์‚ฌ์šฉ๋˜๋ฉฐ ์ด์ƒ์น˜์— ๋ฏผ๊ฐํ•˜๋‹ค. ์˜ค์ฐจ๊ฐ€ ์ž‘์œผ๋ฉด ์ž‘์„์ˆ˜๋ก ์ข‹์ง€๋งŒ ๊ณผ๋Œ€์ ํ•ฉ์ด ๋  ์ˆ˜ ์žˆ๋‹ค.

0~๋ฌดํ•œ๋Œ€์˜ ๊ฐ’์„ ๊ฐ€์ง„๋‹ค.

ํ‰๊ท  ์ œ๊ณฑ๊ทผ ์˜ค์ฐจ์ธ RMSE(Root Mean Squared Error)๋Š” MSE์— ๋ฃจํŠธ๋ฅผ ์”Œ์šด ๊ฐ’์œผ๋กœ, 

MSE์˜ ์žฅ๋‹จ์ ์„ ๊ฑฐ์˜ ๋”ฐ๋ผ๊ฐ€์ง€๋งŒ ์ œ๊ณฑ์˜ค์ฐจ์— ๋Œ€ํ•œ ์™œ๊ณก์„ ์ค„์—ฌ์ฃผ๋ฉฐ ๋กœ๋ฒ„์ŠคํŠธํ•˜๋‹ค๋Š” ์žฅ์ ์ด ์žˆ๋‹ค.

์˜ค๋ฅ˜ ์ง€ํ‘œ๋ฅผ ๋ฃจํŠธ๋ฅผ ํ†ตํ•ด ์‹ค์ œ๊ฐ’๊ณผ ์œ ์‚ฌํ•œ ๋‹ค์œ„๋กœ ๋ณ€ํ™˜ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ํ•ด์„์ด ์‰ฌ์šฐ๋‚˜ ์‹ค์ƒํ™œ์—์„œ ์“ฐ๋Š” ๊ณ„์‚ฐ๋ฒ•์„ ๋ฒ—์–ด๋‚ฌ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋Ÿผ์—๋„ ํฐ ์˜ค๋ฅ˜๊ฐ’ ์ฐจ์ด์— ๋Œ€ํ•œ ํฐ ํŒจ๋„ํ‹ฐ๋ฅผ ์ฃผ๋Š” ์ด์ ์ด ์žˆ์–ด ๋งŽ์ด ์“ฐ์ธ๋‹ค.

๋ถ„๋ชจ๊ฐ€ ์ž‘์•„์ ธ์„œ ์ด ๊ฒฐ๊ณผ๋Š”&nbsp; MSE๋ณด๋‹ค ํฌ๋‹ค.
ํŒŒ์ด์ฌ

ํ‰๊ท  ์ ˆ๋Œ€ ์˜ค์ฐจ์ธ MAE(Mean Absolute Error)๋Š” ์ ˆ๋Œ“๊ฐ’์„ ์ทจํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ฐ€์ž‘ ์ง๊ด€์ ์œผ๋กœ ์•Œ ์ˆ˜ ์žˆ๋Š” ์ง€ํ‘œ์ด๋‹ค.

MSE๋ณด๋‹ค ํŠน์ด์น˜์— robustํ•˜๋‹ค.(*์ œ๊ณฑํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— ์ด์ƒ์น˜์— ๋œ ๋ฏผ๊ฐ)

๊ทธ๋Ÿฌ๋‚˜ ์ ˆ๋Œ“๊ฐ’์„ ์ทจํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋ชจ๋ธ์ด ์‹ค์ œ๋ณด๋‹ค ์‹ค์ œ๋ณด๋‹ค ๋†’์€ ๊ฐ’์œผ๋กœ ์˜ˆ์ธก๋˜์—ˆ๋Š”์ง€(overperformance), 

๋‚ฎ์€ ๊ฐ’์œผ๋กœ ์˜ˆ์ธก๋˜์—ˆ๋Š”์ง€(underperformance) ์•Œ ์ˆ˜ ์—†๋‹ค.

ํ‰๊ท  ์ ˆ๋Œ€๋น„ ์˜ค์ฐจ์ธ MAPE(Mean Absolute Percentage Error)๋Š” MAE์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ MSE๋ณด๋‹ค ํŠน์ด์น˜์— robustํ•˜๋ฉฐ

MAE์™€ ๊ฐ™์€ ๋‹จ์ ์„ ๊ฐ€์ง„๋‹ค. ํผ์„ผํŠธ ๊ฐ’์„ ๊ฐ€์ง€๋ฉฐ 0์— ๊ฐ€๊นŒ์šธ์ˆ˜๋ก ํšŒ๊ท€ ๋ชจํ˜•์˜ ์„ฑ๋Šฅ์ด ์ข‹๋‹ค๊ณ  ํ•ด์„ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, 

๋ชจ๋ธ์— ๋Œ€ํ•œ ํŽธํ–ฅ์ด ์กด์žฌํ•œ๋‹ค.

0~100% ์‚ฌ์ด์˜ ๊ฐ’์„ ๊ฐ€์ ธ ์„ฑ๋Šฅ ๋น„๊ต ํ•ด์„์ด ๊ฐ€๋Šฅํ•˜๋‹ค.
ํŒŒ์ด์ฌ

 

MPE(Mean Percentage Error)๋Š” MAPE์—์„œ ์ ˆ๋Œ“๊ฐ’์„ ์ œ์™ธํ•œ ์ง€ํ‘œ๋กœ, ๊ณผ์†Œํ‰๊ฐ€์ธ์ง€ ๊ณผ๋Œ€ํ‰๊ฐ€์ธ์ง€ ์•Œ ์ˆ˜ ์žˆ์–ด์„œ ํŽธ๋ฆฌํ•˜๋‹ค.

MAE, MSE์™€ ๊ฐ™์€ ์ ˆ๋Œ€์˜ค์ฐจ ์ธก์ •์ด ์•„๋‹Œ MAPE, MPE์™€ ๊ฐ™์€ ์ƒ๋Œ€์˜ค์ฐจ ์ธก์ •์ด๋‹ค.

sklearn์— ์—†์–ด์„œ ์ง์ ‘ ์ •์˜

 

 

 

<KNN ํšŒ๊ท€ ๊ตฌํ˜„>

ํด๋ž˜์Šค ๊ตฌ์กฐ

 

 

n์ด ์ปค์งˆ์ˆ˜๋ก ๋ชจ๋ธ์ด ๋‹จ์ˆœํ•ด์ง„๋‹ค.

*๊ณผ๋Œ€์ ํ•ฉ์ด๋ž€ ๋ชจ๋ธ์ด ํ›ˆ๋ จ ์„ธํŠธ์—์„œ๋Š” ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‚ด์ง€๋งŒ ๊ฒ€์ฆ ์„ธํŠธ์—์„œ๋Š” ๋‚ฎ์€ ์„ฑ๋Šฅ์„ ๋‚ด๋Š” ๊ฒฝ์šฐ๋ฅผ ๋งํ•˜๋ฉฐ, 

๋ถ„์‚ฐ์ด ํฌ๋‹ค. -> ํ›ˆ๋ จ ์„ธํŠธ์— ์ถฉ๋ถ„ํžˆ ๋‹ค์–‘ํ•œ ์ƒ˜ํ”Œ์ด ํฌํ•จ๋˜์ง€ ์•Š์•„์„œ ์ผ์–ด๋‚œ๋‹ค.

ํ›ˆ๋ จ ์„ธํŠธ์— ๋‹ค์–‘ํ•œ ์ƒ˜ํ”Œ์„ ํฌํ•จ์‹œํ‚ค๊ฑฐ๋‚˜, ํ›ˆ๋ จ ์ƒ˜ํ”Œ์„ ๋” ๋ชจ์„ ์ˆ˜ ์—†๋Š” ๊ฒฝ์šฐ ๋ชจ๋ธ์ด ํ›ˆ๋ จ ์„ธํŠธ์— ์ง‘์ฐฉํ•˜์ง€ ์•Š๊ฒŒ

๊ฐ€์ค‘์น˜๋ฅผ ์ œํ•œํ•ด ๋ชจ๋ธ์˜ ๋ณต์žก๋„๋ฅผ ๋‚ฎ์ถ”๊ฑฐ๋‚˜, outlier๋‚˜ error๋ฅผ ์ œ๊ฑฐํ•ด ์žก์Œ์„ ์ค„์—ฌ์„œ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

*๊ณผ์†Œ ์ ํ•ฉ์ด๋ž€ ํ›ˆ๋ จ ์„ธํŠธ์™€ ๊ฒ€์ฆ ์„ธํŠธ์˜ ์„ฑ๋Šฅ์—๋Š” ์ฐจ์ด๊ฐ€ ํฌ์ง€ ์•Š์œผ๋‚˜ ๋ชจ๋‘ ๋‚ฎ์€ ์„ฑ๋Šฅ์„ ๋‚ด๋Š” ๊ฒฝ์šฐ๋ฅผ ๋งํ•˜๋ฉฐ, 

ํŽธํ–ฅ์ด ํฌ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค. -> ๋ณต์žก๋„๊ฐ€ ๋” ๋†’์€, ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ๋” ๋งŽ์€ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ ๊ฐ€์ค‘์น˜ ๊ทœ์ œ๋ฅผ ์™„ํ™”ํ•ด ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค. 

๊ณผ์†Œ์ ํ•ฉ ํ•ด๊ฒฐ ์˜ˆ์‹œ

 

ํŒŒ๋ž€์„ ์ด ์„ ํ˜•ํšŒ๊ท€ ์ง์„ 

ํšŒ๊ท€ ๋ถ„์„ : ๋…๋ฆฝ๋ณ€์ˆ˜ x์— ๋Œ€์‘ํ•˜๋Š” ์ข…์†๋ณ€์ˆ˜ y์™€ ๊ฐ€์žฅ ๋น„์Šทํ•œ ๊ฐ’์„ ๊ฐ€์ง€๋Š” ํ•จ์ˆ˜ f(x)๋ฅผ ์ฐพ๋Š” ๊ณผ์ • -> ํ•จ์ˆ˜ f(x)๋ฅผ ํ†ตํ•ด ๋ฏธ๋ž˜ ์‚ฌ๊ฑด์„ ์˜ˆ์ธก

์„ ํ˜• ํšŒ๊ท€ ๋ชจํ˜• : ํšŒ๊ท€ ๋ถ„์„์„ ํ†ตํ•ด ๊ตฌํ•œ ํ•จ์ˆ˜ f(x)๊ฐ€ ์„ ํ˜• ํ•จ์ˆ˜์ผ ๋•Œ f(x) = ํšŒ๊ท€ ์ง์„  

์„ ํ˜• ํšŒ๊ท€ ๋ถ„์„ : ์„ ํ˜• ํšŒ๊ท€ ๋ชจํ˜•์„ ์‚ฌ์šฉํ•˜๋Š” ํšŒ๊ท€๋ถ„์„ : ํŠน์„ฑ๊ณผ ํƒ€๊นƒ ์‚ฌ์ด์˜ ๊ด€๊ณ„๋ฅผ ์ž˜ ๋‚˜ํƒ€๋‚ด๋Š” ์„ ํ˜• ํšŒ๊ท€ ๋ชจํ˜•์„ ์ฐพ๊ณ  ์ด๋“ค์˜ ์ƒ๊ด€ ๊ด€๊ณ„๋Š” ๊ฐ€์ค‘์น˜/๊ณ„์ˆ˜(m), ํŽธํ–ฅ(b)์— ์ €์žฅ๋œ๋‹ค.

yhat = W*x + b (W = ๊ฐ€์ค‘์น˜, b = ํŽธํ–ฅ)

๋น„์šฉํ•จ์ˆ˜(= ์†์‹ค ํ•จ์ˆ˜) : ์„ ํ˜• ๋ชจ๋ธ์˜ ์˜ˆ์ธก๊ณผ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ์‚ฌ์ด์˜ ๊ฑฐ๋ฆฌ๋ฅผ ์žฌ๋Š” ํ•จ์ˆ˜ -> ๋น„์šฉ ํ•จ์ˆ˜์˜ ๊ฒฐ๊ณผ๊ฐ’์ด ์ž‘์„์ˆ˜๋ก ์„ ํ˜• ๋ชจ๋ธ์˜ ์˜ˆ์ธก์ด ์ •ํ™•ํ•จ์„ ๋‚˜ํƒ€๋‚ธ๋‹ค. 

*์„ ํ˜• ํšŒ๊ท€๋Š” ์„ ํ˜• ๋ชจ๋ธ์ด๋ผ๋Š” ๊ฐ€์„ค์„ ์„ธ์›Œ ๋ฐ์ดํ„ฐ๋ฅผ ์„ ํ˜• ๋ชจ๋ธ ์œ„์— ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜๋Š” ๋ฐฉ์‹์ด๋ฏ€๋กœ
์‹ค์ œ ๋ฐ์ดํ„ฐ(ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ)์™€ ์„ ํ˜• ๋ชจ๋ธ์˜ ์˜ˆ์ธก ์‚ฌ์ด์˜ ์ฐจ์ด๊ฐ€ ์กด์žฌํ•œ๋‹ค.

&there4; ์‹ค์ œ ๋ฐ์ดํ„ฐ์™€ ์„ ํ˜• ๋ชจ๋ธ์˜ ์˜ˆ์ธก ์‚ฌ์ด์˜ ์ฐจ์ด๋ฅผ ํ‰๊ฐ€ํ•˜๋Š” ํ•จ์ˆ˜๋Š” ๋น„์šฉ ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ •ํ™•๋„๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค

์‚ฐ์ ๋„๋กœ ์„ ํ˜•ํšŒ๊ท€๊ฐ€ ์ž˜ ์ด๋ฃจ์–ด์กŒ๋Š”์ง€ ํ™•์ธํ•ด๋ณผ ์ˆ˜ ์žˆ๋Š”๋ฐ, 

์œ„์˜ ๊ฒฝ์šฐ ๊ณผ์†Œ ์ ํ•ฉ๋˜์—ˆ์œผ๋ฏ€๋กœ ๋‹คํ•ญํšŒ๊ท€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ์˜ ๋ณต์žก๋„๋ฅผ ๋†’์—ฌ์ฃผ๋ฉด ํ•ด๊ฒฐ ๊ฐ€๋Šฅํ•˜๋‹ค.

๋‹คํ•ญ ํšŒ๊ท€๋ž€ ๋‹คํ•ญ์‹์„ ์‚ฌ์šฉํ•œ ์„ ํ˜• ํšŒ๊ท€๋กœ ๋น„์„ ํ˜•์„ฑ์„ ๋„๋Š” ๋ฐ์ดํ„ฐ๋„ ์„ ํ˜• ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ์ตœ์ ์˜ ๊ณก์„ ์„ ์ฐพ์„ ์ˆ˜ ์žˆ๋‹ค.

 

<๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ•>

๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ•์ด๋ž€ ๋จธ์‹ ๋Ÿฌ๋‹, ๋”ฅ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ•™์Šต์‹œํ‚ฌ ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ๋น„์šฉํ•จ์ˆ˜์˜ ๊ธฐ์šธ๊ธฐ๋ฅผ ๊ณ„์† ๋‚ฎ์€ ์ชฝ์œผ๋กœ ์ด๋™์‹œ์ผœ ๊ทน๊ฐ’(์ตœ์ ๊ฐ’)์— ์ด๋ฅผ ๋•Œ๊นŒ์ง€ ๋ฐ˜๋ณตํ•˜๋Š” ๊ฒƒ์„ ๋งํ•œ๋‹ค.

 

๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ•์„ ์ด์šฉํ•˜์—ฌ ๋น„์šฉํ•จ์ˆ˜์—์„œ ๊ธฐ์šธ๊ธฐ๊ฐ€ "0"์ผ๋•Œ ๋น„์šฉ๊ฐ’(์˜ค์ฐจ)์„ ๊ตฌํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ ๋น„์šฉํ•จ์ˆ˜์˜ ์ตœ์†Œ๊ฐ’์„ ๊ตฌํ•˜๋ฉด

์ด๋•Œ ํšŒ๊ท€ํ•จ์ˆ˜๋ฅผ ์ตœ์ ํ™”ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค.

ํŒŒ์ด์ฌ์œผ๋กœ ๊ตฌํ˜„ ํ›„ Y = mx + b ํ•จ์ˆ˜๋ฅผ ๊ทธ๋ ค๋ณด๋ฉด

์‹ค์ธก๊ฐ’, ์˜ˆ์ธก๊ฐ’ ์‚ฐ์ ๋„๋ฅผ ๊ทธ๋ฆฌ๋Š” ํ•จ์ˆ˜ ์ƒ์„ฑ

์—ฌ๊ธฐ์„œ Learning rate๋ž€ ํ•™์Šต๋ฅ ๋กœ, ์„ ํ˜•ํšŒ๊ท€์—์„œ ๊ฐ€์ค‘์น˜์™€ ํŽธํ–ฅ์„ ๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ•์—์„œ ๋ฐ˜๋ณตํ•™์Šต ์‹œํ‚ฌ ๋•Œ, ํ•œ๋ฒˆ ๋ฐ˜๋ณตํ•™์Šต ์‹œํ‚ฌ ๋•Œ๋งˆ๋‹ค ํฌ์ธํŠธ๋ฅผ ์–ผ๋งŒํผ์”ฉ ์ด๋™์‹œํ‚ฌ ๊ฒƒ์ธ์ง€ ์ •ํ•˜๋Š” ์ƒ์ˆ˜์ด๋‹ค. ํ•™์Šต๋ฅ ์ด ๋„ˆ๋ฌด ์ž‘์„ ๊ฒฝ์šฐ local minimum์— ๋น ์งˆ ์ˆ˜ ์žˆ๊ณ , ๋„ˆ๋ฌด ํฐ ๊ฒฝ์šฐ ์ˆ˜๋ ด์ด ์ผ์–ด๋‚˜์ง€ ์•Š์œผ๋ฏ€๋กœ ์ ๋‹นํ•œ ํ•™์Šต๋ฅ ์„ ์ฐพ๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•˜๋‹ค.

ํŒŒ๋ž‘ : ์‹ค์ œ๊ฐ’, ์ฃผํ™ฉ : ์ถ”์ •๊ฐ’

์•ž์˜ ํŒŒ์ด์ฌ ์ฝ”๋“œ๋ฅผ ์‹คํ–‰ํ•˜๋ฉด ๋ฐ˜๋ณต๋ฌธ์ด ์‹คํ–‰๋˜๋ฉด์„œ ์˜ค์ฐจ๊ฐ€ ์ ์  ์ž‘์•„์ง์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. 

์ตœ์ข…์ ์œผ๋กœ ์˜ค์ฐจ๊ฐ€ ์ค„์–ด๋“ค๋ฉฐ ์‹ค์ œ๊ฐ’์„ ์ •ํ™•ํžˆ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋‹ค.

 

์‹ค์Šต

Credit.csv ์ถœ์ฒ˜

1-1

๊ตฌ๊ธ€ ๋“œ๋ผ์ด๋ธŒ์— csv ํŒŒ์ผ์ด ์ €์žฅ๋˜์–ด ์žˆ์–ด์•ผ ํ•œ๋‹ค.
Credit.csv

1.2

ํ•„์š”์—†๋Š” ์—ด์„ ์ œ๊ฑฐํ•ด์„œ credit_c์— ์ €์žฅํ•ด์ค๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐ ๋ถ„ํฌ ํ™•์ธํ•˜๊ธฐ

Rating ๊ณผ Limit์„ ๋ณ€์ˆ˜์— ์ €์žฅ ํ›„ ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ๋ฅผ ํ™•์ธํ•ด์ค๋‹ˆ๋‹ค.

 

1.3

๋…๋ฆฝ๋ณ€์ˆ˜๋Š” rating, ์ข…์†๋ณ€์ˆ˜๋Š” limit์ด ๋˜๋„๋ก ํ•˜์—ฌ train_input, test_input, train_target, test_target์„ ๋ถ„๋ฆฌํ•ด์ค๋‹ˆ๋‹ค.

์ด๋•Œ, train_input ์™€ test_input์˜ ๋น„์œจ์€ 7:3์ด๊ณ , random_state๋Š” 5๋กœ ์„ค์ •ํ•ด์„œ random ๊ฐ’์„ ๊ณ ์ •ํ•ด์ค๋‹ˆ๋‹ค.

 

1.4

KNeighborRegressor์— ๋„ฃ์–ด์ฃผ๋ ค๋ฉด ๋ฐฐ์—ด์˜ ํฌ๊ธฐ๋ฅผ 2์ฐจ์›์œผ๋กœ ๋ฐ”๊ฟ”์ค˜์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— train_input๊ณผ test_input์„ 2์ฐจ์›์˜ ์—ด๋ฒกํ„ฐ๋กœ ๋ณ€๊ฒฝํ•ด ๊ฐ๊ฐ ์ €์žฅํ•ด์ค๋‹ˆ๋‹ค.

*์ด๋ ‡๊ฒŒ np.newaxis๋ฅผ ์‚ฌ์šฉํ•ด์ฃผ๋ฉด 1 ์—ญํ• ์„ ํ•˜๋ฉฐ ํ•„์š”ํ•œ ์ฐจ์›์„ ์ฑ„์›Œ์ค๋‹ˆ๋‹ค.

 

test set์˜ 20%๋ฅผ validation set์œผ๋กœ ๋”ฐ๋กœ ๋ถ„๋ฆฌํ•ด์„œ ์ตœ์ ์˜ n๊ฐ’์„ ๊ตฌํ•˜๋Š” ๋ฐ ์‚ฌ์šฉํ•ด์ค๋‹ˆ๋‹ค.

1.5

train_input๊ณผ train_target์„ ํ™œ์šฉํ•ด k-์ตœ๊ทผ์ ‘ ์ด์›ƒ ํšŒ๊ท€ ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚ค๊ณ , train set๊ณผ test set์— ๊ด€ํ•œ ๊ฒฐ์ •๊ณ„์ˆ˜๋ฅผ ๊ฐ๊ฐ ์ถœ๋ ฅํ•ด์ค๋‹ˆ๋‹ค.

๊ฐ๊ฐ์˜ ๊ฒฐ์ •๊ณ„์ˆ˜

2. ์„ ํ˜•ํšŒ๊ท€

2.1

Credit ์ „์ฒด์—์„œ Rating์ด 700 ๋ฏธ๋งŒ์ธ ํ–‰๋งŒ credit_r ๋ณ€์ˆ˜์— ์ €์žฅํ•ด์ค๋‹ˆ๋‹ค.

 

2.2

credit_r์—์„œ Balance ์™€ Rating ๋ณ€์ˆ˜๋ฅผ ๋”ฐ๋กœ ์ €์žฅํ•ด์ค€ ํ›„ scatterplot์œผ๋กœ ๋ถ„ํฌ๋ฅผ ํ™•์ธํ•ด๋ด…๋‹ˆ๋‹ค.

 

2.3

StandardScaler ๋งค์„œ๋“œ๋ฅผ ํ™œ์šฉํ•ด balance์™€ rating์„ ์ •๊ทœํ™”ํ•ด์ค€ ํ›„ ์ •๊ทœํ™” ํ•œ ๊ฐ’์„ ๋”ฐ๋กœ ์ €์žฅํ•ด์ฃผ์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

์ด๋•Œ ๋‘ ๋ณ€์ˆ˜์˜ ํ‰๊ท ๊ณผ ๋ถ„์‚ฐ์„ ๊ฐ๊ฐ ์ถœ๋ ฅํ•ด๋ณด๋ฉด 0๊ณผ 1์— ๋งค์šฐ ๊ฐ€๊นŒ์›Œ์กŒ์Œ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

2.4

์œ„์—์„œ ์ €์žฅํ•ด์ค€ ๋ณ€์ˆ˜๋“ค์˜ ์—ด ์ด๋ฆ„์„ Balance์™€ Rating์œผ๋กœ ์ง€์ •ํ•ด์ค€ ํ›„ Dataframe์— ์ €์žฅํ•ด์ค๋‹ˆ๋‹ค.

 

2.5

DBSCAN์„ ํ™œ์šฉํ•ด์„œ ์ž…์‹ค๋ก ์ด 0.25, min_samples๋ฅผ 5๋กœ ์„ค์ •ํ•ด์ค€ ํ›„ data๋ฅผ fit_predict ํ•ด์„œ strange ๋ณ€์ˆ˜์— ์ €์žฅํ•ฉ๋‹ˆ๋‹ค.

์ด๋•Œ, -1์˜ ๊ฐ’์„ ๊ฐ–๋Š” ๋ฐ์ดํ„ฐ๋“ค์€ ์ด์ƒ์น˜๋กœ ๋ถ„๋ฅ˜๋ฉ๋‹ˆ๋‹ค.

์ด๋•Œ DBSCAN์—์„œ๋Š” ๊ตฐ์ง‘ํ™”๋ฅผ ํ•˜๋Š” ๊ธฐ์ค€์œผ๋กœ ์œ ํด๋ฆฌ๋””์•ˆ ๊ฑฐ๋ฆฌ๋ฅผ ํ™œ์šฉํ•ด ๊ฐ ๋ฐ์ดํ„ฐ๋ณ„๋กœ ๊ฑฐ๋ฆฌ๋ฅผ ๊ตฌํ•œ ๋’ค, ์„ค์ •ํ•œ eps ๊ฐ’ ์ด๋‚ด์— ํ•ด๋‹นํ•˜๋Š” ๋ฐ์ดํ„ฐ๋ผ๋ฆฌ ๊ตฐ์ง‘ํ™”๋ฅผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋•Œ ๋ฐ์ดํ„ฐ๊ฐ€ ์ •๊ทœํ™”๋˜์ง€ ์•Š์•„์„œ ํ•ด๋‹น ๋ฐ์ดํ„ฐ๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์ง€ํ‘œ๋“ค์˜ ์Šค์ผ€์ผ์ด ๋‹ค๋ฅด๋‹ค๋ฉด ๋ฐ์ดํ„ฐ ๊ฐ„์˜ ์‹ค์งˆ์ ์ธ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ •ํ•˜๊ธฐ ์–ด๋ ต๊ธฐ ๋•Œ๋ฌธ์— ์ •๊ทœํ™” ํ›„์— DBSCAN์„ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค.

 

2.6

1) credit_r์—์„œ strange๊ฐ€ -1์ธ ํ–‰๋“ค๋งŒ ์ถ”์ถœํ•ด credit_removed ๋ณ€์ˆ˜์— ์ €์žฅํ•ฉ๋‹ˆ๋‹ค.
2) credit_removed์—์„œ Balance์—ด๊ณผ Rating์—ด์„ ๊ฐ๊ฐ balance_r๊ณผ rating_r๋ณ€์ˆ˜์— ์ €์žฅํ•ฉ๋‹ˆ๋‹ค.
 
๊ทธ ํ›„ strange๋ฅผ ์ œ๊ฑฐํ•˜๊ธฐ ์ „ํ›„ scatterplot์„ ๋น„๊ตํ•ฉ๋‹ˆ๋‹ค. ์ด์ƒ์น˜ ์ œ๊ฑฐ ์ดํ›„ ๋ฐฉํ–ฅ์„ฑ์ด ๋” ๋šœ๋ ทํ•ด์ง„ ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
 

2.7

x๋ฅผ ๋…๋ฆฝ๋ณ€์ˆ˜, y๋ฅผ ์ข…์†๋ณ€์ˆ˜๋กœ ๋‘๊ณ  ํ›ˆ๋ จ์„ธํŠธ์™€ ํ…Œ์ŠคํŠธ์„ธํŠธ๋กœ ๋‚˜๋ˆ ์ค๋‹ˆ๋‹ค. 

train_input์™€ test_input์€ 2์ฐจ์› ๋ฐฐ์—ด๋กœ ๋ฐ”๊พธ์–ด ์ €์žฅํ•ด์ค๋‹ˆ๋‹ค.

 

2.8

์„ ํ˜•ํšŒ๊ท€ ๋ชจ๋ธ lr1์„ ๋งŒ๋“ค์–ด train set์„ ํ™œ์šฉํ•ด ํ•™์Šต์‹œํ‚จ ๋‹ค์Œ, train set์˜ ์Šค์ฝ”์–ด๋Š” train_score1์—, test set์˜ ์Šค์ฝ”์–ด๋Š” test_socre1์— ์ €์žฅํ•ด์„œ ์ถœ๋ ฅํ•ด๋ณด๋ฉด ์Šค์ฝ”์–ด๊ฐ€ 1์— ๊ฐ€๊น๊ฒŒ ๋‚˜์˜จ ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

2.9

 train_input^2์„ ์ฒซ๋ฒˆ์งธ ์—ด๋กœ, train_input์„ ๋‘๋ฒˆ์งธ ์—ด๋กœ ๊ฐ–๋Š” 2d array์ธ train_poly๋ฅผ ๋งŒ๋“ค๊ณ 
 test_input^2์„ ์ฒซ๋ฒˆ์งธ ์—ด๋กœ, test_input์„ ๋‘๋ฒˆ์งธ ์—ด๋กœ ๊ฐ–๋Š” 2d array์ธ test_poly๋ฅผ ๋งŒ๋“ค์–ด์ค๋‹ˆ๋‹ค.

 

2.10

์„ ํ˜•ํšŒ๊ท€๋ชจ๋ธ l2๋ฅผ ๋งŒ๋“ค์–ด ์œ„์—์„œ ๋งŒ๋“  train_poly ์™€ test_poly๋กœ ํ•™์Šต์‹œํ‚จ ํ›„, score์„ ์ถœ๋ ฅํ•ด์ฃผ๊ณ  scatterplot๋„ ๊ทธ๋ ค์ค๋‹ˆ๋‹ค. scrore๊ฐ€ ๋” ๋†’์•„์กŒ์Œ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

2.11

์‹ค์ œ x๊ฐ’๊ณผ y๊ฐ’์˜ scatterplot์„ ๊ทธ๋ฆฐ ํ›„ train_input์„ ํ™œ์šฉํ•ด ํ•™์Šตํ•œ l1์— np.arrange(0,1,0.01)๋ฅผ ๋…๋ฆฝ๋ณ€์ˆ˜๋กœ ์‚ฌ์šฉํ•˜์—ฌ ๋„์ถœํ•œ ์˜ˆ์ธก๊ฐ’์„ ์ข…์†๋ณ€์ˆ˜๋กœ ํ•˜๋Š” plot๊ณผ train_poly๋ฅผ ํ™œ์šฉํ•ด ํ•™์Šตํ•œ l2์— np.arrange(0,1,0.01)๋ฅผ ๋…๋ฆฝ๋ณ€์ˆ˜๋กœ ์‚ฌ์šฉํ•˜์—ฌ ๋„์ถœํ•œ ์˜ˆ์ธก๊ฐ’์„ ์ข…์†๋ณ€์ˆ˜๋กœ ํ•˜๋Š” plot์„ ๊ทธ๋ ค์ค๋‹ˆ๋‹ค. (l1์ด ํŒŒ๋ž€์„ , l2๊ฐ€ ๋นจ๊ฐ„์„ )
lr1์„ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ์˜ train/test score ์™€ lr2๋ฅผ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ์˜ train/test score๋ฅผ ๋น„๊ตํ•ด๋ณด์•˜์„ ๋•Œ ๋‘˜๋‹ค ๋‹คํ•ญ์„ ํ˜•ํšŒ๊ท€๋ฅผ ์‚ฌ์šฉํ•œ ๊ฒƒ์ด ๋” ์ ์ˆ˜๊ฐ€ ๋†’๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

+ Recent posts