μ•„λž˜ μ±…κ³Ό μΈκ°•μœΌλ‘œ μŠ€ν„°λ”” μ§„ν–‰

https://www.inflearn.com/course/%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EA%B0%9C%EC%9D%B8%ED%99%94-%EC%B6%94%EC%B2%9C%EC%8B%9C%EC%8A%A4%ED%85%9C

1.1 μ£Όμš” μΆ”μ²œ μ•Œκ³ λ¦¬μ¦˜

μΆ”μ²œ μ‹œμŠ€ν…œμ— μ‚¬μš©λ  수 μžˆλŠ” μ•Œκ³ λ¦¬μ¦˜μ˜ μ’…λ₯˜λŠ” μžμ„Ένžˆ λΆ„λ₯˜ν•΄λ³΄λ©΄ 수천 κ°€μ§€κ°€ μžˆμ§€λ§Œ λŒ€μ²΄λ‘œ ν˜‘μ—… 필터링(Collaborative Filtering : CF), λ‚΄μš© 기반 필터링(Content-Based Filtering : CB), 지식 기반 필터링(Knowledge-Based Filtering : KB), λ”₯λŸ¬λ‹(Deep Learning : DL) μΆ”μ²œ 기술, ν•˜μ΄λΈŒλ¦¬λ“œ(Hybrid) 기술 λ“± λͺ‡ κ°€μ§€ μ•Œκ³ λ¦¬μ¦˜μ˜ λ³€ν˜•μ΄λΌκ³  ν•  수 μžˆλ‹€.

 

1) ν˜‘μ—… 필터링 (Collaborative Filtering : CF)

ν˜‘μ—… ν•„ν„°λ§μ΄λž€ ꡬ맀, μ†ŒλΉ„ν•œ μ œν’ˆμ— λŒ€ν•œ 각 μ†ŒλΉ„μžμ˜ 평가λ₯Ό λ°›μ•„μ„œ 평가 νŒ¨ν„΄μ΄ λΉ„μŠ·ν•œ μ†ŒλΉ„μžλ₯Ό ν•œ μ§‘λ‹¨μœΌλ‘œ λ¬Άμ–΄ κ·Έ μ§‘λ‹¨μ˜ μ†ŒλΉ„μžλ“€μ˜ μ·¨ν–₯을 ν™œμš©ν•˜λŠ” κΈ°μˆ μ΄λ‹€. 즉, 평가 νŒ¨ν„΄μ΄ λΉ„μŠ·ν•œ μ‚¬λžŒλ“€μ΄ κ³΅ν†΅μ μœΌλ‘œ μ’‹μ•„ν•˜λŠ” μ œν’ˆ 쀑 μ†ŒλΉ„μžκ°€ 아직 μ ‘ν•˜μ§€ μ•Šμ€ μ œν’ˆμ„ 골라 μ œμ‹œν•˜λŠ” κΈ°μˆ μ΄λ‹€. μ˜ν™”λ‚˜ μŒμ•… λ“± μ‚¬λžŒλ“€μ˜ μ·¨ν–₯이 뚜렷이 κ΅¬λΆ„λ˜λŠ” μ œν’ˆμ„ μΆ”μ²œν•  λ•Œ λ”μš± μ •ν™•ν•˜λ‹€. ν•œκ³„μ μœΌλ‘œλŠ” μ†ŒλΉ„μžλ“€μ˜ 평가 정보λ₯Ό κ΅¬ν•˜κΈ°κ°€ μ–΄λ ΅λ‹€λŠ” 점이 μžˆλŠ”λ°, 이λ₯Ό κ·Ήλ³΅ν•˜κΈ° μœ„ν•΄ 간접적인 정보λ₯Ό μ‚¬μš©ν•œλ‹€κ³  ν•œλ‹€. (관심사 κ²€μƒ‰μ΄λ‚˜ μž₯λ°”κ΅¬λ‹ˆ λ„£κΈ° λ“± 클릭슀트림 ν˜•νƒœλ‘œ μˆ˜μ§‘λ˜λŠ” 정보) μ•„λ§ˆμ‘΄μ˜ μ œν’ˆ μΆ”μ²œ μ‹œμŠ€ν…œμ΄λ‚˜ λ„·ν”Œλ¦­μŠ€ μΆ”μ²œ μ‹œμŠ€ν…œμ—μ„œ μ‚¬μš©λœλ‹€.

 

2) λ‚΄μš© 기반 필터링 (Content-Based Filtering : CB)

λ‚΄μš© 기반 ν•„ν„°λ§μ΄λž€ μ œν’ˆμ˜ λ‚΄μš©μ„ λΆ„μ„ν•΄μ„œ μ œν’ˆ κ°„μ˜ μœ μ‚¬μ„±μ„ μ΄μš©ν•΄ μΆ”μ²œν•˜λŠ” κΈ°μˆ μ„ λœ»ν•œλ‹€. λ‰΄μŠ€λ‚˜ μ±… λ“± ν…μŠ€νŠΈ 정보가 λ§Žμ€ μ œν’ˆμ„ λΆ„μ„ν•˜μ—¬ μΆ”μ²œν•  λ•Œ 많이 μ΄μš©λ˜λŠ” κΈ°μˆ μ΄λ‹€. ν…μŠ€νŠΈ μ€‘μ—μ„œ ν˜•νƒœμ†Œλ₯Ό μΆ”λ €λ‚΄κ³  뢄석해 핡심 ν‚€μ›Œλ“œλ₯Ό μ •λ¦¬ν•˜μ—¬ μ†ŒλΉ„μžμ˜ 관심 사항에 λŒ€ν•œ 뢄석이 κ°€λŠ₯ν•˜λ‹€.

 

3) 지식 기반 필터링 (Knowledge-Based Filtering : KB)

λ‚΄μš© 기반 필터링과 ν˜‘μ—… 필터링은 μ–΄λ–€ μ†ŒλΉ„μžκ°€ μ–΄λ–€ μ œν’ˆμ„ 쒋아할지에 λŒ€ν•œ 뢄석은 κ°€λŠ₯ν•˜μ§€λ§Œ μ™œ κ·Έ μ œν’ˆμ„ μ’‹μ•„ν• μ§€ 에 λŒ€ν•œ 닡을 ν•  수 μ—†λ‹€λŠ” ν•œκ³„λ₯Ό κ°€μ§€κ³  μžˆλ‹€.

 μ§€μ‹ 기반 필터링은 νŠΉμ • λΆ„μ•Ό(domain) μ „λ¬Έκ°€μ˜ 도움을 λ°›μ•„μ„œ κ·Έ 뢄야에 λŒ€ν•œ 전체적인 지식 ꡬ쑰λ₯Ό λ§Œλ“€μ–΄μ„œ 이λ₯Ό ν™œμš©ν•˜λŠ” 방법이닀. 전체적인 지식 κ΅¬μ‘°λŠ” λ‹€μ–‘ν•œ ν˜•νƒœλ‘œ ν‘œν˜„λ  수 μžˆλŠ”λ°, κ·Έ λΆ„μ•Όμ˜ μ€‘μš”ν•œ κ°œλ…μ„ κ°€μ§€κ³  체계도λ₯Ό λ§Œλ“œλŠ” 것이 κ°€μž₯ μΌλ°˜μ μ΄λ‹€.(ex 컴퓨터 -> PC, λ…ΈνŠΈλΆ‡, νƒœλΈ”λ¦Ώ λ“±μœΌλ‘œ ν•˜μœ„ ν‚€μ›Œλ“œλ‘œ λΆ„λ₯˜) 전체적인 ꡬ쑰λ₯Ό μ•Œ 수 있기 λ•Œλ¬Έμ— μ†ŒλΉ„μžκ°€ κ΅¬λ§€ν•œ, ν˜Ήμ€ 관심 μžˆλŠ” μ œν’ˆκ³Ό 관련이 μžˆλŠ” μ œν’ˆμ„ μ²΄κ³„λ„μ—μ„œ μ°Ύμ•„λ³Ό 수 있으며, 지식이 μ€‘μš”ν•œ λΆ„μ•Ό(ꡐ윑, 컀피 λ“±)μ—μ„œ νš¨κ³Όκ°€ μ’‹λ‹€. λ‹€λ§Œ 각 λΆ„μ•Όμ˜ μ „λ¬Έκ°€κ°€ ν•„μš”ν•˜κ³ , μ „λ¬Έκ°€μ˜ λŠ₯λ ₯μ—λŠ” ν•œκ³„κ°€ 있기 λ•Œλ¬Έμ— λͺ¨λ“  μ„Έμ„Έν•œ 뢄야에 μ μš©ν•  수 μ—†λ‹€λŠ” 단점이 μžˆλ‹€.

 

4) λ”₯λŸ¬λ‹ μΆ”μ²œ 기술 (Deep Learning : DL)

λ”₯λŸ¬λ‹ 방법을 μ‚¬μš©ν•˜λŠ” λ°©μ‹μœΌλ‘œ λ”₯λŸ¬λ‹μ˜ μž…λ ₯κ°’μœΌλ‘œ λ‹€μ–‘ν•œ μ‚¬μš©μžμ™€ μ•„μ΄ν…œμ˜ νŠΉμ§•κ°’(feature)을 μ‚¬μš©ν•˜κ³ , 이λ₯Ό 톡해 얻은 좜λ ₯값은 각 μ•„μ΄ν…œμ— λŒ€ν•œ μ‚¬μš©μžμ˜ μ˜ˆμƒ μ„ ν˜Έλ„λ₯Ό κ³„μ‚°ν•œ 값이닀. μ˜ˆμƒ μ„ ν˜Έλ„κ°€ 높은 μ•„μ΄ν…œμ„ μΆ”μ²œν•΄μ£Όλ©°, λ‹€μ–‘ν•œ μž…λ ₯ λ³€μˆ˜ μ‚¬μš©μ΄ κ°€λŠ₯ν•˜λ‹€. 일반적으둜 이미지 μΈμ‹μ—μ„œ μ„±λŠ₯이 μ’‹μœΌλ‚˜, μ—°μ†κ°’μœΌλ‘œ ν‘œμ‹œλ˜λŠ” μ•„μ΄ν…œμ— λŒ€ν•œ μ„ ν˜Έλ„ 계산은 정확도가 크게 μš°μ›”ν•˜μ§€ μ•Šμ•„ λ‹€λ₯Έ μ•Œκ³ λ¦¬μ¦˜κ³Ό 같이 μ‚¬μš©λœλ‹€.

 

5) ν•˜μ΄λΈŒλ¦¬λ“œ 기술(Hybrid)

μ‹€μ œλ‘œ μΆ”μ²œ μ‹œμŠ€ν…œμ„ ꡬ좕할 λ•ŒλŠ” κΈ°μˆ μ„ ν•œ κ°€μ§€λ§Œ μ‚¬μš©ν•˜λŠ” κ²½μš°λŠ” λ³„λ‘œ μ—†κ³  λŒ€λΆ€λΆ„ 두 κ°€μ§€ μ΄μƒμ˜ κΈ°μˆ μ„ ν˜Όν•©ν•΄μ„œ μ‚¬μš©ν•˜λŠ” ν•˜μ΄λΈŒλ¦¬λ“œ ν˜•νƒœλ‘œ μ‚¬μš©λœλ‹€. 볡수의 κΈ°μˆ μ„ μ‚¬μš©ν•˜λŠ” κ²½μš°μ— 정확도가 ν–₯μƒλ˜κ³  κ²°ν•©λ˜λŠ” 기술의 μ’…λ₯˜κ°€ λ§Žμ•„μ§ˆμˆ˜λ‘ 더 큰 ν–₯상이 이루어진닀. (ex CF + CB = Reco)

 

1.2 μΆ”μ²œ μ‹œμŠ€ν…œ 적용 사둀

λ„·ν”Œλ¦­μŠ€μ˜ 경우 ν˜‘μ—… 필터링 κΈ°μˆ μ„ μ‚¬μš©ν•΄μ„œ 고객을 μœ„ν•œ μ˜ν™” μΆ”μ²œ μ‹œμŠ€ν…œμ„ μ‚¬μš©ν•œλ‹€. 각 고객의 μ·¨ν–₯에 따라 λ§žμΆ€ν™”μ™€ κ°œμΈν™”κ°€ λœλ‹€.

μ•„λ§ˆμ‘΄μ˜ 경우 ν˜‘μ—… μ‹œμŠ€ν…œμ„ 기반으둜 λ‹€μ–‘ν•œ μΆ”μ²œ κΈ°μˆ μ„ κ²°ν•©ν•œ ν•˜μ΄λΈŒλ¦¬λ“œ 기술이 μ μš©λ˜μ–΄ μžˆλ‹€. μ‚¬μš©μžμ˜ μ œν’ˆμ— λŒ€ν•œ 평가 데이터λ₯Ό λ‹€μ–‘ν•œ λ°©λ²•μœΌλ‘œ μˆ˜μ§‘μ΄ κ°€λŠ₯ν•˜λ‹€λŠ” νŠΉμ§•μ΄ μžˆλ‹€. μ•„λ§ˆμ‘΄μ€ μ·¨κΈ‰ν•˜λŠ” μ œν’ˆμ˜ μ’…λ₯˜μ™€ μΉ΄ν…Œκ³ λ¦¬κ°€ μ—¬λŸ¬κ°€μ§€ 이며 μ‚¬μš©μž μˆ˜λ„ 훨씬 λ°©λŒ€ν•˜λ©° μ„ ν˜Έ μ •λ³΄μ˜ μ’…λ₯˜κ°€ 더 λ‹€μ–‘ν•˜κΈ° λ•Œλ¬Έμ— μ•„λ§ˆμ‘΄μ€ λ„·ν”Œλ¦­μŠ€λ³΄λ‹€ 더 λ³΅μž‘ν•˜κ³  μ–΄λ €μš΄ μ‹œμŠ€ν…œμ„ μ‚¬μš©ν•œλ‹€.

+ Recent posts