Jay Jo's Blog

TF-IDF (Term Frequency-Inverse Document Frequency)

TF-IDF는 텍스트 마이닝과 자연어 처리에서 문서 내 단어의 중요도를 평가하는 데 사용되는 통계적 방법입니다. 이 방법은 문서의 유일한 단어 빈도와 단어가 등장하는 문서의 수를 기반으로 작동합니다. 구성 요소 TF (Term Frequency): 특정 단어가 문서 내에서 얼마나 자주 등장하는지를 나타내는 지표입니다. IDF (Invers...

서포트 벡터 머신(SVM)

서포트 벡터 머신(SVM) 서포트 벡터 머신(SVM)은 지도 학습 모델 중 하나로, 주로 분류 문제를 해결하는 데 사용됩니다. 이 모델은 데이터 포인트를 분류하기 위해 결정 경계(하이퍼플레인)를 찾는 것을 목표로 합니다. 기본 개념 SVM의 기본 아이디어는 데이터 포인트들을 고차원 공간에 매핑하고, 이들 사이에 가장 넓은 마진을 가지는 결정 경계...