문자열 유사도
Levenshtein, Jaro-Winkler 등 여러 알고리즘으로 두 문자열의 유사도를 계산
자주 묻는 질문
레벤슈타인 거리란 무엇인가요?
레벤슈타인 거리는 한 문자열을 다른 문자열로 변환하는 데 필요한 최소 단일 문자 편집(삽입, 삭제, 대체) 횟수를 측정합니다.
자로 윙클러 유사도란 무엇인가요?
자로 윙클러 유사도는 시작 부분부터 일치하는 문자열에 더 높은 점수를 부여합니다. 이름 매칭에 자주 사용됩니다.
코사인 유사도와 자카드 유사도의 차이는?
코사인 유사도는 문자 n-gram 벡터를 사용하고, 자카드 유사도는 교집합/합집합 비율로 단어 집합을 비교합니다.
데이터가 서버로 전송되나요?
아니요, 모든 계산은 브라우저에서 로컬로 수행됩니다. 텍스트가 기기를 떠나지 않습니다.