Laske kahden merkkijonon samankaltaisuus useilla algoritmeilla kuten Levenshtein, Jaro-Winkler ja muut
Mikä on Levenshtein-etäisyys?
Levenshtein-etäisyys mittaa pienimmän yksittäisten merkkien muokkausten (lisäysten, poistojen tai korvausten) määrän, joka tarvitaan yhden merkkijonon muuttamiseksi toiseksi.
Mikä on Jaro-Winkler-samankaltaisuus?
Jaro-Winkler-samankaltaisuus antaa korkeammat pisteet merkkijonoille, jotka täsmäävät alusta lähtien. Sitä käytetään yleisesti nimien täsmäytykseen.
Mikä on ero kosini- ja Jaccard-samankaltaisuuden välillä?
Kosini-samankaltaisuus käyttää merkkien n-grammivektoreita, kun taas Jaccard vertaa sanajoukkoja leikkauksen ja unionin suhteella.
Lähetetäänkö tietoni palvelimelle?
Ei, kaikki laskelmat suoritetaan paikallisesti selaimessasi. Tekstisi ei koskaan poistu laitteestasi.