miary powiązań i podobieństwa informacyjnego

    Cards (26)

    • Co to są miary odległości w kontekście danych?
      Narzędzia do określania różnicy między danymi
    • Jakie miary odległości są używane w kontekście EI?
      Odległość Jaccarda, Levensteina, Euklidesa
    • Do czego służy odległość Jaccarda?
      Ocena podobieństwa między zestawami danych
    • Jak jest zdefiniowana odległość Jaccarda?
      Rozmiar przecięcia zestawów podzielony przez sumę
    • Co oznacza |𝐴 ∩ 𝐵| w indeksie Jaccarda?
      Rozmiar przecięcia zbiorów 𝐴 i 𝐵
    • Co oznacza |𝐴 ∪ 𝐵| w indeksie Jaccarda?
      Rozmiar sumy zbiorów 𝐴 i 𝐵
    • Jakie wartości może przyjmować indeks Jaccarda?
      Od 0 do 1
    • Co oznacza wartość indeksu Jaccarda równa 0?
      Zbiory 𝐴 i 𝐵 są rozłączne
    • Co oznacza wartość indeksu Jaccarda równa 1?
      Zbiory 𝐴 i 𝐵 są identyczne
    • Jak obliczyć indeks Jaccarda dla zbiorów 𝐴 = {1,2,3,4} i 𝐵 = {3,4,5,6}?
      �(𝐴, 𝐵) = 26=\frac{2}{6} =130,33 \frac{1}{3} \approx 0,33
    • Co to jest odległość Levensteina?
      Minimalna liczba edycji potrzebnych do przekształcenia ciągu
    • W jakim kontekście stosuje się odległość Levensteina?
      Ocena podobieństwa między ciągami znaków
    • Jak obliczyć odległość Levensteina między "kot" a "kota"?
      Wynosi 1, wymagana jedna operacja
    • Jak oblicza się odległość Levensteina krok po kroku?
      1. Stworzenie macierzy (n+1) x (m+1)
      2. Wypełnienie pierwszego wiersza i kolumny
      3. Obliczenie kosztów usunięcia, wstawienia, zamiany
      4. Wpisanie minimalnej wartości do bieżącej komórki
      5. Odczytanie wartości w prawym dolnym rogu
    • Co to jest odległość Euklidesa?
      Odległość między dwoma punktami w przestrzeni Euklidesowej
    • Jakie zastosowanie ma odległość Euklidesa w NLP?
      Ocena podobieństwa między wektorami tekstów
    • Co to jest dystans Hamminga?
      Liczba miejsc, w których bity są różne
    • W jakim kontekście stosuje się dystans Hamminga?
      Porównywanie dwóch ciągów o tej samej długości
    • Jak obliczyć dystans Hamminga dla dokumentów "Kot śpi na kanapie." i "Pies śpi pod kanapą."?
      Dystans Hamminga wynosi 6
    • Co to jest odległość kosinusowa?
      Miara kąta między dwoma wektorami
    • Jakie zastosowanie ma odległość kosinusowa w analizie tekstu?
      Określenie podobieństwa między dokumentami
    • Jak obliczyć odległość kosinusową dla wektorów [1,1,0] i [1,0,1]?
      Odległość kosinusowa wynosi 0,5
    • Co to jest indeks Dice'a?
      Miara podobieństwa między dwoma zestawami danych
    • Jak jest zdefiniowany współczynnik Dice'a?
      2 × |𝑋 ∩ ��| / (|𝑋| + |𝑌|)
    • Jak obliczyć indeks Dice'a dla zestawów {kot, pies} i {kot, ryba}?
      Indeks Dice'a wynosi 0,5
    • Jakie są zastosowania miar odległości i podobieństwa w NLP?
      • Klasyfikacja tekstu
      • Grupowanie dokumentów
      • Wykrywanie duplikatów
      • Rozpoznawanie nazw
      • Użycie w heurystyce, uczeniu maszynowym i głębokim uczeniu
    See similar decks