PORADNIK DLA KLIENTÓW
3. Zmienne wielokrotne
W wielu przypadkach, szczególnie w ankietach socjologicznych i marketingowych, mamy do czynienia z tak zwanymi zmiennymi wielokrotnymi. Rozpatrzmy następujące typowe pytanie z ankiety
Pyt 1. Jakie rodzaje programów telewizyjnych najbardziej lubisz oglądać? (zaznacz maksymalnie 3 odpowiedzi)
- sportowe
- rozrywkowe
- kryminalne
- przyrodnicze
- teleturnieje
- reality show
- informacyjne
- edukacyjne
- inne(jakie?)......................................
Respondent mógł na tak sformułowane pytanie udzielić od zera (nic nie zaznaczył) do maksymalnie dziewięciu odpowiedzi (wybrał wszystkie). Często liczba odpowiedzi w takich pytaniach jest ograniczana instrukcją typu "zaznacz maksymalnie trzy odpowiedzi" lub podobną, tak jak jest w podanym przykładzie.
Dane z takiego pytania możemy zakodować na dwa sposoby:
1. jako zmienne kategorialne (ang. multiple response)
lub
2. jako zmienne dychotomiczne (ang. multiple dichotomy)
3.1. Zmienne kategorialne
W tym przypadku dla zakodowania zmiennej rezerwujemy pewną stałą liczbę kolumn w zbiorze danych. Jeżeli w instrukcji do pytania było ograniczenie typu "zaznacz maksymalnie trzy odpowiedzi", możemy przeznaczyć na to pytanie trzy kolumny. W pierwszej będzie numer pierwszej odpowiedzi, w drugiej kolumnie numer drugiej wybranej odpowiedzi, a w trzeciej numer ostatniej wybranej odpowiedzi.
Załóżmy, że przebadaliśmy powyższym pytaniem trzy osoby i uzyskaliśmy następujące odpowiedzi:
- osoba wybrała 3., 4. i 6. odpowiedź (lubi programy kryminalne, przyrodnicze i reality show),
- osoba wybrała 2. i 3. odpowiedź (lubi programy rozrywkowe i kryminalne),
- osoba nic nie zaznaczyła.
Metodą zmiennych wielokategorialnych zostałoby to zakodowane następująco:
| lp | p1_1 | p1_2 | p1_3 |
| 1 | 3 | 4 | 6 |
| 2 | 2 | 3 | 0 |
| 3 | 0 | 0 | 0 |
Brakujące pozycje uzupełnia się umownie zerem, dlatego ostatnia osoba ma zaznaczone trzy zera. Oczywiście nikt spośród badanych nie mógł zaznaczyć czterech odpowiedzi, bo wtedy należałoby przeznaczyć dla zakodowania zmiennej tą metodą cztery kolumny.
Sposób ten ma szczególnie zastosowanie wtedy, kiedy:
- nie będziemy przeprowadzać na tych zmiennych testów istotności;
- jest dużo kategorii do wyboru;
- respondenci wybierali niewiele kategorii z obszernej listy.
3.2. Zmienne dychotomiczne
W tym przypadku na zmienną przeznaczamy tyle kolumn, ile jest kategorii. Każda kategoria jest w osobnej kolumnie. Przy tym sposobie kodowania zbiór danych zajmuje więcej miejsca, ale za to lepiej nadaje się do obliczeń statystycznych. Zaznaczenie kategorii jest kodowane umownie jedynką, niezaznaczenie - zerem. Dla powyższego pytania i odpowiedzi od trzech wymienionych powyżej osób uzyskalibysmy nastepującą tabelę:
| lp | p1_1 | p1_2 | p1_3 | p1_4 | p1_5 | p1_6 | p1_7 | p1_8 | p1_9 |
| 1 | 0 | 0 | 1 | 1 | 0 | 1 | 0 | 0 | 0 |
| 2 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
| 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
Pytanie miało dziewięć odpowiedzi, dlatego w zbiorze danych zajmuje ono dziewięć kolumn - po jednej na każdą możliwą odpowiedź. Pierwsza osoba zaznaczyła 3., 4. i 6. odpowiedź, dlatego w tych kolumnach ma jedynki. Druga osoba ma dwie jedynki - w 2. i 3. kolumnie. Ostatnia osoba, ponieważ nic nie wybrała, ma same zera.
Ten sposób kodowania stosujemy wtedy, gdy
- będziemy przeprowadzać testy istotności;
- mamy mało kategorii;
- nie wiemy, ile maksymalnie mogło być odpowiedzi; w skrajnym wypadku jedna osoba mogłaby zaznaczyć nawet wszystkie kategorie.




