• Основен
  • Новини
  • Въпроси и отговори: Нарастващото използване на „файлове на избиратели“ при изучаване на електората в САЩ

Въпроси и отговори: Нарастващото използване на „файлове на избиратели“ при изучаване на електората в САЩ

(Saul Gravy / Getty Images)

След възхода на съвременните проучвания преди три четвърти век, голяма част от това, което знаем за нагласите на гласоподавателите, се основава на интервюта с произволни извадки от избиратели, понякога комбинирани с изчисления на действителните гласове и характеристиките на избирателите в определени места. Но относително новите технологии и промените в публичната политика дадоха на социолозите, академиците и други изследователи - да не говорим за кандидати и политически професионалисти - потенциално мощен инструмент за изследване на електората: цифрови бази данни, за които се твърди, че покриват по-голямата част от възрастното население на САЩ.


Въпреки широкото им използване, тези национални бази данни (често наричани „досиета на гласоподавателите“) са малко известни на широката общественост и не са получили особено внимание от страна на науката. Рут Игелник, изследователски център на Pew, и старши съветник по проучването Скот Китър наскоро публикува обширно проучване на пълнотата и точността на наличните в търговската мрежа избирателни досиета, което те оцениха чрез съпоставяне на участниците от националния представител на Американската група за тенденции на Центъра с пет различни избиратели файлове. Помолихме Keeter и Igielnik да поговорят за тяхната работа, включително как се изграждат избирателните файлове и за какво се използват. Отговорите им са редактирани за яснота и сбитост.

Какво изобщо е „файл на избирател“? Информацията за гласуване не е ли частна?

Рут Игелник, научен сътрудник на Pew Research Center

Добър въпрос! Тези цифрови бази данни - известни като „досиета на гласоподаватели“ - са изградени от търговски организации, като се използват официални, публично достъпни държавни записи за това кой е регистриран за гласуване и кой гласува на минали избори. Те не само дават общонационална картина на регистрацията на избирателите и избирателната активност, но също така обикновено включват информация от външни източници на данни (като доставчици на потребителски данни, кредитни бюра и политически организации) и се предлагат на пазара като богата и изчерпателна информация за почти всеки американец възрастен.

Въпреки това, докато информацията за записа на избирателния файл показвадали или ненякой е гласувал на дадени избори, това не означавана когототе гласуваха за. Това остава с вас в кабината за гласуване.


Кой използва тези избирателни файлове и как?Скот Кийтър, старши консултант по проучване на Pew Research Center

Освен кампаниите, досиетата на избирателите се използват от анкетиращи, академични изследователи и журналисти, които искат да разберат по-добре американците и да отговорят на конкретни въпроси относно избирателите и изборите. Някои полезни приложения на досиетата на избирателите включват демографския състав на електората, какви избиратели са склонни да гласуват предсрочно или чрез отсъствие, кой гласува на първични избори и какъв тип хора са обичайни спрямо епизодични избиратели.


Защо решихте, че сега е подходящ момент за оценка на качеството на досиетата на гласоподавателите, за разлика от, да речем, преди пет или 10 години?

Докато кампаниите използват тези бази данни от години, неотдавнашното нарастване на използването от академични среди, изследователи и журналисти насочи вниманието ни към досиетата на избирателите като друг потенциален инструмент за разбиране на електората в САЩ. Изследванията върху досиетата на избирателите също се вписват в по-широкия дневен ред на Центъра за изследване на нови методологии за анкетиране. Анкетиращите все по-често използват досиетата на избирателите като потенциален източник на извадки за проучвания и в бъдеще планираме да проучим полезността на файловете за тази цел.


По-рано казахте, че досиетата на избирателите се изграждат от търговски организации. Много ли се различават резултатите между тези доставчици, като се има предвид, че всички те получават основните си данни от едни и същи официални източници?

Вярно е, че официалните избори за регистрация и избирателна активност не се различават много. Това, което се различава, е каква друга информация се добавя към файловете, като например избирателната активност на минали избори и други адреси - или, в случая с нашето проучване, кой се съпоставя от данните от проучването на Американската група за тенденции. Докато търговските компании или доставчици на файлове за гласуване получават данните си от официалните държавни записи, как те събират и съпоставят тези записи и каква допълнителна информация, която предоставят за хората, съставляват „тайния сос“, който ги отличава един от друг.

Първо, продавачите се различават по начина, по който проследяват американците, докато се движат в щатите. Въпреки че федералният закон (Законът за подпомагане на гласуването в Америка от 2002 г.) изисква всеки щат да води индивидуален списък на своите избиратели, администрирането на избори в САЩ в исторически план е било силно децентрализирано, така че хармонизирането на държавните регистри може да бъде предизвикателство. Според данни от юни 2017 г. от нашия американски панел за тенденции, 16% от американците са заявили, че са живели на настоящия си адрес по-малко от една година. Тези хора стават още по-трудни за намиране, ако са сменили името си или са се преместили често.

След това има допълнителни доставчици на анализ. Търговските файлове на гласоподавателите обикновено предлагат оценки за неща като партийност и очаквана избирателна активност за бъдещи избори. Тези резултати се генерират чрез процес, известен като прогнозно моделиране, и те се различават по своята наличност и точност. Например като цяло моделите, предоставени от продавачите в това проучване, са били по-добри в прогнозирането на нечия партийна принадлежност и раса, отколкото тяхното образование или доходи.


Как избрахте кои доставчици на избирателни файлове да използвате за това проучване?

Доставчиците, използвани в това проучване, представляват пет от най-известните и често използвани досиета на избирателите. Доставчиците включват такива, които традиционно са безпартийни, както и тези, чиито клиенти са предимно демократични и политически прогресивни или републикански и политически консервативни.

Целта на проучването обаче не беше да се съсредоточи върху отделни доставчици или да открои конкретни доставчици като особено добри или лоши. Искахме да разгледаме представителна извадка от основните търговски досиета на гласоподаватели, за да можем да разберем техните силни и слаби страни по отношение на допълването на съществуващите данни от проучването или служещи като рамки за извадка за нови проучвания на общественото мнение. Поради това анонимизирахме файловете и оставихме имената на доставчиците извън този анализ.

Колко варираха пълнотата и точността на петте избирателни файлове, които сте изучавали?

Много, в зависимост от това какво измервате. Например всички продавачи бяха относително точни (и сходни) по отношение на това колко добре предсказваха нечия партийна принадлежност. Средно те са били точни 67% от времето и всички файлове са свършили по-добра работа при правилното идентифициране на демократите от републиканците. За разлика от това, досиетата варират значително по отношение на точната класификация на образованието на респондентите - те варират от 27% правилни до 66% правилни в зависимост от досието, а някои файлове липсват изцяло образование.

Сравнихте съдържанието в досиетата на избирателите с данни от американския панел за тенденции на Pew Research Center. Коя находка ви е поразила най-много?

Относително високото качество на много от моделираните променливи, произведени от доставчиците, беше важна констатация. Например преди общите избори през 2016 г. всеки доставчик е предоставил мярка за вероятност за участие в изборите. Прилагането на тези мерки подобри точността на оценката на American Trends Panel за предпочитанията на гласоподавателите в президентската надпревара. Оценката стесни предимството на Хилари Клинтън от 7 процентни пункта сред всички регистрирани гласоподаватели до диапазон от 3 до 5 точки сред вероятните избиратели, като се използват моделираните оценки на избирателната активност. В деня на изборите Клинтън завърши с 2 точки предимство пред Доналд Тръмп в народния вот. Миналата история на гласоподавателите е ключов компонент на тези модели, но точните алгоритми, които доставчиците използват, не са публични.

По същия начин моделите на продавачите за предсказване на нечия съпричастност и раса бяха доста точни. Средно за петте файла,моделиранипартийна принадлежност съвпадасамоотчитанепартийна принадлежност за около две трети от участниците в дискусията (67%). И в 79% от случаите средно моделите, налични в избирателните досиета, точно предсказват расата на нашите респонденти.

Установихте, че петте досиета на гласоподавателите са по-пълни и точни в съответствие с данните на американския панел за тенденции, отколкото всеки отделен файл. Какви уроци трябва да извлекат изследователите и другите потребители на досиетата на избирателите?

Това е вярно. Заедно петте файла, които проучихме, успяха да съвпаднат с повече от девет на всеки десет участници (91%), но процентите на съвпадение за отделните файлове бяха по-ниски, вариращи от 50% до 79%. Всеки файл обаче успя да намери хора, които други файлове пропуснаха, вероятно поради различните алгоритми за съвпадение, използвани от доставчиците.

Това, което научихме в процеса на съвпадение, е, че има компромис между точността на съвпадението (т.е. вярвате ли, че полученото съвпадение на избирателния файл е правилният човек?) И покритието (т.е. процентът на хората, които могат да бъдат сравнени). По-ниските нива на съвпадение обикновено изглеждат по-точни, но непропорционално изключват по-младите и мобилните хора. Високите нива на съвпадение създават по-представителни проби, но може да включват и по-неточни съвпадения.

Въпреки че успяхме да използваме пет различни файлове на избиратели в това изследване, повечето изследователи ще използват само един файл. В този случай е важно да помислите за целите на вашето изследване - в зависимост от това, което изследвате, може да цените покритието над точността или обратното.

Също така установихте, че досиетата отразяват по-скоро регистрираната избирателна популация, отколкото широката общественост като цяло - което има смисъл, предвид начина на тяхното извличане. Как това ограничава тяхната полезност за изследователи и други потребители?

Когато досиетата на гласоподавателите за първи път излязоха на видно място сред политическите практикуващи и изследователите, много бяха точно това, което подсказва името - списъци с регистрирани избиратели. Но тъй като използването на файлове за гласуване за изследвания и насочване стана все по-широко разпространено, повечето доставчици се опитаха да покриятвсичкоВъзрастни в САЩ, включително тези, които не са регистрирани да гласуват. Тъй като основният компонент на досиетата е комбинация от официални държавни списъци с регистрирани гласоподаватели, доставчиците са потърсили търговски бази данни - достъпни от източници като агенции за кредитен рейтинг - за намиране на американци, изчезнали от държавните избирателни списъци.

Колективните резултати от петте досиета предоставят доказателство, че нерегистрираните не са напълно невидими за търговските досиета от този вид, разгледани в това проучване. Две трети от онези, които ни казаха, че са сигурни, че не са регистрирани, са разположени от поне един от досиетата. Въпреки това, изследователите трябва да действат с повишено внимание, когато използват този инструмент за изследване на общото население като цяло, тъй като видовете хора, пропуснати от досиетата, могат да бъдат много различни в политически и демографски план от хората, които продавачите могат да намерят.

Като се имат предвид резултатите от вашето проучване, какво е вашето вземане за това как трябва и не трябва да се използват избирателните файлове?

Нашата работа не разглежда използването на файловете за насочване на кампании, което е може би най-честото им приложение. Но за изследователите файловете предлагат сравнително лесен начин за изследване на реалния електорат - кой наистина е гласувал - и за добавяне на данни за регистрация и избирателна активност към анкетите. Анкетиращите предизборни кампании отдавна разчитат на досиетата, за да предоставят доказателства за миналото гласуване като предиктор за бъдеща избирателна активност, както и да предоставят рамка за вземане на проби за проучвания на изборите и ние виждаме продължаваща стойност в това. Все още не сме оценили файловете като източници на проби за проучвания сред широката публика, но останете на линия - може да имаме още какво да кажем за това в бъдеще.

За повече информация относно досиетата на избирателите прочетете пълното проучване „Търговски файлове на избирателите и изследването на политиката на САЩ“.