• Glavni
 • Metode
 • Komercijalni birački dosjei i proučavanje američke politike

Komercijalni birački dosjei i proučavanje američke politike

Napisali Ruth Igielnik, Scott Keeter, Courtney Kennedy i Bradley Spahn

Od uspona suvremenih anketnih istraživanja, većina onoga što je poznato o stavovima birača, ponašanju i sastavu biračkog tijela dolazi iz intervjua s uzorcima birača, ponekad u kombinaciji s zbirnom statistikom glasanja. No relativno nedavne tehnološke inovacije i promjene vladine politike dale su političkim praktičarima i istraživačima novi dodatak njihovom alatu: nacionalne digitalne baze podataka ili 'datoteke birača'. Ove datoteke grade komercijalne organizacije pomoću službenih, javno dostupnih državnih zapisa o tome tko je registriran za glasanje i tko je glasao na prošlim izborima.

Kako su istraživanja i ciljanje pomoću ovih biračkih datoteka postajali sve rašireniji, dobavljači datoteka birača sve više pokušavaju osigurati pokrivenostsviPunoljetne osobe u SAD-u, uključujući one koji nisu registrirani za glasovanje. Te komercijalno dostupne datoteke pružaju ne samo nacionalnu sliku registracije i odaziva birača, već se obično dopunjuju informacijama dobavljača podataka potrošača, kreditnih ureda, političkih organizacija i drugih izvora te se na tržištu nude kao bogata i sveobuhvatna evidencija za gotovo svaku odraslu Amerikanku. .

Tijekom posljednjeg desetljeća komercijalni podaci o biračima postali su ključni za provođenje suvremenih predizbornih kampanja i često ih zapošljavaju anketari, novinari i politički analitičari koji pokušavaju razumjeti američko biračko tijelo. Kao dio šireg napora istraživačkog centra Pew da rasvijetli ovaj važan, ali pomalo tajnovit resurs, ovo se izvješće usredotočuje na korištenje datoteka kako bi poboljšalo naše razumijevanje ispitanika u anketi. Također pokušava procijeniti kvalitetu podataka koje datoteke pružaju.

Da bi se postigli ovi ciljevi, podaci o biračkim spisima prikupljeni od pet komercijalnih dobavljača usklađeni su sa sudionicima Pew Research Center-ovog panela American Trends, nacionalno reprezentativnog uzorka odraslih koji su se složili redovito provoditi ankete. Ovo nudi priliku za usporedbu podataka o registraciji birača i podataka o odazivu koji su prijavili sami, a koji su podvrgnuti dobro dokumentiranim pogreškama u anketi, s visokokvalitetnim službenim zapisima glasanja koji su uključeni u biračke dosjee. Također pruža mogućnost korištenja podataka prikupljenih anketnim intervjuima s panelistima kako bi se provjerila točnost pomoćnih podataka koje komercijalni dobavljači pridaju biračkim spisima, uključujući dodatne demografske, financijske, životne i političke podatke.

Izvori podataka

Kako bi opisao i procijenio biračke dosjee, Pew Research Center pokušao je povezati svih gotovo 5.000 članova Američkog povjerenstva za trendove (ATP), nacionalno reprezentativnog anketnog povjerenstva za odrasle ljude u SAD-u, s pet komercijalnih biračkih spisa. Dvije su datoteke od nestranačkih dobavljača, dvije su od dobavljača koji prvenstveno rade s demokratskim i politički naprednim klijentima, a jedan od dobavljača koji prvenstveno rade s republikanskim i politički konzervativnim klijentima. Dobavljači su anonimni i broje se od jedan do pet u ovom izvješću, poredani prema stopi kojom su se podaci o biračkim spisima podudarali s članovima vijeća.Svim dobavljačima pružene su iste informacije panelista za pretraživanje, koji su uključivali njihovo ime, adresu, spol, telefonski broj, rasu i nacionalnost, datum rođenja ili dob i adresu e-pošte. Tada su dobavljači zamoljeni da pronađu te osobe u svojim biračkim spisima koristeći njihovu uobičajenu metodologiju podudaranja. Dobavljači su potom istraživačima Centra pružili podatke o biračkim spisima o registraciji i odazivu birača, pripadnosti strankama i demografskim karakteristikama za svakog panelista kojem su mogli podudarati. Dobavljači su bili obvezni čuvati ove podatke u strogom povjerenju i trajno izbrisati sve podatke koji identificiraju osoblje o panelistima kad je podudaranje završeno. Sveukupno, 91% od 3.985 aktivnih članova ATP-a koji su sudjelovali u istraživanju provedenom od 29. studenog do 12. prosinca 2016. (i koji su naveli ime) podudara se barem s jednim dobavljačem.1

Sažetak nalaza

Komercijalni birački spisi spajanje su administrativnih podataka država o registraciji i glasovanju, modeliranih podataka o stranstvu, političkom angažmanu i političkoj podršci koju pružaju dobavljači; i demografski, financijski i podaci o životnom stilu prikupljeni iz širokog spektra izvora. Objedinjavanje podataka iz više različitih izvora donosi izazove, jer svaki izvor dolazi sa svojim prednostima i nedostacima. Glavni cilj ove studije bio je procijeniti točnost i potpunost podataka u komercijalnim biračkim spisima. Za većinu analiza koriste se podaci koje pružaju ispitanici u American Trends Panel za ocjenu kvalitete podataka u biračkim spisima. Evo nekoliko najvažnijih nalaza, nakon kojih slijede dodatni detalji iz analize:

 • Istraživači su uspjeli povezati vrlo visok postotak članova panel diskusije iz nacionalno reprezentativnog uzorka ankete s barem jednim od pet komercijalnih dosjea birača, što sugerira da datoteke zajednički pokrivaju velik udio američke populacije.Ovisno o dobavljaču datoteke birača, postotak podudarnih članova varirao je od najnižih 50% do visokih 79%, sa prosječnom stopom podudaranja od 69%. Manje od polovice (42%) panelista bilo je smješteno u svih pet datoteka, ali svaki je dobavljač 'pronašao' paneliste koji su nedostajali drugim dobavljačima. Razlike među dobavljačima uglavnom su funkcija njihove tolerancije na neusklađenost i, vjerojatno, uspjeha njihovih algoritama za podudaranje. Kolektivno, dobavljači su uspješno pronašli 91% panelista, što znači da se više od devet od deset panelista moglo naći u barem jednoj datoteci, a samo 9% panelista nije bilo u niti jednoj datoteci. Relativno visoka razina pokrivenosti datostima ohrabruje istraživače i kampanje koje ih koriste za ciljanje, slanje poruka ili istraživanje. Naravno, većina klijenata koji koriste ove datoteke birača neće kupiti svih njih pet, tako da će stope podudaranja od 90% i više biti teško, ako ne i nemoguće postići bilo kojom pojedinom datotekom.
 • Ipak, komercijalni podaci o biračima mogu nesrazmjerno propustiti segmente javnosti koji su politički neaktivni, mlađi, Hispanjolci i pokretniji.Točnije, vjerojatnost pronalaska pojedinca u komercijalnom biračkom spisu bila je jako povezana s tim jesu li registrirani za glasovanje. U prosjeku se među pet dobavljača podudaralo 77% ljudi koji su izjavili da su registrirani za glasovanje. Tek je 38% samoopisanih neregistriranih birača bilo podudarno. Slično tome, stope podudaranja uvelike su se razlikovale prema dobi, rasi i etničkoj pripadnosti panelista. U svih pet dosjea pronađeno je samo oko petog mlađeg panelista (22% od one dobi od 18 do 29 godina), u usporedbi s više od polovice (59%) starijih panelista (u dobi od 65 godina i više). Slično tome, u svih pet datoteka pronađeno je samo 26% Latinoamerikanaca, u usporedbi s 47% bijelaca bez hispanskog porijekla.2Mobilnost je također snažna korelacija. Samo 14% onih koji su prijavili preseljenje u prošloj godini pronađeno je u svih pet spisa. Oni koji su prijavili da duže žive u svom prebivalištu podudarali su se po znatno većoj stopi.
 • Kao rezultat sustavnih demografskih razlika u vrstama ljudi koje je bilo teško locirati u spisima, ova analiza otkriva da komercijalni birački dosjei mogu imati značajna ograničenja u nastojanju da se prouči šira javnost (za razliku od registriranih birača).U usporedbi s uzorcima telefonskih brojeva sa slučajnim znamenkama, birački dosjei ne pružaju jednak stupanj pokrivenosti odrasle populacije, a vrste ljudi kojima datoteke nedostaju mogu se politički i demografski vrlo razlikovati od onih koje se mogu naći u datoteke i kontaktirali telefonom.
 • Postupak uparivanja članova ankete s datotekama birača može biti zasmetan malim razlikama u imenima i adresama, što dovodi do dvosmislenosti u pogledu točnosti nekih podudaranja.Osim toga, poteškoće s podudaranjem povezane su s načinom života i demografskim čimbenicima - poput čestog mijenjanja prebivališta - koji su također povezani s političkim angažmanom i stranačkim preferencijama.
 • Među pet dobavljača postojale su značajne razlike u stilovima podudaranja i, kao rezultat, u stopama podudaranja.Neki su dobavljači ograničili svoje podudaranje samo na paneliste za koje su imali vrlo visok stupanj sigurnosti u točnosti podudaranja, što je rezultiralo starijim i politički angažiranijim skupom odgovarajućih panelista. Drugi su dobavljači drukčije procijenili kompromis i podudarali se s većim udjelom panelista, stvarajući raznovrsniju podudarnu skupinu, prihvaćajući više nesigurnosti u pogledu točnosti svojih utakmica.
 • Datoteke se općenito slažu u odnosu na odaziv birača na predsjedničkim izborima 2016. godine (barem među ispitanicima koji imaju zajedničko podudaranje), iako se činilo da jedan od spisa propušta broj birača zarobljenih u ostala četiri spisa. A ne postoji evidencija glasanja za gotovo sve ispitanice koji su u post-izbornom istraživanju rekli da nisu glasali 2016. Među panelistima koji su se podudarali sa svim dobavljačima u studiji, 85% ima identične podatke o odazivu u svih pet datoteke: 75% je zabilježeno kao da je glasalo 2016. godine u svih pet datoteka, a 10% nema evidenciju glasanja u svih pet datoteka. Jedna datoteka - datoteka 3 - imala je zapise koji su u sukobu s druge četiri datoteke za mnoge paneliste, što ukazuje na to da su možda propustili državne zapisnike birača za mnoge paneliste. Još jedna potencijalna mjera kvalitete podataka u mjerama odaziva je koliko su bliski sami prijavljeni izbor glasova (npr. Trump protiv Clintona) među onim panelistima za koje je označeno da su glasovali podudaraju se sa stvarnim ishodom izbora. Izvješće o predsjedničkom glasovanju panelista za koje je potvrđeno da je glasao barem jedan od dobavljača dosjea vrlo je slično nacionalnom udjelu glasova za svakog kandidata (48% Clinton, 45% Trump među potvrđenim glasačima, u usporedbi sa službenim ishodom od 48% - 46%). Predsjedničko glasanje među ovim potvrđenim glasačima bilo je mnogo bliže ishodu nego glasanje svih glasača koji su se samoprijavili u vijeću (49% Clinton, 43% Trump).
 • Podaci o statusu registracije birača koji se sami prijavljuju posebno su problematični.Mnogi panelisti koji su izrazili sumnju u svoju registraciju u anketi ili koji su rekli da definitivno nisu registrirani, ipak su imali evidenciju o registraciji u barem jednoj datoteci. To može odražavati činjenicu da je registracija birača administrativni status koji je donekle apstraktan, a ne lakše pamtljivo ponašanje poput glasanja.
 • Postojala je relativno tijesna korespondencija između stranačke pripadnosti samih prijavljenih članova i identifikacije stranke koju su predviđali dobavljači spiskova birača.Podaci o biračkim spisima o pripadnosti stranci imaju koristi od činjenice da mnoge države registriraju glasače po strankama, a iako se registracija stranaka birača ne mora uvijek podudarati s njihovom samoidentifikacijom, to je vrlo dobar proxy. Međutim, čak i u državama bez registracije stranaka (otprilike polovica punoljetnih osoba u SAD-u živi u takvim državama), procjene biračkog spisa o pripadnosti strankama bile su prilično točne. U prosjeku za pet datoteka, modelirana stranačka pripadnost u datotekama podudarala se sa samoprijavljenom stranačkom pripadnošću za oko dvije trećine članova panelisti (67%). Općenito, spisi su bolje identificirali demokrate od republikanaca.
 • Modeli odaziva biračkih spiskova dobro su predvidjeli tko će glasati 2016. godine.Analiza u ovom izvješću, zajedno s prethodnom studijom Pew Research Centra, pokazuje da korištenje ovih rezultata za stvaranje vjerojatnog biračkog tijela za opće izbore 2016. poboljšava procjene izbora u odnosu na oslanjanje samo na informacije o kojima su se samo izjavili. Prije općih izbora 2016., svaki je dobavljač pružio mjeru vjerojatnosti odaziva na izborima, a njihova primjena poboljšala je točnost procjene američkog odbora za trendove biračkih preferencija u predsjedničkoj utrci. Procjena je suzila prednost Hillary Clinton sa 7 postotnih bodova među svim registriranim glasačima na raspon od 3 do 5 bodova koristeći modelirane rezultate odaziva. Na kraju je na dan izbora završila s 2 boda prednosti u odnosu na Donalda Trumpa. Povijest prošlih birača ključna je komponenta ovih modela, ali točni algoritmi koje dobavljači koriste nisu javni.
 • Procjena glasačke evidencije o rasi ili etničkoj pripadnosti članova panelističke komisije, kada je pružena, također se prilično dobro podudara s podacima ankete.Datoteke mogu točno kategorizirati 79% panelista (u prosjeku) prema rasi i etničkoj pripadnosti, uključujući prosječno 93% za bijelce koji nisu hispanoamerikanci, 72% za Latinoamerikance i 67% za crnce.
 • Ostali demografski podaci u biračkim spisima - poput podataka o obrazovanju i prihodima - u najboljem su slučaju bili sugestivni i često su u potpunosti nedostajali. Dobavljači su se znatno razlikovali u točnosti nekih od ovih varijabli.Razina obrazovanja nedostajala je ili je bila netočna u prosjeku 48% vremena u svim datotekama. Slično tome, dohodak kućanstva u 63% slučajeva nedostajao je ili je netočan u prosjeku u 63% slučajeva. Općenito, ove demografske varijable jednostavno pružaju većevjerojatnostidentificiranja interesne skupine, a ne bilo kakve pouzdanosti u tome.

Upozorenja o analizi

Budući da se velik dio ovdje predstavljene analize temelji na usporedbi koja koristi podatke američkog Pew Research Center-ovog panela, važno je napomenuti da niti jedno istraživanje, uključujući American Trends Panel, ne predstavlja u potpunosti odraslu populaciju SAD-a, dok podaci na panelu ponderirane su kako bi bile reprezentativne na nacionalnoj razini s obzirom na širok raspon karakteristika (dob, spol, rasa, latinoameričko podrijetlo, obrazovanje, regija prebivališta, gustoća naseljenosti itd.), niti jedno istraživanje nije u svim aspektima točan model populacije. Drugo je upozorenje da će, iako je većina demografskih podataka i pripadnosti stranaka koje pružaju panelisti vjerojatno točni, samoprijave o registraciji birača - ili posebno odazivu birača - možda pogriješiti zbog fenomena poznatog kao pristranost socijalne poželjnosti. Neki pojedinci mogu prijaviti da su registrirani ili su glasali kad nisu. Općenito, demografski i s njima povezani osobni podaci o panelistima koji se prijavljuju samostalno tretirat će se kao istiniti, dok će samoprijava političkog angažmana - ponašanja koja se smatraju društveno poželjnim i često se prekomjerno prijavljuju - morati pažljivo procijeniti u svjetlu informacija u spisima birača.

Povijest biračkih datoteka

Izborna administracija u SAD-u u povijesti je bila vrlo decentralizirana, a države su usvojile niz metoda za upravljanje izbornim postupkom i vođenje evidencije o tome tko ima pravo glasa i tko je glasao. Ova je krpica učinila vrlo teškim, ako ne i nemogućim, prikupiti bilo što nalik na nacionalnu bazu podataka birača. Čak i baze podataka širom države ponegdje nisu bile dostupne.

Relativno nedavna dostupnost komercijalnih datoteka birača rezultat je i tehnološkog napretka i promjena vladine politike koji su rezultat problema na nedavnim izborima u SAD-u. Predsjednički izbori 2000. godine pokrenuli su zabrinutost zbog točnosti, dosljednosti i kvalitete izbornih sustava upravljanja. Nakon toga Kongres je usvojio Zakon o glasovanju u Americi iz 2002. (HAVA) kako bi riješio neka od ovih pitanja. Među mnogim odredbama HAVA-e bilo je i to da je državama naloženo da stvore „jedinstveni, jedinstveni, službeni, centralizirani, interaktivni računalni popis za birače koji se definira, održava i upravlja na državnoj razini, a koji sadrži ime i podatke o registraciji svakog legalno registriranog birač u državi ... '3Te su digitalne baze podataka omogućile partizanskim i komercijalnim organizacijama da prikupljaju i sastavljaju nacionalne spise birača kombinirajući digitalne datoteke iz svake države i okruga Columbia.

U doba kada su se osobni podaci sve više komoditizirali, datoteke su se ponavljale korak dalje. Vrlo opsežne baze podataka gotovo svih odraslih osoba u SAD-u sada vode kreditni zavodi i druga poduzeća. Komercijalni podaci o biračima koji se temelje na registriranim biračima mogu se usporediti s većim bazama podataka svih punoljetnih osoba kako bi se identificirale osobe koje nisu registrirane za glasanje. Evidencija za te pojedince dodaje se u komercijalne datoteke birača i svi se podaci popunjavaju dodatnim političkim i nepolitičkim informacijama.

Proces sastavljanja koji tvrtke koriste za stvaranje nacionalnih biračkih datoteka sada je daleko lakši nego što je bio prije HAVA-e, ali nije bez izazova. Amerikanci ostaju prilično mobilna populacija, što znači da se podaci o kreditnim podacima, potrošačima i biračima moraju neprestano ažurirati. Registrirani birač koji se preseli u drugu državu mora se ponovno registrirati i ne postoji jedinstvena metoda kojom se izborni službenici u svim državama obavještavaju kada se birač preseli. Iako i izborni službenici i dobavljači komercijalnih birača pokušavaju pratiti pojedince kada se kreću koristeći resurse poput Nacionalne baze podataka o promjeni adrese američke poštanske službe, postupak je teško pouzdan. Svaki komercijalni dobavljač koristi različite metode za ažuriranje svojih datoteka i donošenje prosudbi o tome koji je službeni zapis povezan s pojedincem najaktualniji. Ipak, čak i sa svojim manama, komercijalni podaci o biračima predstavljaju značajan napredak u odnosu na ono što je bilo dostupno kampanjama, strankama i istraživačima prije prolaska HAVA-e.

Facebook   twitter