• Основен
  • Новини
  • Експериментът на Facebook предизвиква много суматоха за малък резултат

Експериментът на Facebook предизвиква много суматоха за малък резултат

Проучване, в което Facebook манипулира новинарските емисии за над 600 000 потребители, изпрати потребителите на социалните медии в кибернеуведомство тази седмица и се разпространи в масовите медии: „Facebook Tinkers With Users 'Emotions“, започна заглавието в New York Times уебсайт.


Но противоречието относно това, което са направили тези изследователи, може да засенчи други важни дискусии, по-специално разговори за това, което наистина са открили - не много, всъщност - и правилния и грешен начин за мислене и докладване на констатации въз основа на статистически анализи на големи данни. (Ще стигнем до етиката на техния експеримент след малко.)

Тъй като те са толкова големи, проучванията, базирани на свръхразмерни проби, могат да дадат резултати, които са статистически значими, но в същото време са по същество тривиални. Това е проста математика: Колкото по-голям е размерът на извадката, толкова по-малки трябва да са разликите, за да бъдат статистически значими - тоест много вероятно да бъдат наистина различни помежду си. (В това проучване изследваните разлики са между тези, които виждат повече и тези, които виждат по-малко натоварени с емоции публикации в сравнение с контролна група, чиито новинарски емисии не са манипулирани.)

И когато имате огромна случайна извадка от 689 003, както направиха тези изследователи, дори малки разлики преминават стандартни тестове за значимост. (За перспектива типичният размер на извадката в национално представително проучване на общественото мнение е 1000.)

Ето защо поколения учители по статистика предупреждават своите ученици, че „статистически значимо“ не означава непременно „наистина,наистина ливажно '.


Експеримент във Facebook за манипулиране на емисия новиниПомислете за констатациите от проучването във Facebook, в което те варират колко положителни и отрицателни публикации от приятели на тестови субекти са били разрешени да видят. Постовете бяха определени като положителни или отрицателни, ако съдържаха една положителна или отрицателна дума. След това собственото използване на положителни и отрицателни думи на тествания в актуализациите на състоянието му беше наблюдавано в продължение на една седмица. Общо тестваните са публикували общо 122 милиона думи, четири милиона от които са положителни и 1,8 милиона отрицателни.Както съобщават авторите, броят на отрицателните думи, използвани при актуализации на състоянието, се е увеличил средно с 0,04%, когато положителните публикации на техните приятели в новинарските емисии са намалени. Това означава само още около четири отрицателни думи на всеки 10 000, написани от тези участници в изследването. В същото време броят на положителните думи е намалял само с 0,1% или с около една дума по-малко на всеки 1000 написани думи. (Като отправна точка тази публикация е с малко повече от 1000 думи.)


И обратно, когато отрицателните публикации бяха намалени, се използваха седем по-малко отрицателни думи на 10 000, а броят на положителните думи нарасна с около шест на 10 000.

Въз основа на тези резултати авторите заключават в публикуваното си проучване, че „резултатите показват, че емоциите, изразени от други във Facebook, влияят на нашите собствени емоции, представлявайки експериментални доказателства за масово заразяване чрез социални мрежи“.


Но представляват ли тези малки промени, дори и да са реални, доказателство за тревожна „мащабна зараза“? Разбира се, значението е в очите на наблюдателя. За някои тези малки промени могат да бъдат причина за аларма. Но за други те вероятно са простомех.

Изглежда, че един от авторите се е замислил за езика, с който е описвал работата си. В публикация във Facebook, написана в отговор на противоречието, Адам Д. И. Крамер призна, че „Моите съавтори и аз много съжаляваме за начина, по който вестникът описва изследването“.

Той също така предположи, че дори и с огромната им извадка, те не са намерили особено голям ефект. Резултатите, пише той, се основават на „минималното количество за статистическото му откриване - резултатът е, че хората произвеждат средно една по-малко емоционална дума на хиляда думи през следващата седмица“.

Критиците повдигнаха и други въпроси, по-специално списанието The Atlantic и Wired, което постави под въпрос дали четенето на положителни публикации директно е накарало потребителя на Facebook да използва повече положителни думи в следващите си актуализации.


Но етично ли е това, което направи Facebook? Има доста дискусии относно това дали Facebook е бил достатъчно прозрачен с потребителите си за този вид експерименти. Те не информираха директно участниците в проучването, че ще бъдат използвани като човешки лабораторни плъхове. В академичните изследвания това се нарича неполучаване на „информирано съгласие“ и почти винаги е огромно не-не. (Facebook твърди, че всеки, който се присъедини към Facebook, се съгласява като част от потребителското си споразумение да бъде включен в такива проучвания.)

Въпросът сега е за това как, като седим върху нови социални медии и други цифрови данни, които да добивам за същия вид поведенчески анализ, новите правила ще трябва да бъдат написани.

Експерименталните изследвания изобилстват от примери за това как участниците в изследването са били манипулирани, подвеждани или направо лъжени в името на социалната наука. И докато много от тези практики са ограничени или забранени в академичните среди, те продължават да се използват в търговски и други видове изследвания.

Да разгледаме случая с „Verifacitor“, най-новият и най-добрият детектор на лъжа в света - или поне така казаха някои участници в това проучване, проведено от изследователи от Националния център за изследване на общественото мнение в Университета в Чикаго в средата на 90-те години.

Тестовите субекти бяха разделени на две групи. Членовете на контролната група бяха помолени да седнат на бюро, където интервюиращият задаваше въпроси относно навиците на упражнения, тютюнопушенето, употребата на наркотици, сексуалните практики и прекомерното пиене.

Другите тествани субекти отговаряха на същите въпроси, докато бяха свързани с електроди към Verifacitor, описан от оператора като нов тип детектор на лъжата. (Всъщност това беше просто колекция от стари компютърни компоненти, които изследователите бяха излежавали.)

За по-нататъшно подобряване на казването на истината, на всеки участник преди официалното интервю беше казано, че операторът трябва да калибрира машината. Така че на участника беше казано да лъже произволно в отговор на демографски въпроси за себе си, които бяха зададени по-рано в скрининг въпросник. (Въпроси като: Женен ли си? Завършил ли си гимназия? И т.н.).

Разбира се, на интервюиращия са изплъзнали верните отговори, така че тя веднага идентифицира фалшив отговор, за голямо учудване на тествания.

Е, можете да познаете какво се е случило. Напълно 44% от тези в групата Verifacitor признават, че някога са употребявали кокаин в сравнение с 26% в контролната група. Напълно два пъти съотношението, отчетено при използване на амфетамини (39% срещу 19%), използване на други лекарства (39% срещу 19%) и пиене на повече алкохол, отколкото би трябвало (34% срещу 16%).

С други думи, социалните изследвания имат дълга история на манипулация. Ще се поучи ли от миналото си?