Ученые разработали детектор школьников в соцсетях

Наиболее употребляемые школьниками слова
Наиболее употребляемые школьниками слова

Группа социологов продемонстрировала возможность автоматически распознавать пол, возраст и ряд психологических характеристик пользователей социальной сети Facebook на основе их статусов. По словам ученых, это позволяет формализовать ряд наблюдений и дает новый инструмент для проведения исследований. Подробности со ссылкой на публикацию исследователей в журнале PLoS One приводит официальный сайт Университета Пенсильвании.

В ходе своей работы сотрудники университета Пенсильвании и Кембриджского университета в Великобритании изучали лексику, используемую в статусах Facebook. Под статусом понимается короткий текст, размещаемый от своего имени в соцсетях. В тексте обычно указывают текущее занятие, настроение или другую информацию.

Социологи собрали данные о 136 тысячах пользователей (все они подписались на участие в научном исследовании), которые в общей сложности обновили свою строку статуса более 13 миллионов раз. Чтобы получить корректную информацию, ученые брали только тех, кто за время эксперимента написал более 1000 слов в строку статуса. В итоге выборка авторов исследования включала 15,4 миллиона статусов с 309 миллионами слов от 74941 человека.

Далее социологи взяли заполненные теми же людьми онлайн-опросники и попытались найти корреляции встречаемости тех или иных слов в статусе с теми или иными характеристиками человека. Математический анализ материала продемонстрировал, что даже сочетания символов, которые были выделены в слова сугубо формально (как произвольная комбинация между двумя пробелами), позволяют узнать, к примеру, пол пользователя. Сочетание знака «меньше» и цифры 3 позволяет уверенно говорить о том, что строка статуса обновлена женщиной, а не мужчиной. В то же время ругательство «fuck» указывает на мужской пол владельца аккаунта.

Исследователи также предложили добровольцам установить онлайн-приложение My Personality с психологическими опросниками, основанными на тесте NEO Personality Inventory Revised (NEO-PI-R). Этот тест выдавал результаты по пяти разным шкалам: экстраверсия, сговорчивость, сознательность, невротизм и открытость; сокращенная версия такого теста уже использовалась в другой посвященной Facebook работе.

Анализ материала тестов показал, что экстраверты чаще используют слова «вечеринка» и «девушки», в то время как интроверты предпочитают компьютеры и интернет, а также аниме — хотя коэффициент корреляции для аниме и интроверсии оказался ниже, чем для интроверсии и смайла «^_^». Кроме того, ученые увидели и характерные для определенного возраста выражения: например, «домашнее задание» и названия предметов выдают школьников, а «дочь» или «муж» характерны для тех, кому больше тридцати лет.

Исследователи полагают, что их работа позволяет отделить стереотипы о той или иной категории пользователей от ее реальных характеристик. Они считают удачным решение не подсчитывать частотность того или иного слова из закрытого списка (скажем, из числа «позитивных эмоций» или из множества «ругательства»), а взять слова и сочетания символов, изначально присутствующие в выборке. Еще одно достоинство подхода — сравнительная быстрота обновления данных.

Появление социальных сетей с миллионами активных пользователей вывело (как утверждается во введении к статье американо-британской группы) социологию на новый уровень. Если ранее опрос хотя бы тысячи человек требовал сложной полевой работы, то онлайн-исследования позволяют оперативно собирать на порядки большие выборки и анализировать их с использованием автоматических методов. Таким образом уже удалось отследить реакцию общества на различные события, проследить за эпидемиями гриппа и найти способ определить характеристики пользователя по «лайкам» (хотя и с большой погрешностью).

Обсудить
Наука и техника
 — 
00:03 Сегодня

Геноцид во благо

Уничтожение всего живого стало возможным на генном уровне
Наука и техника
 — 
00:04 19 февраля 2017
Инквизиторы допрашивают предполагаемых еретиков

Карающая длань

Как мальтийская инквизиция наказывала христиан-вероотступников
Виталий ЧуркинМаэстро дипломатии
Накануне своего дня рождения скончался постпред России при ООН Виталий Чуркин
Оголтелое братство
Кто убил старшего брата северокорейского лидера Ким Чен Ына
Закат Запада
В Мюнхене самые влиятельные политики мира похоронили старый мировой порядок
Завтрак длиной в сто лет
Что ждет Россию и мир в XXII веке
«Он был мертвым при жизни»
Каким знаменитости запомнили Курта Кобейна, которому сегодня исполнилось бы 50
Прощай, реальность
Призеры и итоги Берлинского фестиваля
«Это чертов кошмар»
Как выжить музыкантам-мигрантам при Трампе
Бенисио дель ТороБенефис дель Торо
Самому опасному пуэрториканцу Голливуда исполняется 50 лет
200 сил для Kia Soul
Kia Soul обновился. И теперь у него есть версия GT
«Гелик» G65 против мотоцикла Ural
Путешествие американцев на Mercedes-AMG G65 и «Урале» с коляской
10 самых доходных внедорожников России
Кто больше всех зарабатывает на самых суровых из легковушек
Сколько стоят легенды в США
Действительно ли в Америке все дешево
Дворянское гнездо
Один из самых шикарных в мире домов нашли в диком лесу
Поставили баком
Англичане сделали идеальный дом из резервуара для воды
Под гербом золотым
Экскурсия по самому дорогому съемному коттеджу России
Купить по-русски
На приобретение загородных домов и участков остался месяц