Люди чаще ругаются в соцсетях с знакомыми, чем с друзьями — анализ может помочь выявить фейковые профили

Американцы используют мат в социальных сетях чаще, чем австралийцы или британцы, но австралийцы более изобретательны в его использовании. Согласно недавнему исследованию Университета Восточной Финляндии, люди склонны больше ругаться со знакомыми, чем с друзьями. Мат редко используется в социальных сетях, где меньше 15 человек.

Исследование, опубликованное в журнале Lingua, основано на данных сотен тысяч пользователей социальных сетей. Оно изучало использование мата в соцсетях и выясняло, ругаются ли люди больше при общении с близкими друзьями или со знакомыми.

По словам ведущего автора, профессора Микко Лайтинена из Университета Восточной Финляндии, ругательства — естественная часть человеческого языка, что делает их изучение фундаментальным лингвистическим исследованием.

Предыдущие исследования предполагали, что ругательства чаще всего встречаются при общении с близкими друзьями, но эти исследования основывались на небольших наборах данных и опросах. Опросы, в частности, могут не отражать явление, которое социально стигматизировано.

Профессор Лайтинен и его исследовательская группа проанализировали обновления в социальных сетях и сети Twitter с 2006 по 2023 год, охватив почти полмиллиона человек в тысячах социальных сетей. Анализ также включал метаданные, такие как местоположение и другую контекстную информацию.

Используя вычислительные методы, исследователи оценили, насколько тесно связаны люди в этих социальных сетях. Данные были сужены до трёх англоязычных стран: Австралии, Великобритании и США.

Для учёта неоднородности коммуникации в социальных сетях исследование сначала выявило более 2300 вариантов написания слова-паразита в наборе данных. Затем эти варианты были найдены в массиве данных.

Три интересных закономерности:

1. Тенденция использовать слово-паразит явно возрастает при общении со знакомыми по сравнению с близкими друзьями.
2. Ругательства редко встречались в очень маленьких социальных сетях, независимо от того, насколько они были сплочёнными, что говорит о том, что размер сети является ключевым фактором, определяющим использование мата.
3. То же самое верно и в отношении очень больших социальных сетей, где важность плотности социальных сетей ослабевала. Другими словами, различие между друзьями и знакомыми становилось несущественным, когда размер сети достигал примерно 100–120 человек.

Это открытие перекликается с более ранними исследованиями, которые показывают, например, что доверие сильнее в небольших сетях, чем в более крупных, причём различие между ними стирается примерно у ста членов.

Хотя ругательства могут показаться лёгкой темой для академических исследований, анализ ненормативной лексики может помочь выявить фейковые профили и тех, кто намеренно распространяет дезинформацию в социальных сетях. По словам профессора Лайтинена, результаты и методы имеют более широкое применение.

«Чем больше мы знаем об использовании языка в социальных сетях, тем больше мы можем узнать о поведении настоящих пользователей языка».

Профессор Лайтинен отмечает, что анализа языка недостаточно, поскольку генеративный искусственный интеллект может легко создавать текст. Вместо этого исследователи должны также изучать сети, в которых используется язык.

«Эти сети чрезвычайно трудно подделать, потому что они создают цифровой отпечаток для каждого пользователя. Они отражают предыдущее поведение пользователя в социальных сетях, делая профили идентифицируемыми».

Сочетание всех этих данных с информацией об использовании языка, например, о частоте использования ругательств в определённой сети, может помочь определить, является ли аккаунт реальным или источником дезинформации, профиль которого не соответствует профилю реального пользователя языка.

Такие исследования требуют как технических знаний, так и глубокого понимания использования языка в социальных сетях. Поэтому в команду профессора Лайтинена входят не только лингвисты, но и учёные-компьютерщики.

Профессор Лайтинен считает, что сочетание опыта в гуманитарных науках и лингвистических исследований с вычислительными возможностями для выявления соответствующих закономерностей в огромных массивах данных может стать основой для многочисленных будущих приложений.

Предоставлено Университетом Восточной Финляндии.

Источник