Пользователи Яндекса: интересы и поисковое поведение | |
---|---|
Апрель 2013 Каждый день люди спрашивают Яндекс про самые разные вещи — от финансов до эзотерики, от футбола до программирования. Некоторые пользователи регулярно задают запросы на одни и те же темы — в таком случае можно говорить о наличии у них постоянных поисковых интересов. Это исследование посвящено людям с разными постоянными поисковыми интересами и тому, чем они отличаются друг от друга. Все данные получены от поиска Яндекса и охватывают один летний месяц 2012 года. Содержание | |
Группы пользователей по интересамВ исследовании рассматривались только активные пользователи — те, кто за изученный месяц не менее трёх раз воспользовались поиском Яндекса1. Их интересы определены по переходам со страницы результатов поиска на сайты из Яндекс.Каталога2. В зависимости от тематики этих сайтов пользователи были разделены на группы по интересам. Например, если за месяц пользователь в разные дни не меньше трёх раз искал рецепты и переходил на кулинарные сайты из Яндекс.Каталога, то он включался в группу «Кулинария». Всего таким образом было выделено около сорока групп, причём один пользователь мог попасть сразу в несколько из них. За месяц хотя бы в одну группу вошли около 8 млн пользователей. Поисковые интересы представителей разных групп проще всего проиллюстрировать характерными для них поисковыми запросами. Ниже приведены примеры популярных характерных запросов для всех групп, которые упоминаются в исследовании. | 1 Рассматривались все пользователи поиска Яндекса, вне зависимости от языка или местонахождения. 2 В Яндекс.Каталоге собраны наиболее популярные и качественные сайты рунета (на конец марта 2013 года их было более 120 тыс.). Каждому сайту в Каталоге присвоена тематическая категория. |
Характерные запросы представителей разных групп | |
Около 40% пользователей попали сразу в несколько групп. Из них примерно две трети вошли в две, ещё четверть — в три группы. Максимальное число групп, в которые вошёл один пользователь,— 12. | |
Пол и возраст пользователей3Из всех выделенных групп только «Фото» и «Знакомства» имеют примерно такое же половозрастное распределение пользователей, как вся аудитория Яндекса в целом. Видимо, увлечение фотографией и желание завести новые отношения свойственны людям независимо от их пола и возраста. Среди остальных групп самыми женскими (в которых доля женщин заметно выше, чем среди всех пользователей поиска) оказались «Свадьба» и «Родители», а самыми мужскими — «ИТ» и «Болельщики». Самыми молодыми — «Игры» и «Школа», а самыми пожилыми — «Дача», «Дом» и «Здоровье». | 3 Данные про пол и возраст пользователей получены с помощью технологии Крипта. |
Половозрастная структура всей аудитории Яндекса и четырех наиболее выраженных групп пользователей | |
Различия в интересах пользователей разного пола и возраста можно продемонстрировать с помощью индекса интереса. Он показывает, на сколько процентов в какой-либо группе больше или меньше пользователей данной половозрастной категории, чем в аудитории поиска в целом. Например, доля мужчин в возрасте от 25 до 34 лет в поиске Яндекса составляет примерно 17%. А среди пользователей, интересовавшихся электроникой,— 35%, примерно вдвое больше. Индекс интереса в таком случае будет около 100% — то есть мужчины этого возраста интересуются электроникой в два раза больше, чем средний пользователь Яндекса. | |
Индекс интереса к разным темам у пользователей разного пола и возраста4 | 4 Показаны группы, в которых хотя бы у одной из половозрастных категорий индекс интереса превысил 100%. |
Поисковое поведениеОтличия в поисковом поведении пользователей с разными интересами показаны на примере пятнадцати групп с предположительно самыми яркими отличиями: «Болельщики», «Дача», «ИТ», «Кулинария», «Культура», «Литература», «Наука», «Одежда», «Промышленность», «Развлечения», «Родители», «Спортсмены», «Финансы», «Эзотерика» и «Электроника». | |
Общая характеристика поисковой активностиПоисковые интересы определены только для активных пользователей Яндекса, так что некоторые показатели их поисковой активности изначально отличаются от среднего уровня: например, такие пользователи задают больше запросов и совершают более длинные поисковые сессии. Самыми активными в поиске Яндекса оказались представители группы «Наука»: они чаще других пользуются поиском, дольше ищут и реже ограничиваются одним запросом за сессию. Наименьшую активность проявляют пользователи из группы «Дача»: они реже всего обращаются к поиску и задают меньше всего запросов. При этом длина сессий у «дачников» самая большая — то есть пользователи из этой группы просматривают результаты поиска медленнее всех. Возможно, так проявляется специфика дачного интернета. | |
Общая поисковая активность всей аудитории Яндекса и наиболее выраженных групп пользователей5 5 Количество запросов на пользователя в неделю нельзя сопоставлять со следующими двумя показателями (количество сессий на пользователя в сутки и количество запросов в сессию). В первом случае речь идёт о недельной аудитории поиска, во втором — о суточной, а суточная аудитория заведомо более активна, чем недельная. | |
География6Выделенные группы различаются и по географической принадлежности пользователей. Самые столичные группы, больше чем на половину состоящие из москвичей и петербуржцев, — это «Развлечения» и «Одежда». Меньше всего жителей столиц в группах «ИТ», «Эзотерика» и «Кулинария»: 70% их представителей живут за пределами Москвы и Санкт-Петербурга. Яндекс изучил постоянные интересы пользователей из разных городов и выяснил, где каждая из пятнадцати групп наиболее популярна, т.е. где доля её представителей среди всех местных пользователей выше, чем в остальной России. | 6 В данном разделе рассматривались только российские пользователи Яндекса. |
Города, в которых популярность одной из групп выше, чем в остальной России7 7 Города-столицы субъектов РФ, где хотя бы в одну из пятнадцати групп вошло не менее тысячи активных пользователей. | |
Формулировки запросовБольше половины поисковых запросов, которые пользователи задают Яндексу в течение месяца, уникальны. Формулировки остальных запросов повторяются. Количество таких запросов у разных групп напрямую зависит от их размера: чем больше пользователей в группе, тем выше вероятность того, что кто-то повторит ранее использованную формулировку. Меньше всего (44%) уникальных запросов у пользователей из крупнейшей среди выделенных группы «Болельщики», а наиболее разнообразные формулировки — у представителей самых маленьких групп «Дача», «Спортсмены» и «Развлечения» — 63%, 62% и 60% уникальных запросов соответственно. Самые часто задаваемые запросы (такие как [одноклассники] или [в контакте]) у пользователей из большинства групп совпадают, различается только их порядок в рейтинге. Но иногда встречаются и специфичные популярные запросы. | |
Топ-10 популярных запросов у разных групп пользователей8 8 Показаны группы, у которых среди топ-10 популярных запросов есть хотя бы один специфичный (не попавший в топ-10 других групп) — такие запросы выделены полужирным шрифтом. | |
Средняя длина поискового запроса к Яндексу составляет 3,4 слова. К относительно коротким формулировкам склонны представители групп «Болельщики», «Развлечения» и «Спортсмены». Это можно объяснить тем, что они задают много коротких навигационных запросов, связанных с поиском конкретных организаций или сайтов, например, [анжи], [гисметео], [адидас]. Самые длинные формулировки — у представителей групп «Родители», «Наука» и «ИТ». Среди их запросов чаще встречаются многословные описания нужного предмета и вопросы ([одежда для новорожденных интернет магазин], [как повысить свой интеллект]), а также цитаты ([кроме любви твоей, мне нету солнца, а я и не знаю, где ты и с кем]). Примерно в каждом десятом поисковом запросе пользователи допускают ошибки или опечатки9. Больше всего ошибок делают представители «Промышленности» и «Электроники». Возможно, это связано с тем, что они чаще других используют редкие или сложные слова и названия, неизвестные Яндексу. Самыми же грамотными оказались «болельщики» — они часто задают короткие запросы, в которых сложно ошибиться, и точно знают, как пишется название любимой команды. Чуть менее 4% поисковых запросов к Яндексу сформулированы в виде вопросов, то есть с использованием вопросительных слов «что», «как», «сколько» и других. Представители изученных групп задают в среднем больше таких запросов, чем другие пользователи поиска. Чаще всего вопросы встречаются у «родителей» и «дачников» — более, чем в 6% случаев, а реже всего — в 4% случаев — у представителей «Промышленности», «Болельщиков» и «Развлечений». | 9 См. исследование Яндекса «Самые частые орфографические ошибки в поисковых запросах» |
Цифры и латиница Из всех характеристик поисковых запросов лучше всего интересы пользователей отражает то, как они используют цифры и латиницу. Цифры чаще всего встречаются в запросах представителей группы «Электроника» (26% всех запросов), а реже всего — групп «Развлечения», «Дача» и «Эзотерика» (по 12%). В большинстве случаев цифры нужны для записи артикулов и моделей различных товаров ([запчасти турбины К300-240]). Но есть и исключения: у пользователей из групп «Культура» и «ИТ» цифры прежде всего обозначают сиквелы, то есть продолжения фильмов или компьютерных игр ([доктор хаус 3 сезон смотреть онлайн], [the elder scrolls 4 oblivion прохождение]), причём у представителей «Культуры» большая часть сиквелов — это фильмы (80%), а у «ИТ» — игры (70%). Среди выделенных групп доля артикулов и моделей выше всего у представителей «Электроники» ([iphone 4s купить]), дат — у «болельщиков» ([трансферы футбола 2011]), сиквелов — у «айтишников» ([gta 5]). Названия чаще других групп ищут представители «Развлечений» ([какая музыка в четверг в опять 25 ресторан]), номера — пользователи из «Науки» и «Финансов» ([гост 30491-97], [п.4 ст. 226 нк рф]), форматы файлов, версии программ, коды ошибок и т.п. — «айтишники» ([microsoft visual c++ 2005 для win7]), а возраст — «родители» ([подарок сыну на 14 лет]). | |
Цифры в поисковых запросах некоторых групп пользователей10 10 «Другое» — это сайты, адреса, телефоны, а также просто числа, например, [200 лучших рок альбомов], [как похудеть на 5 кг]. | |
Латиницу в поиске Яндекса чаще всего используют представители групп «ИТ» и «Электроника» (37%), а реже всего — «Дачи» и «Эзотерики» (13%). Запросы на иностранных языках среди запросов с латиницей встречаются довольно редко — только в 6% случаев. Большая часть запросов на латинице — это бренды и модели различных товаров, а также имена и названия фильмов, игр, книг, программ и проч. Представители разных групп используют латиницу для разных названий: у пользователей из группы «ИТ» это главным образом программное обеспечение, из «Культуры» — всё, что связано с музыкой, из «Эзотерики» — имена знаменитостей, у «болельщиков» и «родителей» — игры, а у представителей «Дачи» — растения. Имена и названия чаще пользователей из других групп ищут «айтишники», например: [mysql примеры], [коды на skyrim], а бренды и модели — представители «Электроники» и «Промышленности»: [nokia 5130] и [texaco масло]. Адреса сайтов в поисковую строку чаще всего вводят «болельщики»: [championat.com], [youtube], а запросы в неправильной раскладке клавиатуры — пользователи, интересующиеся эзотерикой: [cjyybr], [ujhjcrjg hfv, kth]. Иностранные слова и термины чаще других используют представители групп «Наука» — [внутриклеточное icsi], «ИТ» — [seo тексты], «Литература» — [keep calm and carry on]. | |
Латиница в поисковых запросах некоторых групп пользователей | |
Сходства и различия в поисковом поведенииСходства и различия между группами можно оценивать не только по отдельным показателям, но и по поисковому поведению в целом. Яндекс составил условные карты близости групп по двум основным наборам характеристик поискового поведения — поисковой активности и формулировок запросов. Расстояние между группами соответствует степени их близости: чем больше расстояние, тем меньше группы похожи друг на друга. Наибольшее сходство по обоим наборам характеристик обнаружилось у групп «Родители» и «Финансы», а также у «Эзотерики» и «Кулинарии». | |
Сходства и различия между группами по основным характеристикам поисковой активности | |
Сходства и различия между группами по характеристикам формулировок запросов | |
Основные цифры и факты
|