Год назад, когда все праздновали 210-й день рождения Александра Сергеевича, мы запустили «Стихолюб» — для тех, кто интересуется поэзией.
Немного технических подробностей: мы создали базу стихотворений, опубликованных в известных литературных источниках интернета, и написали программу, которая индексирует эти стихи и ищет цитаты не только по точному совпадению, но и с возможными искажениями и опечатками, с учетом имени автора и названия произведения. Для этого применялся поиск неточных совпадений в суффиксном массиве, алгоритм Ахо-Корасик и другие идеи.
За год наша поэтическая база выросла почти вдвое. Сейчас «Стихолюб» знает почти 30000 стихотворений на четырех языках (русском, украинском, белорусском, казахском), около 350 авторов и больше 50 литературных источников.
В процессе работы над ним мы постоянно обнаруживаем интересные факты. Например, знаете ли вы, кто впервые написал строку «И дым отечества нам сладок и приятен»? Думаете, Грибоедов? Вовсе нет, ее авторство принадлежит Державину, и она оказалась настолько удачной, что другие поэты ссылались на нее по крайней мере пять раз.
Самым цитируемым поэтом в этом смысле оказался Пушкин, а самыми цитирующими мастерами аллюзий – Михаил Щербаков, Тимур Кибиров и Александр Башлачев.
Судя по поисковым запросам, Пушкин был и остается любимым автором наших читателей. Также наших посетителей очень интересует творчество Грибоедова, Некрасова, Блока и Есенина. Наибольшей популярностью пользуются роман в стихах Пушкина «Евгений Онегин» и сказка Леонида Филатова «Про Федота-стрельца». Может, вы тоже захотите их перечитать?