В команде два основных направления.
Количество веб-страниц в открытой (доступной для индексации) поверхности интернета растет экспоненциально. И поисковая база тоже должна постоянно расти. Наша задача — оптимизировать поисковый алгоритм таким образом, чтобы рост базы можно было обеспечить без дополнительных затрат по CPU.
Формула релевантности постоянно усложняется и использует все более тяжелые фичи (например, нейросети-трансформеры на GPU). Наша задача — перебалансировать ресурсы в поисковом стеке, позволяя утяжелить и улучшить одни стадии поиска за счет облегчения и ускорения других.
Обе этих задачи нельзя решить, посмотрев на флеймграф и заменив одну хеш-таблицу другой (там найдется, допустим, 2% перформанса). Наша команда за четыре года дважды радикально перестраивала поисковый алгоритм, каждый достигая двукратного роста эффективности. У нас есть свежие идеи, как сделать еще лучше, и вы сможете поучаствовать в их реализации.
Мы свяжемся с вами в течение недели.