В наших проектах мы пользуемся самописной системой аналитики данных, алгоритм которой выделяет из входящего потока нужные данные для оценки эффективности того или иного показателя.
Если вопрос по отработке предположений и теории вероятности, то мне нравится пользоваться алгоритмом random forest. Про него узнал несколько лет назад из кейса одного крупного агрегатора купонов, которые смогли поднять свою выручку втрое благодаря его применению.