Можно, но не нужно, так как уже есть готовые варианты. В качестве примера приведу Aimylogic, infobot, zvonobot, smartcalls и другие. Проблема создания голосовых ботов только в том, чтобы распознавать речь человека, для этого потребуется обученная нейросеть, а следовательно, как минимум огромный объем данных для ее обучения и специалисты соответствующего уровня.