Это правомерный вопрос, поскольку дифтонги в русском языке, наверное, все-таки есть. Просто устоявшееся и упрощенное определение (Дифтонг - сложный гласный звук, состоящий из двух звуков, произносимых в один слог) не проводит разграничения между фонологическими и фонетическими дифтонгами. Сочетания [oj] или [aj] с позиций фонологии не являются дифтонгами Это есть сочетания гласных [o] или [a] и согласного [j]. Между тем в речи согласный [j] часто вокализуется и превращается в неслоговой гласный [i]. Порой бывает довольно сложно определить на слух, как эти сочетания звучат: с [j] или с [i]. Особенно показательными в этом отношении являются односложные слова или слова, где подобные сочетания образуют конечный слог, например "большой". В таких случаях сочетания [oi] и [ai] приобретают все признаки дифтонга. Косвенное подтверждение этому можно наблюдать в русском алфавите. Ведь недаром же буква "Й" называется "и краткая", а не "йот". С другой стороны, [j] достаточно явственно сохраняет признаки шипящего согласного при склонении существительных типа "май" (мая, маю, маем, мае) или в середине многосложного слова перед гласным, например, "майор". Более того, при склонении слов типа "май" элементы сочетаний [oj] или [aj] оказываются в разных слогах, например, "ма-я, ма-ю, ма-ем, ма-е". А это уже противоречит определению дифтонга.
Что касается второй части Вашего вопроса, Вы сами ответили на свой вопрос, обозначив первый элемент сочетаний [je], [jo] и им подобных, согласным [j]. Именно поэтому дифтонгами они не являются.