На что влияет параметр "output_dim" для слоя tf.keras.layers.Embedding()?

Построил (в TensorFlow), обучил и проверяю, как NLP-модель предсказывает/распознает эмоциональную окраску предложения (негативный/позитивный отзыв).

Осталось непонятным - как/на что влияет параметр "output_dim" для слоя tf.keras.layers.Embedding()?

В документации - https://www.tensorflow.org/api_docs/python/tf/keras/layers/Embedding - вообще об этом ничего не вижу.

Tensorflow

Виктор ГусевМашинное обучение и Нейронные сети

16 марта 2022 · 1,8 K

Борис Державец

Openstack DevOps and IBM/Informix Certified DBA . Phd in Math (Duality of spaces of... · 18 мар 2022

Ниже идет перевод из нескольких источников и не более того.

======================

Слой внедрения Keras

======================

Keras предлагает слой Embedding, который можно использовать для нейронных сетей с текстовыми данными.

Требуется, чтобы входные данные были закодированы целым числом, чтобы каждое слово было представлено уникальным целым числом. Этот этап подготовки данных можно выполнить с помощью API Tokenizer, который также предоставляется вместе с Keras.

Слой Embedding инициализируется со случайными весами и изучает встраивание для всех слов в наборе обучающих данных. Это гибкий слой, который можно использовать различными способами, например:

Его можно использовать отдельно для изучения встраивания слов, которое можно сохранить и использовать в другой модели позже.

Его можно использовать как часть модели глубокого обучения, где встраивание изучается вместе с самой моделью.

Его можно использовать для загрузки предварительно обученной модели встраивания слов, типа трансферного обучения.

Слой внедрения определяется как первый скрытый слой сети. Он должен указать 3 аргумента:

================================

Он должен указать 3 аргумента:

================================

input_dim: это размер словаря в текстовых данных. Например, если ваши данные представляют собой целочисленные значения в диапазоне от 0 до 10, то размер словаря будет составлять 11 слов.

output_dim: это размер векторного пространства, в которое будут встроены слова. Он определяет размер выходных векторов из этого слоя для каждого слова. Например, это может быть 32 или 100 или даже больше. Проверьте различные значения для вашей проблемы.

input_length: это длина входных последовательностей, которую вы бы определили для любого входного слоя модели Keras. Например, если все ваши входные документы состоят из 1000 слов, это будет 1000.

Например, ниже мы определяем слой внедрения со словарем 200 (например, слова в целочисленной кодировке от 0 до 199 включительно), векторным пространством 32 измерений, в которое будут встраиваться слова, и входными документами, каждый из которых содержит 50 слов.

================================

Мы можем создать простую модель Keras,

просто добавив встраивающий слой.

=================================

Смотри

https://medium.com/analytics-vidhya/understanding-embedding-layer-in-keras-bbe3ff1327ce

Слой внедрения имеет три параметра

input_dim : Размер словаря

output_dim : Длина вектора для каждого слова

input_length : максимальная длина последовательности

Тест кода из источника выше

https://informatics-ege.blogspot.com/2022/03/understanding-embedding-layer-in-keras.html

==============================

Согласно https://machinelearningmastery.com/use-word-embedding-layers-deep-learning-keras/

==============================

Слой внедрения определяется как первый скрытый слой сети. Он должен указать 3 аргумента:

Он должен указать 3 аргумента:

input_dim: это размер словаря в текстовых данных. Например, если ваши данные представляют собой целочисленные значения в диапазоне от 0 до 10, то размер словаря будет составлять 11 слов.

output_dim: это размер векторного пространства, в которое будут встроены слова. Он определяет размер выходных векторов из этого слоя для каждого слова. Например, это может быть 32 или 100 или даже больше. Проверьте различные значения для вашей проблемы.

input_length: это длина входных последовательностей, которую вы бы определили для любого входного слоя модели Keras. Например, если все ваши входные документы состоят из 1000 слов, это будет 1000.

Все три источника говорят одно и тоже.

Виктор Гусев

18 марта 2022

Спасибо, Борис, что нашли время ответить на мой вопрос. Вот, нашел предельно понятное объяснение работы Keras... Читать дальше