Индексирование офисных документов и Flash

Яндекс индексирует не только HTML-документы. Кроме них индексируются документы следующих типов: PDF, Flash (Adobe Systems); DOC/DOCX, XLS/XLSX, PPT/PPTX (MS Office); ODS, ODP, ODT, ODG (Open Office); RTF, TXT.

Существуют некоторые ограничения на типы индексируемых данных:

  • В документах PDF индексируется только текстовое содержимое. Текст, представленный в виде картинок, не индексируется.

  • Во Flash-документе индексируется текст, который размещен в блоках:

    • DefineText;

    • DefineText2;

    • DefineEditText;

    • Metadata.

    Ссылки индексируются, если они размещены в блоках:

    • DoAction;

    • DefineButton;

    • DefineButton2.

  • Документы больше 10 МБ не индексируются.
  • После выхода новых версий программ реализация поддержки новых форматов может занять некоторое время.