При вопиющих ошибках разметки и сложной структуре макета страницы проще бывает удалить сразу все блоки клавиатурной комбинацией СМ-ОеІ или командой Удалить блоки и текст в контекстном меню и разметить вручную всю страницу. Тем более что трудностей тут, ну, ровным счетом никаких.
В нашем распоряжении будут следующие инструменты: для выделения текстовых блоков, и для выделения картинок. Просто щелкаете по одной из этих кнопок и растягиваете рамочки нужной формы и в нужных местах. Если в тексте встречаются фрагменты негативного текста (выворотка), лучше выделять их в отдельные блоки. Так же стоит поступать и с формулами или текстом, набранным моноширинным шрифтом. Впрочем, посмотрите сами по ситуации. Хотите навести порядок? Закажите профессиональный клининг.
На самом деле в нашем распоряжении есть еще один тип рамки - серая, она определяет зону распознавания. Если мы удалим все блоки, растянем такую рамку и запустим распознавание или попросим программу расставить блоки, то она будет искать эти блоки только внутри серой зоны. Этим инструментом можно пользоваться, например, когда у вас отсканирована книжная страница, но на изображение попала и часть противоположной страницы, а заодно и корешок, который получился в виде неясных серых полос и пятен. Или когда вам не нужна вся журнальная страница, а только одна статья с фотографиями. Просто удалите все блоки (ОтЮеІ), выделите нужную зону распознавания, а потом нажмете самую верхнюю кнопку, которая называется Анализ макета страницы. Программа заново разметит страницу блоками, но уже только внутри зоны.