РАЗРАБОТКА ПРОГРАММНОГО ФИЛЬТРА ДЛЯ ОПРЕДЛЕЛЕНИЯ ТЕКСТОВЫХ ОБЛАСТЕЙ НА ИЗОБРАЖЕНИЯХ

ОБРАЗЕЦ

Долженкова М.Л., к.т.н., доцент ВятГУ, г. Киров;

Воронин И.В., студент ВятГУ, г. Киров

С каждым днем возрастает объем воспринимаемой и анализируемой человеком текстовой информации. Объявления, вывески, надписи, визитные карточки, номерные знаки транспортных средств - лишь краткий перечень форм представления подобной информации [1]. В этих условиях весьма актуальной является разработка систем автоматического распознавания текста, выполняющих обработку визуальной информации с последующим использованием ее в информационных системах различного назначения.

Базовой процедурой, применяемой на первоначальном этапе обработки в таких системах, является обнаружение текстовых областей на изображении. Возникающие при этом проблемы связаны с наличием помех, размером изображений, форматом надписей и углом обзора.

Кроме того, производительность систем распознавания текстов значительно снижается из-за непредсказуемости входного потока данных и необходимости обработки изображений, не содержащих текст.

Анализ предметной области показал, что существующие в настоящее время системы для определения текстовых областей требуют настройки на распознавание изображений определенного качества, не способны анализировать фотографическое изображение без точного указания текстовой области и отсеивать изображения, не содержащие текст. Кроме того, для анализа изображения большого разрешения затрачивается значительное время.

Таким образом, задача создания фильтра для выделения текстовых областей и отсеивания изображений не содержащих текст является актуальной.

Структура программного фильтра представлена на рис. 1.

Фильтр состоит из двух основных частей: подсистемы, выполняющей поиск текстовой области на изображении и подсистемы сервиса, выбирающей файлы из входного потока и формирующей экспертную оценку количества текста на изображении.

Подсистема поиска включает модуль предварительной обработки данных и модуль кластеризации.

Модуль предварительной обработки выполняет удаление «лишней» информации с изображения и преобразование данных в формат, пригодный для дальнейшей работы фильтра. Основными методы предварительной обработки изображения являются бинаризация и конвертирование изображения в оттенки серого (grayscale). Цель предварительной обработки - радикальное уменьшение количества информации, содержащейся на изображении. При этом исходное изображение, включающее несколько уровней яркости, преобразуется в черно-белое изображение.

Рис.1. Структурная схема программного фильтра

Модуль кластеризации предназначен для непосредственного определения текстовой области на изображении и реализует ряд методов.

Метод гистограмм позволяет разбить изображение на сегменты, определить интенсивности в каждом сегменте и построить гистограммы для оценки принадлежности области изображения тексту.

Метод SWT (Stroke Width Transform - преобразование по толщине штриха) основан на построении векторов от центра предполагаемой области текста к ее контуру. В итоге получается закрашенная область с очень четко выделенными буквами в двух вариантах: черные буквы на белом фоне и белые буквы на черном фоне. Далее изображения объединяются и проверяются на наличие общих точек. Таким образом, будет обнаружена область, на которой однозначно определены текстовые символы [2].

Метод Fuzzy image processing позволяет разбить изображение на подизображения для всех оттенков серого. На полученных изображениях с помощью четырех- и восьмипиксельной области связности подсчитывается количество разрывов. Далее по размерам найденных объектов определяется принадлежность области к тексту.

Метод особо контрастных пикселей выполняет обработку путем многократного обхода всего изображения и с каждым проходом отделяются самые яркие пиксели (текст) от фона.

Все реализованные в модуле методы построены на комбинированных алгоритмах. Они обеспечивают выделение основных характеристик текста, сегментацию и выявление истинных текстовых блоков и удаление ложных.

Подсистема сервиса состоит из модулей формирования входного потока, формирования экспертных данных, управления, отображения и статистики.

Модуль формирования входного потокаотвечает за определение форматов файлов входного потока.

Модуль формирования экспертных данных по кластеризованным данным формирует экспертную оценку наличия текста в файле.

Модуль управления используется для общей настройки модулей фильтра.

Модуль отображения необходим для представления в графическом виде результатов работы после каждого этапа обработки.

Модуль статистики обеспечивает накопление и хранения результатов обработки.

Модули предварительной обработки данных, кластеризации и формирования экспертных данных могут работать параллельно и обмениваться информацией с модулем базы данных, модулем управления, модулем статистики и модулем формирования входного потока.

Разработанный программный фильтр является универсальным, независящим от особенностей серверного приложения и может использоваться на входе систем, основной целью которых является распознавание текста, находящегося на изображении (фото), с дальнейшей обработкой его интеллектуальными поисковыми системами.

Список использованных источников

1. Николенко А.А., Тьен Т.К. Обнаружение текстовых областей и выделение символов на изображениях с неоднородным фоном.//Праці Одеського політехнічного університету, 2013. Вип. 1(40), с. 55-60.

2. Обнаружение текста на изображениях / Интернет-ресурс. – Режим доступа: http://compscicenter.ru/sites/default/files/materials/2012-11-23_ImageVideoAnalysis_Lecture09.pdf

Не нашли, что искали? Воспользуйтесь поиском по сайту: