РАЗРАБОТКА ПРОГРАММНОГО ФИЛЬТРА ДЛЯ ОПРЕДЛЕЛЕНИЯ ТЕКСТОВЫХ ОБЛАСТЕЙ НА ИЗОБРАЖЕНИЯХ
ОБРАЗЕЦ
Долженкова М.Л., к.т.н., доцент ВятГУ, г. Киров;
Воронин И.В., студент ВятГУ, г. Киров
С каждым днем возрастает объем воспринимаемой и анализируемой человеком текстовой информации. Объявления, вывески, надписи, визитные карточки, номерные знаки транспортных средств - лишь краткий перечень форм представления подобной информации [1]. В этих условиях весьма актуальной является разработка систем автоматического распознавания текста, выполняющих обработку визуальной информации с последующим использованием ее в информационных системах различного назначения.
Базовой процедурой, применяемой на первоначальном этапе обработки в таких системах, является обнаружение текстовых областей на изображении. Возникающие при этом проблемы связаны с наличием помех, размером изображений, форматом надписей и углом обзора.
Кроме того, производительность систем распознавания текстов значительно снижается из-за непредсказуемости входного потока данных и необходимости обработки изображений, не содержащих текст.
Анализ предметной области показал, что существующие в настоящее время системы для определения текстовых областей требуют настройки на распознавание изображений определенного качества, не способны анализировать фотографическое изображение без точного указания текстовой области и отсеивать изображения, не содержащие текст. Кроме того, для анализа изображения большого разрешения затрачивается значительное время.
Таким образом, задача создания фильтра для выделения текстовых областей и отсеивания изображений не содержащих текст является актуальной.
Структура программного фильтра представлена на рис. 1.
Фильтр состоит из двух основных частей: подсистемы, выполняющей поиск текстовой области на изображении и подсистемы сервиса, выбирающей файлы из входного потока и формирующей экспертную оценку количества текста на изображении.
Подсистема поиска включает модуль предварительной обработки данных и модуль кластеризации.
Модуль предварительной обработки выполняет удаление «лишней» информации с изображения и преобразование данных в формат, пригодный для дальнейшей работы фильтра. Основными методы предварительной обработки изображения являются бинаризация и конвертирование изображения в оттенки серого (grayscale). Цель предварительной обработки - радикальное уменьшение количества информации, содержащейся на изображении. При этом исходное изображение, включающее несколько уровней яркости, преобразуется в черно-белое изображение.
|
Рис.1. Структурная схема программного фильтра
|
Модуль кластеризации предназначен для непосредственного определения текстовой области на изображении и реализует ряд методов.
Метод гистограмм позволяет разбить изображение на сегменты, определить интенсивности в каждом сегменте и построить гистограммы для оценки принадлежности области изображения тексту.
Метод SWT (Stroke Width Transform - преобразование по толщине штриха) основан на построении векторов от центра предполагаемой области текста к ее контуру. В итоге получается закрашенная область с очень четко выделенными буквами в двух вариантах: черные буквы на белом фоне и белые буквы на черном фоне. Далее изображения объединяются и проверяются на наличие общих точек. Таким образом, будет обнаружена область, на которой однозначно определены текстовые символы [2].
Метод Fuzzy image processing позволяет разбить изображение на подизображения для всех оттенков серого. На полученных изображениях с помощью четырех- и восьмипиксельной области связности подсчитывается количество разрывов. Далее по размерам найденных объектов определяется принадлежность области к тексту.
Метод особо контрастных пикселей выполняет обработку путем многократного обхода всего изображения и с каждым проходом отделяются самые яркие пиксели (текст) от фона.
Все реализованные в модуле методы построены на комбинированных алгоритмах. Они обеспечивают выделение основных характеристик текста, сегментацию и выявление истинных текстовых блоков и удаление ложных.
Подсистема сервиса состоит из модулей формирования входного потока, формирования экспертных данных, управления, отображения и статистики.
Модуль формирования входного потокаотвечает за определение форматов файлов входного потока.
Модуль формирования экспертных данных по кластеризованным данным формирует экспертную оценку наличия текста в файле.
Модуль управления используется для общей настройки модулей фильтра.
Модуль отображения необходим для представления в графическом виде результатов работы после каждого этапа обработки.
Модуль статистики обеспечивает накопление и хранения результатов обработки.
Модули предварительной обработки данных, кластеризации и формирования экспертных данных могут работать параллельно и обмениваться информацией с модулем базы данных, модулем управления, модулем статистики и модулем формирования входного потока.
Разработанный программный фильтр является универсальным, независящим от особенностей серверного приложения и может использоваться на входе систем, основной целью которых является распознавание текста, находящегося на изображении (фото), с дальнейшей обработкой его интеллектуальными поисковыми системами.
Список использованных источников
1. Николенко А.А., Тьен Т.К. Обнаружение текстовых областей и выделение символов на изображениях с неоднородным фоном.//Праці Одеського політехнічного університету, 2013. Вип. 1(40), с. 55-60.
2. Обнаружение текста на изображениях / Интернет-ресурс. – Режим доступа: http://compscicenter.ru/sites/default/files/materials/2012-11-23_ImageVideoAnalysis_Lecture09.pdf
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|