АДАПТАЦИЯ И ОПИСАНИЕ ИСПОЛЬЗУЕМЫХ АЛГОРИТМОВ

ВВЕДЕНИЕ

Технологии преобразования растровых чертежей, полученных путем оцифровки традиционных источников - бумажных носителей, в настоящий момент являются весьма востребованными. Это связано с развитием систем автоматизированного проектирования, которые способны интерпретировать векторный формат, а также с существенными преимуществами векторной формы по сравнению с растровым представлением: простота манипуляций и управления, необходимость в меньшем объеме памяти. Под векторной формой понимается модель (структура) данных, представляющая собой упорядоченный набор слоев объектов, которые моделируются точками, ломаными, либо многоугольниками, расположенными на плоскости или сфере с заданной системой координат.

Следует добавить, что на текущий момент не существует удовлетворительных моделей представления растрового чертежа, обладающих достаточной степенью соответствия объектной структуре изображения вместе с устойчивостью к таким входным характеристикам как разворот, разрешение, степень зашумленности входного растра.

В данном курсовом проекте необходимо распознать такие обозначения сборочного чертежа как вид и габаритные размеры. Возможность автоматически распознавать информацию на подобных чертежах может быть весьма полезной в случае возникновения необходимости учета этой информации в базе данных.

Данный курсовой проект состоит из 4 разделов:

§ В первом разделе описывается предметная область, существующие программные продукты и их недостатки, существующие методы для подготовки изображения к распознаванию.

§ Во втором разделе описывается цель курсового проекта, какими должны быть входные и выходные параметры, ограничения.

§ В третьем разделе идет описание используемых алгоритмов для подготовки к распознаванию и непосредственно самого распознавания.

§ В четвертом разделе представлена программная реализация используемых алгоритмов.

ОБЗОР ПРЕДМЕТНОЙ ОБЛАСТИ

Задачей распознавания чертежей является либо получение некоторого описания чертежа, поданного на вход системы, либо отнесение этого изображения чертежа к некоторому определенному классу. Процедура распознавания применяется к некоторому изображению чертежа и обеспечивает преобразование его в некоторое абстрактное описание: набор чисел, цепочку символов или граф. Последующая обработка такого описания позволяет отнести исходное изображение к одному из нескольких классов.

Зачастую возникает ряд трудностей и проблем. Обычно они связаны с тем, что входные изображения не совпадают с эталонами за счет помех и неточностей, с тем, что входные изображения и эталоны отличаются расположением в поле зрения, а так же с тем, что изображения предъявляются на сложном фоне.

Перед оцифровкой бумажного носителя применяется обработка, которая включает следующие этапы: сегментация, бинаризация, оконтуривание и центрирование. На следующем рисунке 1.1 представлен один из примеров бумажных носителей.

Рис. 1.1 – Пример бумажного носителя

Методы бинаризации

Бинаризацией называется процесс преобразования полутонового изображения в изображение, яркость пикселей которого может иметь только два значения – 0 или 1. Такое изображение называется бинарным.

В зависимости от вида изображения применяются различные методы бинаризации:

Метод средней яркости (локальный метод):

- Вычисляем среднюю яркость;

- Определяем граничное значение яркости по формуле: ГЗ=255 – СЯ, где ГЗ - граничное значение, СЯ - средняя яркость;

- Пиксель становится черным, если среди его соседей есть хотя бы один пиксель, яркость которого удовлетворяет условию:

Яркость ≤ ГЗ, либо яркость анализируемого пикселя ≤ яркости связного с ним + Step, Step= 1…2.

При этом важно чтобы связующий пиксель был уже включен в группу пикселей, которые будут отмечены как черные.

Метод «Мод»:

Выполняется построение гистограммы яркости. По построенной гистограмме выбирается значение яркости соответствующее впадине или минимуму между двумя максимальными вершинами гистограммы. Недостатком данного метода является зависимость результата от гистограммы.

Метод 120:

- Строится гистограмма;

- Находится максимальный уровень серого в диапазоне t=[0, 120];

- Черный цвет устанавливается у пикселей, яркость которых меньше либо равна порогового значения плюс 12…15, в остальных случаях цвет белый.

Метод 40%:

- Строится гистограмма;

- Находится количество пикселей, соответствующий заданному проценту;

- Отсчитывается количество пикселей по градациям яркости, начиная с 0 и до момента, когда это количество будет превышать количество пикселей, заданных в постановке задачи бинаризации, и градация, на которой произошла постановка становится порогом бинаризации.

Пороговый метод:

Определяется порог яркости t. Все что больше этого порога считается белым, все что меньше — черным.

При переводе в бинарное изображение могут быть потери или наоборот шумы из-за неточности сканера, поэтому после бинаризации может следовать фильтрация.

Для бинаризации изображения, полученного сканированием чертежа, целесообразно было бы использовать пороговый метод.

Способы сегментации

Проблема сегментации зачастую возникает при рассмотрении задачи оптического распознавания текста. Сегментация — это процесс разделения цифрового изображения на несколько сегментов. Цель сегментации заключается в упрощении и/или изменении представления изображения, чтобы его было проще и легче анализировать. Сегментация изображений обычно используется для того, чтобы выделить объекты и границы (линии, кривые, и т. д.) на изображениях.

Результатом сегментации изображения является множество сегментов, которые вместе покрывают всё изображение, или множество контуров, выделенных из изображения. Все пиксели в сегменте похожи по некоторой характеристике или вычисленному свойству, например по цвету, яркости или текстуре. Соседние сегменты значительно отличаются по этой характеристике. Существуют следующие методы сегментации:

Выделение краёв:

Границы и края областей сильно связаны, так как часто существует сильный перепад яркости на границах областей. Поэтому методы выделения краёв используются как основа для другого метода сегментации. Недостаток – обнаруженные края часто бывают разорванными. Но чтобы выделить объект на изображении, нужны замкнутые границы области.

Методы с использованием гистограммы:

Методы с использованием гистограммы очень эффективны, когда сравниваются с другими методами сегментации изображений, потому что они требуют только один проход по пикселям. В этом методе гистограмма вычисляется по всем пикселям изображения и её минимумы и максимумы используются, чтобы найти кластеры на изображении. Цвет или яркость могут использоваться при сравнении. Недостаток этого метода — затруднительный поиск значительных минимумов и максимумов на изображении.

Метод мод:

Метод мод обычно используется при бинаризации полутоновых изображений, однако его принципы можно использовать и при выполнении сегментации. Заключается метод в том, что полученная на предыдущем этапе сегментации гистограмма, имеющая два ярко выраженных пика, может быть разделена на две части, и одни объекты или признаки, которые находятся ближе к одному пику, можно отнести к одному классу, а объекты или признаки, которые находятся ближе ко второму пику, могут быть отнесены к другому классу.

В данном курсовом проекте, учитывая область работы, было бы предпочтительнее использовать метод выделения краев, так как он позволяет избавиться от трудоемких вычислений и быстрее всего сегментировать участки изображения.

Способы распознавания

Распознавание образов - это отнесение исходных данных к определенному классу с помощью выделения существенных признаков, характеризующих эти данные из общей массы несущественных данных. В основе работы программ распознавания текста лежит достаточно серьёзный математический аппарат. И это оправдано сложностью задачи, особенно самого процесса распознавания.

Системы распознавания бывают следующих типов:

- системы распознавания объектов с учителем;

- системы распознавания объектов без обучения.

В системах распознавания без обучения первоначально заданной информации достаточно, чтобы разделить все множество объектов на классы в соответствии с каким-либо набором признаков.

Работу системы с учителем можно разделять на две части: обучение и распознавание. В ходе обучения системы ей предъявляются отдельные объекты с указанием того, к какому классу относится данный объект. Затем происходит распознавание: предъявляется неизвестный объект и система сама должна определить его принадлежность. Это решение принимается на основании решающих правил.

В данном курсовом проекте было рекомендовано использовать систему распознавания без учителя. Для этого был сформирован набор признаков, позволяющий осуществить распознавание цифр и букв на сканированном чертеже.

ПОСТАНОВКА ЗАДАЧИ

Целью курсового проекта является разработка приложения, позволяющего распознать такие обозначения сборочного чертежа как вид и габаритные размеры на сканированном изображении чертежа. Приложение реализовано в среде MS Visual Studio на языке C#.

Входные данные:

- Сканированное изображение чертежа *.bmp

Ограничения:

- Никакого лишнего фона у изображения быть не должно;

- На изображении не должно быть шумов, точек, пикселей и т.п., не имеющих отношения к распознаваемой части;

- Размер изображения 1:1 (3509х2550).

Выходные данные: вид чертежа и габаритные размеры.

При выполнении курсового проекта необходимо решить следующие задачи по обработке изображения:

- Загрузка изображения;

- Сегментация изображения методом выделения краев;

- Бинаризация областей пороговым методом с порогом по умолчанию = 175;

- Выделение контуров (метод «Жук»);

- Центрирование контуров;

- Распознавание обозначений чертежа (буквы и цифры).

На основании этого были построены функциональные схемы приложения, в формате IDEF приведены на рисунках 1 и 2. IDEF схема 3 уровня построена для сегментации изображения методом выделения краев и центрирования контуров.

АДАПТАЦИЯ И ОПИСАНИЕ ИСПОЛЬЗУЕМЫХ АЛГОРИТМОВ

12 3

Не нашли, что искали? Воспользуйтесь поиском по сайту: