Segmentação de Imagem

Segmentação Limiar em Tons de Cinza

Marcello Santos da Fonseca

 

  1. Introdução: Segmentação
  2. A segmentação de imagem consiste em dividir a imagem em regiões que dizem respeito ao mesmo conteúdo e aplicação. Existem objetos de interesse em uma imagem e podemos isolar aqueles pixeis que não fazem parte desses objetos. Um exemplo é a análise da cobertura de nuvens onde desejamos medir a área das nuvens em uma foto de satélite. As nuvens fazem parte das áreas de interesse ou objetos e precisamos identificar aqueles pixeis na imagem que devem pertencer às nuvens. Tradicionalmente a segmentação de imagem tem sido vista como um estágio prévio de processamento para reconhecimento ou análise. Nós segmentamos a imagem e então a processamos. Uma aproximação geral em muitos dos métodos de segmentação é agrupar, de alguma forma, os pixeis com mesma propriedade, isto é, mesma intensidade, cor ou região com textura semelhante. Por exemplo, nós podemos dividir a imagem em regiões de textura correspondente à área de campos ou floresta para medir a extensão de uma região em uma aplicação particular. A segmentação diz mais respeito a análise de imagem do que ao processamento de imagem. Embora não haja uma fronteira clara entre as duas, nós podemos dizer que processamento de imagem trata de imagem que é fornecida como um dado de entrada e resulta em uma saída na forma de imagem. A análise de imagem envolve redução na informação contida na imagem, alguma extração de conhecimento. Retomando o exemplo da análise de imagem de satélite coberta com nuvens, que pode envolver uma simples estratégia como a limiarização da imagem de forma binária, isto é, sua binarização. Em aplicações mais exigente a segmentação é mais difícil. A segmentação parece ser uma operação que, nós enquanto seres humanos, fazemos fácil porque nosso Sistema Visual trabalha de forma paralela e nos parece que nosso reconhecimento dos objetos em uma cena é instantâneo. Nos reconhecemos ou segmentamos os objetos por inteiro quando consideramos a imagem na sua totalidade. Embora em alguns casos podemos também usar a informação de profundidade para auxiliar na segmentação. Nos deduzimos contornos do objeto onde não existe como demonstrado na ilusão de Kanizsa - "Kanizsa Illusion", mostrada na figura 1.

    Figura 1. Ilusão de Kanizsa

    Na segmentação por computador, nós geralmente consideramos um pixel de cada vez e, principalmente, não usamos informação já obtidas de operações prévias nos pixeis em sua vizinhança. Para nós humanos a tarefa de reconhecimento é trivial porque nos não realizamos a tarefa de segmentação de forma independente de nosso conhecimento do cena é, ela sempre considera os objetos familiares. Nos usamos nosso conhecimento ou experiência para decodificar a imagem e é difícil, ou impossível comentar sobre os possíveis processos de baixo nível que podem, ou não fazer parte de um processo maior. Usando fases de operação de segmentação como parte da análise da imagem, um exemplo perfeito da maneira na qual a pesquisa computacional em problemas difíceis se processam. Nós dividimos o problema em fases ou passos, os quais nós sabemos que podemos tratar mais facilmente como, por exemplo, para escrever programas de software, produzir equipamento especial, ou utilizar conhecimento já existente. Esta é a aproximação evolutiva da pesquisa na Ciência da Computação. Neste caso estamos dizendo, de forma sensata, para proceder a análise do problema de alguma imagem o primeiro tópico da imagem para reduzir o nível do pixel através de operação no primeiro passo na hierarquia de operações que gradualmente reduz o volume de informação na imagem e nos ajuda a tomar decisão sobre a estrutura de interesse na imagem. A forma simples de segmentação é a limiarização ou "Thresholding". A Segmentação clássica está dividida em três técnicas. · Global: Segmentação baseada em conhecimento global, relativo à intensidade do pixel. · Baseada na Região: Segmentação baseada na região trata-se do processo de divisão da imagem em regiões que exibem propriedades similares. · Baseada na Borda: Segmentação baseada na região trata-se da técnica usada para detecção de borda para achar o contorno fechado da imagem. Este trabalho visa abordar a segmentação limiar em tons de cinza ou Grey scale thresholding.

  3. Segmentação Limiar em tons de cinza "Grey scale thresholding".
  4. Esta é a mais antigo das técnicas de segmentação, mas ela só é apropriada para uma número de limitado de aplicações. Ela é usada em cenas que o objeto exibe valores de brilho contra um fundo (não desejado) com outros valores diferentes do objeto. Um exemplo deste tipo de imagem é um texto usado para operação de OCR (Optical Character Recognition), ou para sistema de inspeção para controle de qualidade. Podemos fazer operações na imagem para posteriormente contar o número de elementos na imagem, medir sua área ou outra propriedade geométrica das partes, e assim por diante. Decidimos o "threshold" limiar e qualquer pixel com valor superior (ou inferior) ao limiar é suposto pertencer ao objeto; ou o valor inferir (ou superior) limiar é suposto fazer parte do fundo da imagem. O resultado desta operação é a binarização da imagem. Para exemplificar como definir o ponto de limiar ou "threshold" vamos examinar os histogramas mostrados mas figuras 2-(a), 2-(b), 2-(c), e 2-(d).

    Figura 2.a – Imagem original

     

    Figura 2.(b) – Histograma original

     

    Figura 2.(c) – Imagem Limiarizada – threshold 100

     

    Figura 2.(d )– Histograma Limiarizado

     

    Se a imagem é apropriada para este tipo de segmentação, então o histograma deve exibir picos relativos ao grupo de pixeis do objeto e do fundo da imagem em uma estreita faixa de tons de cinza. Isto é, nos dizemos que os objetos produzem agrupamento de tons de cinza. Neste caso o histograma deve ser bimodal e podemos fixar o limiar ao achar o valor entre os dois picos do histograma. Um exemplo de imagem que exibe muitos picos no histograma é mostrado na figuras 3-(a),3-(b),3-(c),3-(d).

    Fig 3-(a) - Imagem Original

     

    Fig 3-(b) - Histograma Original

     

    Fig 3-(c) - Imagem Limiarizada - Threshold 196

     

    Fig 3-(d) - Histograma Limiarizado

    Mas a imagem ter uma distribuição bimodal não implica que esta imagem consista de um objeto contra um fundo. Uma imagem com ruído randômico - pontos pretos e brancos - exibiria um histograma unimodal. Desta forma, está técnica não pode ser usada neste tipo de imagem, bem como na natureza onde as regiões são distinguidas por diferentes texturas. A limiarização em tons de cinza pode segmentar a textura da região em várias partes diferentes, como pode se observado nas figuras 4-(a) e 4-(b).

    Fig 4-(a) Imagem com Ruído Gaussiano

     

    Fig 4-(b) Histograma da Imagem

     

    O processo para determinação do ponto de "Threshold" de um histograma pode ser tanto interativo ou heurístico. Devemos, por exemplo, examinar a curva do histograma a procura de um mínimo significativo. Como alternativa podemos definir o threshold sem o histograma usando a seguinte estratégia.

    1. Assumindo que os pixeis dos quatro cantos da imagem pertencem ao fundo e definindo uma média inicial para a intensidade do fundo e para intensidade do objeto assumindo que todo os pixeis restante pertencem ao objeto.
    2. Iterar usando a definição de threshold até existir uma diferença suficientemente pequena entre

    Ti+1 e Ti.

     

    Ti+1 = (m ifundo + m iobjeto)/2 (1)

    Onde: m ifundo e m iobjeto são calculados após aplicar Ti.

     

    É óbvio que o uso de segmentação por threshold produz erros de classificação, a extensão desse erro depende do próprio histograma exibido da imagem como pode ser visto na figura 5. Ela mostra que um histograma é a soma de dois histogramas de objetos individuais, que exibem intensidade dos pixeis do lado "errado" do threshold. Demonstrado que a seleção de um simples limiar não pode ser correto em tal caso.

    Figura 5.

     

    Uma extensão óbvia para uma estratégia simples de threshold e assumir que podemos usar ainda uma aproximação, mas agora o threshold tem que ser aplicado a sub-regiões da imagem, tomando diferente valores de região em região. Assumindo que temos o fundo de uma cena, nos dividimos a imagem em pequenas regiões e procuramos por um histograma bimodal em cada região, nós precisamos identificar, também, regiões que não exibem bimodularidade e assumirmos que estas são de todo objeto ou de todo fundo. De outra maneira, nos podemos "forçar" a segmentação onde não deve haver, baseada em variações insignificante com ruído.

  5. Método Chow e Kaneko
  6. O método foi proposto por Chow C. K. e Kaneko em 1972 no paper "Automatic boundary detection of left ventricle from cineangiograms, Computer in Biomedical Research"; consiste em dividir a imagem em blocos de 64x64 pixeis sobrepondo regiões e testando a bimodularidade em cada região do histograma tentando fixar um par de curvas Gaussianas ao histograma. Se a região não exibe bimodularidade assumi-se ser todo objeto ou fundo fixado um threshold da região vizinha. A estratégia final envolve alocar o threshold definido no processo prévia em cada contos da imagem . O tratamento matemático do método pode ser visto em "Digital Imagem Processing" autor Rafael G. Gonzales e Richard E. Woods. página 447, item 7.3.4.

  7. Aplicações e Conclusão.
  8. A Segmentação Limiar em Tons de Cinza é a técnica aplicada em diversas área entre elas podemos citar:

    § Área médica

    § Área industrial (controle de qualidade)

    § Área radar e satélite

    Esta técnica é, também, usada quando se deseja imagem binarizadas com pré-processamento para outras aplicações. Podemos dizer que o método de segmentação limiar em tons de cinza é um dos métodos mais velhos e conhecidos. Contudo, tem desvantagens, a técnica é apropriada a um número limitado de aplicações que contém imagens com histograma bimodal.

  9. Bibliografia.