Com o uso do OCR (Reconhecimento Óptico de Caracteres) é possível converter imagens em texto, isto somente é possível através do uso de algoritmos de computação automatizados.
Imagens em arquivos nos formatos JPEG, PNG ou GIF que contenham texto ou mesmo documentos no formato PDF, podem facilmente ser convertidos para documentos em formato de texto com o uso do OCR.
Para uso das imagens com texto, podemos obter estas através de:
Com o uso do Google Drive, podemos converter arquivos PDF ou imagens com apenas um click!
No Google Drive, digitalizamos os arquivos PDF ou imagens que você envia e usamos algoritmos de computação para convertê-los em um formato de documento do Google.
Para melhores resultados, os arquivos PDF ou imagens precisam atender a determinados requisitos:
Preservação da formatação do texto
Ao processar seu documento, o algoritmo do Google tenta preservar a formatação básica do texto como negrito e itálico, tamanho e tipo da fonte e quebras de linha. No entanto, detectar esses elementos é difícil e nem sempre é possível. Outros elementos de formatação e estruturação de texto, como listas numeradas e com marcadores, tabelas, colunas de texto e notas de rodapé ou notas finais provavelmente serão perdidos.
Quer saber um pouco mais sobre esta ou outras ferramentas que facilitam o seu dia-a-dia?
Fale conosco e use sempre a sua Saída de Emergência!
Imagens em arquivos nos formatos JPEG, PNG ou GIF que contenham texto ou mesmo documentos no formato PDF, podem facilmente ser convertidos para documentos em formato de texto com o uso do OCR.
Para uso das imagens com texto, podemos obter estas através de:
- Arquivos de imagem digitalizados com scanner de base plana
- Fotos tiradas com câmeras digitais ou telefones celulares
- Arquivos no formato PDF
Com o uso do Google Drive, podemos converter arquivos PDF ou imagens com apenas um click!
No Google Drive, digitalizamos os arquivos PDF ou imagens que você envia e usamos algoritmos de computação para convertê-los em um formato de documento do Google.
Para melhores resultados, os arquivos PDF ou imagens precisam atender a determinados requisitos:
- Resolução: arquivos com resolução alta funcionam melhor. Como regra geral, recomendamos que cada linha de texto nos documentos tenha pelo menos 10 pixels de altura.
- Orientação: são reconhecidos apenas documentos com texto horizontal da esquerda para a direita. Se você por acaso digitalizou ou capturou a imagem de um documento em uma orientação diferente, use um programa de edição de imagens para girá-la antes de enviar para o Google Drive.
- Idiomas, fontes e conjuntos de caracteres: o mecanismo de OCR Google é compatível com uma série de conjuntos de caracteres, mas o suporte para conjuntos de caracteres não latinos ainda é experimental. Você pode selecionar o idioma de seu documento em um menu suspenso. Melhores resultados são obtidos se o arquivo incluir fontes comuns, como Arial ou Times New Roman.
- Qualidade da imagem: imagens nítidas com iluminação balanceada e contrastes claros funcionarão melhor. Movimentos borrados ou falta de foco diminuirão a qualidade do texto detectado.
Preservação da formatação do texto
Ao processar seu documento, o algoritmo do Google tenta preservar a formatação básica do texto como negrito e itálico, tamanho e tipo da fonte e quebras de linha. No entanto, detectar esses elementos é difícil e nem sempre é possível. Outros elementos de formatação e estruturação de texto, como listas numeradas e com marcadores, tabelas, colunas de texto e notas de rodapé ou notas finais provavelmente serão perdidos.
Quer saber um pouco mais sobre esta ou outras ferramentas que facilitam o seu dia-a-dia?
Fale conosco e use sempre a sua Saída de Emergência!
Comments
Post a Comment