Módulo Processamento OCR

Definição

O módulo OCR Processing utiliza inteligência artificial para realizar o reconhecimento óptico de caracteres em arquivos de imagem e PDF. Ele extrai e estrutura os dados do documento, retornando o conteúdo em diferentes formatos, como JSON e Markdown.

circle-exclamation

Adicionar módulo "OCR Processing”

O módulo "OCR Processing" aparece na opção Ferramentas da edição de um fluxo. Após clicar para adicioná-lo, o modal de configuração inicial será exibido.

Preencha ou escolha os seguintes itens para usar o módulo:

  • Arquivo em base64: Insira o conteúdo do arquivo (PDF ou imagem) codificado em formato Base64 previamente cadastrado como variável. Leia também "Variáveis”.

  • Modelo: Selecione o modelo de IA que será utilizado para o processamento do OCR.

  • Tipo de retorno (opcional): Escolha o formato de saída do texto extraído, sendo possível escolher entre JSON (padrão do módulo), Markdown ou Raw Text (texto puro).

  • Prompt: Digite a instrução para orientar a extração dos dados e comportamento da leitura.

  • Tipo de parse (opcional): Define como o sistema deve interpretar os dados extraídos:

    • Auto parsing: A API tenta transformar a resposta em JSON. Quando não é possível, retorna a string original.

    • JSON Schema: Define um schema JSON para estruturar a resposta consistentemente

  • Schema em JSON Schema: Insira a definição do esquema (disponível apenas quando a opção JSON Schema está ativa).

  • Dividir em páginas? (opcional): Ative esta opção para que o processamento trate cada página do documento de forma individual.

  • Manter contexto? (opcional): Se ativado, a IA utilizará informações de páginas anteriores para melhorar a compreensão do conteúdo nas páginas seguintes.

Clique em "Próximo". Você será redirecionado para a tela de teste.

Clique em "Testar" para verificar o módulo.

Para finalizar, basta clicar em "Salvar".

Atualizado

Isto foi útil?