Documentação / OCR e Processamento

Como Criar Templates de Extração

OCR e Processamento

Visão Geral

Templates de extração (chamados de Configurações de Estrutura no painel) definem quais dados a Textualiza deve extrair dos seus documentos. Em vez de receber o texto bruto, você configura os campos que precisa — como nome, CPF, valor do contrato, data de vencimento — e o sistema extrai essas informações automaticamente usando IA.

Quando Usar

  • Você processa documentos recorrentes com estrutura semelhante (contratos, laudos, fichas cadastrais)
  • Precisa extrair campos específicos em vez de texto livre
  • Quer padronizar a saída para integrar com outros sistemas

Usando o Painel

Passo 1: Acessar as Configurações

No menu lateral, vá em Configurações de Estrutura. Você verá a lista de todas as suas configurações, com nome, descrição, quantidade de campos e status (Ativo/Inativo).

Passo 2: Criar Nova Configuração

Clique em “Nova Configuração”. Você terá duas opções:

Opção A: Usar um Template Pronto

Selecione “Usar Template” para começar a partir de um modelo pré-configurado. Você pode:

  • Buscar templates por nome
  • Filtrar por setor: Cartório, Jurídico, RH, Saúde, Finanças, Educação, Governo, Transportes ou Geral
  • Visualizar os campos que cada template extrai antes de escolher
  • Clicar em “Usar este template” para carregar os campos automaticamente

Após carregar o template, você pode personalizar os campos antes de salvar.

Opção B: Criar do Zero

Selecione “Criar do Zero” para montar sua própria configuração.

Passo 3: Preencher as Informações Básicas

CampoDescrição
Nome da ConfiguraçãoUm nome descritivo (ex: “Contrato de Locação”, “Ficha de Paciente”).
DescriçãoOpcional. Explique o propósito do template para facilitar a identificação.

Passo 4: Definir os Campos de Extração

Clique em “Adicionar Campo” para incluir cada dado que deseja extrair. Para cada campo, preencha:

PropriedadeDescriçãoExemplo
Nome do CampoIdentificador único, sem espaços (usado internamente e na exportação)nome_locatario
RótuloNome legível que aparece nos relatóriosNome do Locatário
TipoO tipo de dado esperado (veja a tabela abaixo)CPF

Tipos de Campo Disponíveis

TipoO que ExtraiExemplo de Resultado
TextoTexto livre”João da Silva Pereira”
NúmeroValores numéricos42500
DataDatas”2025-03-15”
Data e HoraDatas com horário”2025-03-15 14:30:00”
PercentualValores percentuais12.5
Valor MonetárioValores em reais1500.00
Sim/NãoValores booleanostrue
EmailEndereços de e-mailjoao@empresa.com
TelefoneNúmeros de telefone”(11) 99999-0000”
URLLinkshttps://exemplo.com
CPFCPF do documento”123.456.789-00”
CNPJCNPJ da empresa”12.345.678/0001-00”
RGRegistro Geral”12.345.678-9”
CEPCódigo postal”01310-100”
Número de ProtocoloProtocolos e registros”2025/001234”
Número de ProcessoProcessos judiciais”0001234-56.2025.8.26.0100”
Conta BancáriaDados bancários completosBanco, agência, conta e tipo
Endereço CompletoEndereço com todos os componentesRua, número, complemento, bairro, cidade, estado e CEP
Lista de ValoresMúltiplos itens do mesmo tipo[“Item 1”, “Item 2”, “Item 3”]
Lista de ObjetosMúltiplos registros com sub-camposLista de partes envolvidas, cada uma com nome, CPF e papel

Campos Especiais

Lista de Valores

Ao selecionar este tipo, você define o tipo dos itens da lista. Por exemplo: uma lista de e-mails, uma lista de datas, etc.

Lista de Objetos

Ao selecionar este tipo, um sub-formulário aparece para você definir os campos de cada item. Ideal para dados repetidos como:

  • Partes envolvidas: cada uma com nome, CPF, papel
  • Itens de um contrato: cada um com descrição, quantidade, valor
  • Imóveis em uma matrícula: cada um com endereço, área, registro

Para cada sub-campo, defina nome, rótulo, tipo e se é obrigatório.

Passo 5: Salvar

Clique em “Salvar Configuração”. O template ficará disponível para uso nos módulos de OCR e Processamento de Textos.

Usando o Template

Após criar, seu template pode ser usado em dois lugares:

  1. Processamento de Textos — ao criar uma nova análise, selecione o tipo “Estrutura Personalizada” e escolha seu template no campo “Configuração de Estrutura”.

  2. Processamento de Imagens (OCR) — ao enviar um documento, marque “Iniciar Processamento de Texto Automaticamente” e selecione seu template no campo “Configuração de Estrutura NLP”.

Gerenciando Templates

Na lista de Configurações de Estrutura, você pode:

  • Visualizar os detalhes e campos de cada template
  • Editar para adicionar, remover ou modificar campos
  • Desativar templates que não está mais usando (ficam com status “Inativo”)
  • Excluir templates que não precisa mais

Exemplo Prático

Template: “Contrato de Locação”

Campos configurados:

Nome do CampoRótuloTipo
locador_nomeNome do LocadorTexto
locador_cpfCPF do LocadorCPF
locatario_nomeNome do LocatárioTexto
locatario_cpfCPF do LocatárioCPF
endereco_imovelEndereço do ImóvelEndereço Completo
valor_aluguelValor do AluguelValor Monetário
data_inicioData de InícioData
data_fimData de TérminoData
garantiaTipo de GarantiaTexto
testemunhasTestemunhasLista de Objetos

Com este template, ao processar qualquer contrato de locação, a Textualiza extrai automaticamente todos esses campos e entrega os dados organizados em Excel ou JSON.

Dicas

  • Comece pelos templates prontos: explore os modelos pré-configurados antes de criar do zero. É mais rápido e você pode personalizar depois.
  • Nomes de campo consistentes: use nomes padronizados (ex: cpf_comprador, nome_vendedor) para facilitar integrações via API.
  • Teste com documentos reais: após criar o template, processe um documento de teste para verificar se os campos estão sendo extraídos corretamente.
  • Reutilize: um bom template serve para dezenas ou centenas de documentos do mesmo tipo.

Experimente a Textualiza gratuitamente

Crie sua conta e ganhe R$50 em créditos para testar todas as funcionalidades.