Detecção automática de campos de documentos

Nossos analisadores reconhecem e detectam automaticamente valores de campo exclusivos de documentos carregados de forma inteligente.

Reconhecimento de idioma de documento

Detecte o idioma de documentos digitalizados ou impressos, imagens e arquivos PDF.

Reconhecimento Óptico de Caracteres (OCR)

Converta documentos digitalizados ou impressos, incluindo imagens e arquivos PDF, em texto legível por máquina.

Integração e automação

Nossos analisadores de documentos podem ser integrados em sistemas de software ou processos de trabalho existentes.

API de reconhecimento de idioma de documento

Parse Documents é um conjunto robusto de APIs projetadas para atender a todos os requisitos de análise de documentos. Nosso objetivo é simplificar o complexo processo de gerenciamento de documentos, seja na busca, análise ou tratamento de erros. Isso inclui classificação fácil de páginas, uma ampla variedade de tipos de documentos suportados e relatórios completos de erros.

Versatilidade e flexibilidade

Usando nossas diversas APIs, você pode não apenas ler documentos carregados, mas também enfileirar documentos para análise por upload direto ou link externo. Nossas APIs são projetadas tendo em mente a natureza dinâmica dos negócios, permitindo que acomodem perfeitamente uma variedade de necessidades e configurações de negócios.

Configuração de arrogância

As APIs são codificadas de acordo com a Especificação OpenAPI (OAS), tornando o processo de integração simples e descomplicado. Fornecemos documentação extensa baseada na interface de usuário do Swagger que detalha possíveis respostas e possíveis status e códigos de erro.

Sua segurança é nossa prioridade

Todas as solicitações de API são autenticadas usando cabeçalhos JWT para segurança máxima. Isso garante que os dados confidenciais de seus documentos estarão sempre protegidos.

Vamos começar

Estamos entusiasmados por ter você conosco e mal podemos esperar para ver como você integrará e maximizará os benefícios do Parse Documents em suas operações de gerenciamento de documentos!

Certifique-se de substituir "YourAuthTokenHere" pelo token ao portador real.
Identify Document Languages
POST /v1/documents/languages

A POST method that identifies the languages of the provided document text. This method takes the document text as input and returns the identified languages along with their probabilities.

Example Request
POST /v1/documents/languages
Request Body
{
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}
Responses
  • 200 Success: Returns the identified languages along with their probabilities.
  • 404 Not Found: The requested document is not found.
  • 400 Bad Request: The request was made incorrectly.
Here is the modified HTML template with the .NET example filled and rewritten for other programming languages:
import requests

url = "https://%(baseUrl)s/v1/documents/languages"
headers = {
    "Authorization": "Bearer {YOUR_API_KEY}"
}

payload = {
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}

response = requests.post(url, headers=headers, json=payload)
response.raise_for_status()

identified_languages = response.json()

for lang in identified_languages:
    print(f"Language: {lang['code']} - Probability: {lang['probability']}")
        
package main

import (
    "fmt"
    "net/http"
    "bytes"
    "encoding/json"
)

func main() {
    identifyDocumentLanguages()
}

func identifyDocumentLanguages() {
    url := "https://%(baseUrl)s/v1/documents/languages"
    apiKey := "{YOUR_API_KEY}"

    payload := map[string]interface{}{
        "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit.",
    }

    requestBody, _ := json.Marshal(payload)
    req, _ := http.NewRequest("POST", url, bytes.NewBuffer(requestBody))
    req.Header.Set("Authorization", "Bearer "+apiKey)
    req.Header.Set("Content-Type", "application/json")

    client := &http.Client{}
    response, _ := client.Do(req)

    identifiedLanguages := []map[string]interface{}{}

    json.NewDecoder(response.Body).Decode(&identifiedLanguages)

    for _, lang := range identifiedLanguages {
        fmt.Printf("Language: %v - Probability: %v\n", lang["code"], lang["probability"])
    }
}
        
<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://%(baseUrl)s/v1/documents/languages",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_POST => true,
  CURLOPT_POSTFIELDS => json_encode([
    "text" => "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer {YOUR_API_KEY}",
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$error = curl_error($curl);

curl_close($curl);

if ($error) {
  echo "Error: " . $error;
} else {
  $identifiedLanguages = json_decode($response, true);

  foreach ($identifiedLanguages as $lang) {
    echo "Language: " . $lang['code'] . " - Probability: " . $lang['probability'] . "\n";
  }
}
using System;
using System.Net.Http;
using System.Text;
using System.Text.Json;
using System.Threading.Tasks;

class Program
{
    private static readonly HttpClient client = new HttpClient();
    private static readonly string BASE_URL = "{YOUR_API_BASE_URL}";
    private static readonly string API_KEY = "{YOUR_API_KEY}";

    static void Main(string[] args)
    {
        IdentifyDocumentLanguages().Wait();
    }

    private static async Task IdentifyDocumentLanguages()
    {
        try
        {
            client.DefaultRequestHeaders.Authorization = new System.Net.Http.Headers.AuthenticationHeaderValue("Bearer", API_KEY);

            var requestBody = new
            {
                text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
            };

            var requestContent = new StringContent(JsonSerializer.Serialize(requestBody), Encoding.UTF8, "application/json");

            var response = await client.PostAsync(BASE_URL + "/v1/documents/languages", requestContent);
            response.EnsureSuccessStatusCode();

            var responseBody = await response.Content.ReadAsStringAsync();
            var identifiedLanguages = JsonSerializer.Deserialize<IdentifyLanguage[]>(responseBody);

            foreach (var lang in identifiedLanguages)
            {
                Console.WriteLine($"Language: {lang.code} - Probability: {lang.probability}");
            }
        }
        catch (HttpRequestException e)
        {
            Console.WriteLine($"Error: {e.Message}");
        }
    }
}

In this code, we define a simple program with a single method `IdentifyDocumentLanguages`.

This method first sets up the authentication header by adding the bearer token to the HttpClient's default headers.

Then, it creates the request body containing the document text.

It sends a POST request to the specified endpoint with the request body as JSON.

If the request fails for any reason, an HttpRequestException will be thrown and the method will catch it and print the error message to the console.

If the request is successful, the method will read the response body as an array of `IdentifyLanguage` objects and print the language code and probability for each identified language.

Request Body:

  • text: The document text to identify the languages.

Parse Documents

Transforme seu processo de processamento de documentos com um sistema avançado de extração de dados baseado em IA que ajuda você a tomar decisões mais inteligentes.